В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Профессиональный жаргон — это особая смесь из необычных слов, нестандартных ударений, странных сокращений и смешных идиом. Это словесные шифры, которые обычно понимают только свои. Угадать, кто такой «бобик» или «ходуля», невозможно. Как устроены птичьи языки разных профессий и чем они отличаются от стандартного литературного языка?
...Профессиональный жаргон — это особая смесь...
...Язык как средство социальной идентификации Язык, как...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Чтение — одно из самых популярных хобби. Однако доля людей, читающих для удовольствия, неуклонно снижается — об этом говорят данные из США. Исследователи из Университетского колледжа Лондона и Университета штата Флориды (США) решили оценить, насколько серьезен этот спад. Они взяли данные из Американского обзора использования времени (American Time Use Survey), который ежегодно проводится Бюро переписи населения США и Бюро статистики труда.
...Чтение — одно из самых популярных хобби...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
6 июня в России и за ее пределами отмечается День русского языка. Он приурочен ко дню рождения Александра Сергеевича Пушкина — именно его произведения, по общему признанию, заложили основу современного русского литературного языка. В этот день мы поздравляем пользователей, экспертов, друзей и партнеров Грамоты с нашим общим праздником! Русскому языку можно пожелать только активного и творческого долголетия. А всем, кто говорит по-русски ...
...6 июня в России и за ее пределами отмечается...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
В 2023 году 13,4% европейцев покупали печатные книги в интернете. Тех же, кто заказывал электронные издания, оказалось почти в два раза меньше (7,2%). Доля последних растет, но незначительно (в 2022 году таких было 6,6%). Такие данные приводит статистическая служба Европейского Союза — Евростат. Только в Дании и Финляндии покупки электронных книг явно преобладали. Стоит учесть, что исследователи оценивали онлайн-заказы и не учитывали покупки ...
...В 2023 году 13,4% европейцев покупали печатные...
Русское ударение — сложнейшая система, которая ставит в тупик иностранцев. Вот что о ней говорит сам Александр Пиперски, лауреат премии «Просветитель»: «Если вы говорите красиве́е, вас обвинят в необразованности. Если вы говорите осу́жденный, вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря рука́, ру́ку и за́ руку, вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а ...
...Русское ударение — сложнейшая система, которая...