В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
Рабочая группа, в которую вошли сотрудники Института узбекского языка, литературы и фольклора Академии наук Узбекистана, составила список из 30 новых терминов, призванных заменить популярные слова, заимствованные из других языков. Об этом сообщает издание «Газета.uz» со ссылкой на Академию наук. Представители рабочей группы также призвали жителей страны участвовать в дискуссии о заимствованиях и предлагать свои варианты. В список нежелательных заимствований попали ...
...Рабочая группа, в которую вошли сотрудники Института...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
Могут ли слова, лишенные явного смысла, вызывать интерес сами по себе? В случае коммерческих названий, как выяснила международная команда специалистов, это возможно. Для начала они решили узнать, как названия влияют на успех кампаний на платформе Kickstarter. Любой желающий может представить свой проект на этой платформе и объявить сбор пожертвований на его реализацию. Авторы изучили 6487 проектов, сопоставив их названия с данными о собранном ...
...Могут ли слова, лишенные явного смысла, вызывать...
Известный факт: количество названий цветов и оттенков цвета в разных языках отличается. Эти различия в языке, как выясняется, влияют и на наше зрительное восприятие цвета. Совместное исследование Норвежского университета естественных и технических наук и Университета Осло показало, что люди, говорящие на языках с несколькими словами для обозначения оттенков, воспринимают их быстрее. Например, носители русского языка, в котором есть слова голубой и
...Известный факт: количество названий цветов и оттенков...
Международная игра-конкурс «Русский медвежонок — языкознание для всех» проводится ежегодно для учеников 1–11-х классов. Задачи конкурса помогают увлечь детей языком, побуждают их после игры заглядывать в учебники, словари, справочники и энциклопедии, помогают в работе учителям. В 2024 году игра состоится 14 ноября. Предварительного отбора нет, участвовать могут все желающие. Конкурс проходит в пяти возрастных группах: 2–
...Международная игра-конкурс «Русский медвежонок...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
Как отличается язык Москвы и Санкт-Петербурга? Может ли русский язык разделиться? Как заимствованные слова влияют на язык — обогащают или «засоряют»? Почему некоторые слова не могут прижиться в языке? Все это и многое другое кандидат филологических наук Борис Иомдин, автор телеграм-канала «Узнал новое слово», обсудил с ведущим канала «Основа» Борисом Веденским.
...Как отличается язык Москвы и Санкт-Петербурга?...
...Язык — это не только слова, но и грамматика...