В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
11 февраля Госдума приняла в первом чтении законопроект «О внесении изменений в Федеральный закон “О государственном языке Российской Федерации” и отдельные законодательные акты Российской Федерации». Он вносит в законодательные акты поправки, касающиеся использования русского языка как государственного. Содержательно эти поправки можно обобщить следующим образом. Во-первых, постулируется, что «объединяющая роль в историческом сознании ...
...11 февраля Госдума приняла в первом чтении законопроект...
13 ноября 2024 года Французская академия обнародовала девятое издание своего «Словаря». Предыдущая версия вышла еще в 1935 году, а работа над нынешним изданием заняла около сорока лет. Академия — самая авторитетная научная институция Франции, занятая изучением французского языка и литературы, а также установлением языковых норм. В новое издание добавлена 21 тысяча слов, среди которых термины из науки, техники и
...13 ноября 2024 года Французская академия...
Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
Правительству и президентскому Совету по поддержке русского языка и языков народов России поручено разработать комплекс учебных материалов по русскому языку, литературе и литературному чтению для начальной, средней и старшей школы. Помимо учебников, в него войдут учебные пособия, в частности, учебные словари русского языка. Сообщение о перечне поручений по итогам заседания Совета 5 ноября 2024 года появилось на сайте Кремля. Линейку разработают с привлечением ведущих университетов ...
...Правительству и президентскому Совету по поддержке...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
16–17 октября в Таврическом дворце Санкт-Петербурга состоялась конференция «Русский язык — основа интеграционного диалога в регионе СНГ». Мероприятие, организованное Межпарламентской Ассамблеей СНГ (МПА СНГ) и Советом Федерации, собрало более 700 участников из 18 стран, включая все государства Содружества. На конференции было представлено около 200 докладов, охватывающих роль русского языка в образовании, праве, искусстве, цифровых технологиях и
...16–17 октября в Таврическом дворце Санкт-Петербурга...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
Законопроект о защите русского языка и об ограничении использования иностранных слов группа депутатов внесла еще в 2023 году, и сейчас он практически готов к первому чтению. О ходе работы над ним со слов депутатов и чиновников рассказывает «Парламентская газета». Авторы инициативы не намерены ограничивать повседневную речь граждан, заверил первый зампред Комитета Госдумы по культуре Александр Шолохов. Новые нормы коснутся прежде всего сферы публичного ...
...Законопроект о защите русского языка и об ограничении...