Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Законопроект был внесен на рассмотрение парламента в январе 2024 года. 9 апреля его приняли во втором и третьем чтениях. Новый федеральный закон вносит дополнения в закон «О государственном языке РФ», а именно дополняет его статьей 4, регламентирующей работу новой государственной информационной системы «Национальный словарный фонд». В ней будут представлены данные о современных и исторических нормах русского ...
...Законопроект был внесен на рассмотрение парламента...
Недавно группа депутатов Госдумы внесла законопроект, согласно которому вывески, тексты в рекламе, названия товаров, районов и жилых комплексов должны быть написаны на русском языке. Исследовательский центр рекрутингового портала Superjob.ru провел опрос, чтобы узнать, поддерживают ли граждане такую инициативу. 53% участников опроса поддержали идею законопроекта. Они приводили следующие аргументы: «Надо беречь русский язык»; «В нашей стране должно быть все понятно для ...
...Недавно группа депутатов Госдумы внесла законопроект...
Исследователи из США и Испании изучили, как собаки используют для коммуникации с людьми звуковые панели, популярные у владельцев домашних питомцев. Они пришли к выводу, что собаки осознанно использовали кнопки (такие как «играть», «гулять» или «помоги») и даже составляли неслучайные комбинации из разных слов. В работе использовались данные, полученные от владельцев 152 собак. Все случаи, когда собаки или их хозяева нажимали ...
...Исследователи из США и Испании изучили, как собаки...
За прошедшие два десятилетия НКРЯ стал незаменимым инструментом для лингвистов, преподавателей, студентов и всех, кто интересуется русским языком. Усилия команды специалистов в области языка, а также разработчиков цифровой платформы НКРЯ позволили собрать обширную базу данных, отражающую богатство и разнообразие русского языка. На сайте корпуса постоянно публикуется информация о пополнении старых частей корпуса, о создании новых корпусов внутри НКРЯ и о
...За прошедшие два десятилетия НКРЯ стал незаменимым...
Этнонимы, или имена народов, порой имеют загадочную и даже причудливую историю. Но тем они и интересны. Описать все возможные варианты появления этнонимов едва ли под силу даже специалистам. Мы ограничимся самыми распространенными.
...Этнонимы, или имена народов, порой имеют загадочную...
...Свои, чужие и просто люди Как вообще у народа...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
...Родству языков посвящена такая область лингвистики,...
...Жизнь и карьера Морриса Сводеша Моррис Сводеш...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...