Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.
...Русская топонимика может показаться запутанной и нелогичной...
...Раздельное написание топонимов Географические названия...
В последние десятилетия многие страны (особенно Германия, Австрия, Франция) и крупные корпорации (Google, Microsoft) внедрили внутренние регламенты по использованию гендерно инклюзивного языка, полагая, что «видимость» женщин в языке автоматически приведет к их «видимости» и активности в бизнесе. В последние годы появляется все больше исследований, которые проверяют, насколько оправдались эти ожидания. Недавно ученые из
...В последние десятилетия многие страны (особенно...
13 ноября 2024 года Французская академия обнародовала девятое издание своего «Словаря». Предыдущая версия вышла еще в 1935 году, а работа над нынешним изданием заняла около сорока лет. Академия — самая авторитетная научная институция Франции, занятая изучением французского языка и литературы, а также установлением языковых норм. В новое издание добавлена 21 тысяча слов, среди которых термины из науки, техники и
...13 ноября 2024 года Французская академия...
Сбер представил свежее обновление своего ГигаЧата — мультимодального чат-бота на основе искусственного интеллекта. Теперь он адаптирован для общения на татарском, башкирском, чувашском, якутском, осетинском, чеченском и других национальных языках России и стран СНГ. Общее же число поддерживаемых языков достигло сорока. Система автоматически распознает язык запроса, используя современные алгоритмы машинного обучения и обработки естественного языка. Это ...
...Сбер представил свежее обновление своего ГигаЧата ...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Многие слышали о том, что у северных народов есть десятки слов для обозначения снега. Но из чего складывается такая пестрая картина? В новом исследовании лингвиста Егора Николаева из Института гуманитарных исследований СО РАН (Якутск) подробно описывается, как устроена «снежная» лексика якутского языка. Оказывается, названия снега могут быть связаны не только с его физическими свойствами (например, влажностью), но и с повадками ...
...Многие слышали о том, что у северных народов...
Рукопись была случайно обнаружена в 2019 году в библиотеке Кембриджского университета — из нее сделали обложку хозяйственного реестра. Страницы были сложены, порваны и вшиты в переплет, так что традиционные методы реставрации могли бы нанести документу непоправимый ущерб. Команда исследователей из университетской Лаборатории визуализации культурного наследия (CHIL) использовала комплексную технику цифровой реставрации, чтобы не только восстановить текст, но и пролить свет на историю ...
...Рукопись была случайно обнаружена в 2019 году...
Еще в середине XIX века русская орфография напоминала не городской ландшафт с асфальтированными дорогами, знаками и светофорами, а скорее сельскую местность, где тропинки проложены не по плану, а кому как удобно. Путь к единообразию занял многие десятилетия; важный шаг в этом направлении был сделан благодаря Якову Карловичу Гроту (1812–1893).
...Еще в середине XIX века русская орфография напоминала...
...Лицеист, преподаватель, академик Будучи выходцем из...
Один из способов пополнения словарного запаса языка — эпонимия. «Эпоним» буквально переводится с греческого как «дающий имя», и когда-то это слово обозначало мифическое или историческое лицо, в честь которого назвали страну, город или народ. Какими путями возникали эпонимы в русском и других языках и в каких группах имен встречается особенно много эпонимов? Рассказывает лингвист и переводчик Мария Елифёрова.
...Один из способов пополнения словарного запаса языка...
...В этом смысле принято говорить, что Александр Македонский...