Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
Портал In Science рассказал о базе данных, которую создала международная группа ученых. В этой базе задокументировано грамматическое разнообразие сотен языков мира.
...Портал In Science рассказал о базе данных, которую...
...Общество научных исследований имени Макса Планка (Германия...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Заведующий сектором иранских языков Института языкознания РАН, доцент кафедры теоретической и прикладной лингвистики филологического факультета МГУ Олег Беляев и осетинский музыкант Влад Хох обсудили место осетинского языка среди других языков Кавказа, статус дигорского диалекта и результаты полевых лингвистических исследований этого региона. 5 ноября 2024 года за многолетнюю плодотворную научную деятельность Олег Беляев был награжден почетной грамотой Республики Северная Осетия — Алания.
...Заведующий сектором иранских языков Института языкознания...
...На Кавказе есть три эндогенные (то есть встречающиеся...
Филолог Лев Скворцов пишет в журнале «Вопросы языкознания» о личности профессора Сергея Ивановича Ожегова. Публикация приурочена к столетию со дня рождения ученого.
...Филолог Лев Скворцов пишет в журнале «Вопросы...
...Ожегов известен нам прежде всего как автор однотомного...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...