Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Почему в старых изданиях (1960–1970-х годов) «С Новым годом» писали с маленькой буквы «н» — «С новым годом»? Ответ дает публикация в журнале «Наука и жизнь».
...Почему в старых изданиях (1960–1970-х годов)...
...Имена собственные, в том числе официальные названия...
Кандидат филологических наук Борис Иомдин рассказывает о толковых словарях русского языка, о том, какую информацию можно узнать из хорошего толкового словаря, бумажного или электронного. Речь пойдет не только о новых словах, но и о тех словах, которые, казалось бы, все и так отлично знают.
...Кандидат филологических наук Борис Иомдин рассказывает...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Если повторить одно и то же слово много раз, в какой-то момент оно покажется бессмысленным набором звуков. Многие проверяли на себе это забавное явление хотя бы раз в жизни. Но, как выяснилось, им интересуются и исследователи. Авторы статьи, опубликованной в журнале Memory, провели эксперимент с целью понять, легко ли вызвать это ощущение целенаправленно. В ходе эксперимента 94 студента должны были много раз подряд записывать одно и то же слово. Они проделывали это с 12 словами (например, со ...
...Если повторить одно и то же слово много раз, в какой-то...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
В этот раз из всех вопросов, на которые справочная служба Грамоты ответила в мае, мы выбрали три очень разных. Один вопрос затрагивает новые, неоднозначно воспринимаемые явления в разговорной речи. Чтобы ответить на другой, наши консультанты глубоко погрузились в морфологические тонкости. А еще один вопрос нам задают очень часто (а подобные ошибки мы видим еще чаще), так что у него есть шанс попасть в число горячих.
...В этот раз из всех вопросов, на которые справочная...
...Орфография Вопрос: В слове молоденький суффикс...
Круглый стол, организованный Федеральным институтом родных языков народов РФ, прошел 4 апреля в ЦВК «Экспоцентр» и на онлайн-платформе «ММСО.Коннект». В нем участвовала Мария Лебедева — заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина, а также руководитель образовательного направления Грамоты. Она рассказала о преимуществах билингвизма и о том, как можно ...
...Круглый стол, организованный Федеральным институтом...
Школьники не могут освоить правописание из-за скудного словарного запаса, а сами учителя иногда перенимают сленг учеников. Таковы результаты опроса участников олимпиады «Хранители русского языка». Правописание считают самым сложным разделом для изучения в школе 40% опрошенных учителей русского языка. На втором месте пунктуация (24%), а на третьем — культура речи и стилистика (23%). Распространенные причины проблем с русским языком — бедный словарный запас и ...
...Школьники не могут освоить правописание из-за скудного...