Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
«Наука и жизнь» публикует мнение филолога Александры Суперанской о том, какие трудности возникают из-за массового изменения названий улиц и целых городов.
...«Наука и жизнь» публикует мнение филолога...
...Желание убрать повторяющиеся названия улиц (например...
Филолог Наталья Еськова, критикуя статью писателя-фантаста, рассказывает про словарь русского языка АН СССР и свой указатель к нему.
...Филолог Наталья Еськова, критикуя статью писателя-фантаста...
...Писатель Сергей Логинов привел в статье «Пышка...
10 апреля на сайте «Тотального диктанта» открылась регистрация участников акции. При регистрации нужно выбрать город (и площадку, на которой проводится акция) или онлайн-участие. Например, чтобы увидеть список площадок в Москве, нужно перейти в раздел «Площадки». Их расположение также можно посмотреть на карте. Рядом с названиями площадок указаны их особенности (есть инклюзивные — для участников с ограничениями по зрению ...
...10 апреля на сайте «Тотального диктанта...
В этот раз из всех вопросов, на которые справочная служба Грамоты ответила в мае, мы выбрали три очень разных. Один вопрос затрагивает новые, неоднозначно воспринимаемые явления в разговорной речи. Чтобы ответить на другой, наши консультанты глубоко погрузились в морфологические тонкости. А еще один вопрос нам задают очень часто (а подобные ошибки мы видим еще чаще), так что у него есть шанс попасть в число горячих.
...В этот раз из всех вопросов, на которые справочная...
...Орфография Вопрос: В слове молоденький суффикс...
Перед Новым годом всех традиционно интересуют темы, связанные с этим праздником. Справочная служба уже неоднократно разрешала сомнения пользователей по поводу прописных букв и речевых формул, в чем можно убедиться, поискав словосочетание «новый год». Но зимние вопросы не иссякают: нас спрашивали о названиях в китайском зодиаке, о происхождении слов «леденец» и «сосулька» и о том, как точнее описать процесс изготовления имбирного печенья.
...Перед Новым годом всех традиционно интересуют темы,...
...Прописная или строчная Вопрос: Если к Деду Морозу...
В языках, на которых говорят в промышленно развитых странах, обычно есть около дюжины основных терминов для обозначения цвета, тогда как в языках, на которых говорят более изолированные группы, их часто меньше (вернее, они распределены неравномерно: некоторые части цветового спектра могут почти не иметь соответствующих слов). Это связано с тем, что в жизни людей из этих групп просто нет объектов и ситуаций, которые требуют использования таких слов. Однако владение вторым языком может повлиять на ...
...В языках, на которых говорят в промышленно развитых...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...