Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Из всех вопросов, на которые справочная служба Грамоты ответила в апреле, мы выбрали три, которые многим могут быть интересны. В них пользователи спрашивают про отдельные слова и формы, но, по сути, затрагивают более широкие проблемы: склонение существительных, омонимию падежей и орфографическое освоение иностранных заимствований.
...Из всех вопросов, на которые справочная служба Грамоты...
...Грамматика Вопрос: Скажите, пожалуйста, слова робот...
Ольга Евгеньевна Кармакова, учитель русского языка лицея № 1525 города Москвы, старший научный сотрудник отдела диалектологии Института русского языка им. В. В. Виноградова РАН, кандидат филологических наук, член Орфографической комиссии РАН, ответила на вопросы нашего корреспондента Марины Шевцовой.
...Ольга Евгеньевна Кармакова, учитель русского языка...
...Грамота: Как, на ваш взгляд, сейчас русский человек...
Предлагаем вашему вниманию статью Романа Робертовича Гельгардта, опубликованную в журнале «Русский язык в школе» (№ 3, 1968). Что мешает читателю текста в точности понять смысл, заложенный автором? Что имел в виду Пушкин в строке «Вина кометы брызнул ток» и почему при чтении стихов Брюсова читатель может вспомнить химическую формулу HDO?
...Предлагаем вашему вниманию статью Романа Робертовича...
...Предисловие «Грамоты.ру» Роман Робертович...
Русское правописание за десять с лишним веков менялось много раз, но, говоря о реформе орфографии, мы всегда имеем в виду реформу 1917 года. При этом внесенные в правописание изменения обсуждались русскими лингвистами задолго до самой реформы.
...Русское правописание за десять с лишним веков менялось...
...Первые перемены Рефлексия на тему орфографии у наших...
Приближается экзамен по русскому языку, и многие выпускники хотят сейчас повторить самое важное и сложное. Грамота решила им помочь и добавила в Метасловарь специальные цветные плашки «ЕГЭ». Так мы отметили те слова, которые включены в орфоэпический словник ЕГЭ: ударение в них может вызвать трудности, но на экзамене нужно обязательно знать, как правильно.
...Приближается экзамен по русскому языку, и многие...
...Когда дело касается произносительных норм, Метасловарь...
Красота русского языка воспета Ломоносовым и Тургеневым. Однако доктор филологических наук Игорь Милославский в статье для журнала «Наука и жизнь» критически рассматривает представление о богатстве русского языка. Главным его аргументом становится слишком медленное изменение литературного языка и, как следствие, нехватка в нем необходимых понятийных средств.
...Красота русского языка воспета Ломоносовым и Тургеневым...
...Носители языка часто имеют неправильное представление...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В справочную службу Грамоты пишет недоумевающий пользователь: «...Меня резко поправили, когда я спросила „кто последний“ (в очереди), сказали, что в русском языке так говорить не принято, а нужно „кто крайний“». На самом деле все как раз наоборот. Неправильно спрашивать в очереди «кто крайний» и не стоит, предлагая гостю сесть, говорить «присаживайтесь» (грамотно «садитесь»).
...В справочную службу Грамоты пишет недоумевающий...
...Мы не случайно объединили два этих мифа в один...