Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Новый перевод классической книги сделан с издания 2007 года и поэтому отражает более актуальные научные данные по сравнению с изданием 1994 года. Научный соредактор книги Валерий Шульгинов, социолингвист, автор телеграм-канала «Лингвоед», рассказал по просьбе Грамоты о том, чем взгляд Пинкера на язык может быть интересен сегодняшним читателям.
...Новый перевод классической книги сделан с ...
...«Язык как инстинкт» Стивена Пинкера, одна...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...В статье анализируется группа слов, описывающих личные...
Совсем скоро выпускники будут сдавать ЕГЭ по русскому языку. Показывают ли результаты этого экзамена уровень знания предмета? Каких умений не хватает филологам-первокурсникам? Можно ли в школе научить не только грамотно писать, но и убедительно говорить? Об этом мы поговорили с экспертом Грамоты, кандидатом филологических наук, доцентом МПГУ Станиславом Викторовичем Ивановым.
...Совсем скоро выпускники будут сдавать ЕГЭ по русскому...
...Грамота: К вам приходят учиться люди, которые...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Чем точнее выбрано слово, тем ярче впечатление, которое оно производит, и тем выше вероятность, что меткое словцо превратится в крылатое выражение и начнет «порхать из уст в уста». Кандидат филологических наук Дарья Зарубина рассказывает в журнале «Наука и жизнь» истории о происхождении и употреблении нескольких полузабытых русских слов.
...Чем точнее выбрано слово, тем ярче впечатление, которое...
...Ну и ушлый вы народ — Ажно оторопь берет! Всяк...
На «Меле» разбирают семь случаев, когда проверочные слова нас подводят.
...На «Меле» разбирают семь случаев,...
...Почему мы пишем «экстремальный», когда...
Нас с детства приучают, что грамотный человек не должен употреблять слова-паразиты. Они не несут смысловой нагрузки, раздражают слушающих и отвлекают внимание от сути высказывания. Тогда откуда они берутся, почему мы их произносим и какие слова рискуют стать паразитами? Лингвисты тут могут нас удивить.
...Нас с детства приучают, что грамотный человек не должен...
...Почему «паразиты»? Можно представить себе...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...