Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Если повторить одно и то же слово много раз, в какой-то момент оно покажется бессмысленным набором звуков. Многие проверяли на себе это забавное явление хотя бы раз в жизни. Но, как выяснилось, им интересуются и исследователи. Авторы статьи, опубликованной в журнале Memory, провели эксперимент с целью понять, легко ли вызвать это ощущение целенаправленно. В ходе эксперимента 94 студента должны были много раз подряд записывать одно и то же слово. Они проделывали это с 12 словами (например, со ...
...Если повторить одно и то же слово много раз, в какой-то...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Специалисты из Нью-Йоркского университета создали модель машинного обучения (нейросеть), которая анализирует электрическую активность коры головного мозга, связанную с речью, и воспроизводит задуманные человеком слова. Для обучения модели исследователи обратились к группе из пяти пациентов с диагностированной рефрактерной эпилепсией и нарушениями развития речи. В этом состоянии пациент не реагирует на лечение противоэпилептическими препаратами в адекватных дозах и комбинациях, то есть не ...
...Специалисты из Нью-Йоркского университета создали ...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Предлагаем вашему вниманию интервью с известным психологом и журналистом, преподавателем факультета журналистики МГУ Владимиром Владимировичем Шахиджаняном.
...Предлагаем вашему вниманию интервью с известным психологом...
...Грамота: Владимир Владимирович, обычно Грамота отвечает...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Статья научного консультанта Грамоты Владимира Пахомова в журнале «Неофилология» рассказывает о жизненном пути, научном и просветительском наследии Михаила Панова — лингвиста, педагога, популяризатора науки, в 1960-е годы — заместителя председателя Орфографической комиссии.
...Статья научного консультанта Грамоты Владимира Пахомова...
...Реформа русской орфографии, которая готовилась в ...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....