Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...В статье анализируется группа слов, описывающих личные...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Помните, как в сказке царь приказал девице явиться к нему ни одетой, ни раздетой? Девушка выполнила условие: она завернулась в рыболовную сеть. Сегодня слово «сеть» обрело еще одно значение, связанное с компьютеризацией и новыми компьютерными технологиями. Но обо всем по порядку.
...Помните, как в сказке царь приказал девице явиться...
...Давайте вспомним, как вообще появились на свете слова...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
Как устроены нейросети, как разработчики их обучают и «прививают» им этические нормы, превосходит ли искусственный интеллект человеческий — на эти и другие вопросы ведущего программы «Основа» Бориса Веденского ответил специалист по ИИ и компьютерной лингвистике, доцент МИЭМ им. А. Н. Тихонова НИУ ВШЭ Эдуард Клышинский.
...Как устроены нейросети, как разработчики их обучают...
...Нейросети обрабатывают информацию в числовом формате...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Грамота: Какие проблемы должна решать лингвистическая...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...«Ремингтон» и скорописец Английский инженер...