Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Новый словарь ударений объемом около 30 тыс. слов создается в Институте русского языка им. В. В. Виноградова РАН под редакцией докторов филологических наук Марии Каленчук и Дмитрия Савинова. Ожидается, что он выйдет в конце 2024 года в издательстве «Грамота». Как пояснила «Парламентской газете» Мария Каленчук, для появления словаря есть как минимум четыре причины. Первая связана с изменением звукового строя ...
...В 2024 году в России появится первый «Большой словарь...
...Новый словарь ударений объемом около 30 тыс. слов...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Языковые модели оказались хорошими помощниками в написании...
...Любимые всеми книги и фильмы часто рассказывают...
Подавляющее большинство (96%) женщин, участвовавших в опросе книжного сервиса «Литрес» и платформы для знакомств Mamba, считают привлекательной грамотную речь. Среди участников-мужчин это мнение разделяют 76%. Результаты опроса публикует ТАСС. 63% женщин и 53% мужчин называют уровень грамотности решающим фактором для выбора партнера. Только для 3% женщин этот момент оказался незначимым (среди мужчин таких 23%). Как можно объяснить разницу между мужчинами ...
...Российские женщины придают большое значение грамотности...
...Подавляющее большинство (96%) женщин, участвовавших...
Эвфемизмы — так лингвисты называют слова и выражения, которыми мы заменяем другие слова, способные обидеть собеседника или поставить нас самих в неловкое положение. В каких случаях такая замена необходима, а когда лучше обойтись без нее? Какие эвфемизмы были распространены раньше, а к каким мы прибегаем сейчас? Как образуются эвфемизмы и как их правильно использовать, чтобы сказать все, что хочется, и при этом никого не обидеть? Рассказывает Левон Николаевич Саакян, кандидат филологических ...
...Как сказать то, что думаешь, и не обидеть?...
...Эвфемизмы — так лингвисты называют слова и выражения...
Что нужно знать родителям школьника, у которого проснулся интерес к устройству языка? Какие есть возможности проверить себя и узнать больше о лингвистической науке? Анастасия Пучкова и Алексей Старченко — тренеры и руководители команды, которая представляет Россию на Международной олимпиаде по лингвистике. Они рассказали Грамоте о том, как выбрать олимпиаду, увеличить шансы на победу и получить дополнительные баллы при поступлении.
...Что нужно знать родителям школьника, у которого...
...Как победить на олимпиаде по лингвистике...
...Мама, я хочу стать лингвистом! Интерес к лингвистике...
Наверняка многие задумывались: «Почему изба — она, дом — он, а здание — оно?» Не все могут четко объяснить, в чем разница между родом и полом, говоря: «Это слово мужского пола». Лингвисты признаю́т, что род — одна из самых загадочных и нелогичных грамматических категорий. Что думает о ней наука и какие проблемы эта категория создает на практике?
...Наверняка многие задумывались: «Почему изба ...
...Категория рода в русской грамматике в сравнении с другими...
...Как появился род На первый взгляд грамматический род...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Роспатент выдал свидетельство о регистрации Национального...
...Об этом 15 сентября сообщил главный разработчик системы...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Исследователи расшифровали древнюю надпись с помощью...
...Во время извержения Везувия в 79 году н. э. сотни свитков...