Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Насколько хорошо россияне помнят героев произведений русской литературы и обстоятельства жизни их авторов? Всероссийский центр изучения общественного мнения (ВЦИОМ) представил результаты телефонного опроса и предложил их интерпретацию. Участники исследования отвечали на четыре вопроса в пределах школьной программы. Все вопросы были открытыми, в формате «устного экзамена», так что угадать правильный ответ было нельзя. Часть вопросов содержала ...
...Насколько хорошо россияне помнят героев произведений...
Для эффективной коммуникации важно уметь распознавать тонкие нюансы смысла, выраженные словами. Как выясняется, у мозга есть алгоритм для случаев, когда смысл сообщения неочевиден. Это выяснила международная команда с участием специалистов в области нейронаук из НИУ ВШЭ. Исследователи смоделировали эксперимент, в котором участникам нужно было определить, что имеет в виду говорящий. На экране появлялись четыре характеристики и три монстра —
...Для эффективной коммуникации важно уметь распознавать...
Участников опроса просили оценить свой уровень владения русским языком, спрашивали о том, на кого должна ориентироваться языковая норма (на мнение специалистов или на то, как говорит большинство жителей страны), как они относятся к изменениям правил. Среди опрошенных авторы выделили представителей шести поколений: поколение «оттепели» (до 1947), поколение «застоя» (1948–1967), реформенное поколение (1968–1981), старшие миллениалы (1982–
...Участников опроса просили оценить свой уровень...
37% участников опроса Фонда «Общественное мнение» (ФОМ) согласны с тем, что иностранные языки преподаются в большинстве общеобразовательных школ скорее плохо. У 35% нареканий нет, еще 28% затруднились с ответом. Опрос показал, что три четверти россиян (76%) не считают владение иностранными языками необходимым навыком. Больше всего разделяющих эту мысль среди опрошенных старше 60 лет (87%), а меньше всего — среди молодежи до
...37% участников опроса Фонда «Общественное мнение...
Научный консультант Грамоты Владимир Пахомов и журналист Александр Садиков обсудили в девятом сезоне феминитивы, написание «Беларусь», будущее словарей в цифровую эпоху, сохранение языков народов России, а также возможные изменения в русской орфографии и пунктуации.
...Научный консультант Грамоты Владимир Пахомов и ...
...1. Есть ли будущее у русского языка? На русском...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...