Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2024 году Грамота предложила филологам оценить одиннадцать слов, которые удовлетворяли нашим критериям и поэтому вошли в шорт-лист «слов года». Вот эти слова: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилет, пов, сап, скуф и нормис. Мы попробуем показать, чем интересны эти слова, а заодно ответим на самые распространенные вопросы: почему тут есть слова, которых никто не знает, почему тут есть слова, которые все давно знают, и, наконец, почему в этом списке сплошные заимствования?
...В 2024 году Грамота предложила филологам оценить...
...Неожиданный список Новые и старые Начнем, пожалуй...
Ясный язык — это специальная упрощенная форма языка, для каждого языка — своя. В ней нет сложных и длинных конструкций, а слова сопровождаются простыми и наглядными картинками-пиктограммами. Чтобы создать «ясноязычную» версию текста, нужно владеть специальными навыками, ведь задача такой версии — помочь людям, которым по разным причинам трудно прочитать и понять то, что написано обычным языком.
...Ясный язык — это специальная упрощенная форма...
...Кому нужен ясный язык По мнению нейропсихолога Елены...
Каждый, кто пишет в газете или популярном журнале о науке, знает, какие мучения вызывает «ввод» научного термина. Часто это слово не знакомо широкому читателю, непонятно даже из контекста и, как правило, воспринимается как «некрасивое» для русского уха и глаза. Сейчас привычные языковые стили меняются, приобретая новые черты. Что представляет собой новый язык науки? Каким становится главное научное слово — термин?
...Каждый, кто пишет в газете или популярном журнале о...
...Сложившийся к началу XX века научный язык — тот...
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Новые технологии «отвязали» текст не только...
...Начало. Чтение вслух Письменность появилась примерно...
Перевести набоковские образы часто невозможно не только на другой язык, но и интермедийно: как должно быть визуально представлено то, что может воплощаться только в слове? Этим вопросом задались лингвисты Любовь Каракуц-Бородина и Борис Орехов.
...Перевести набоковские образы часто невозможно не только...
...Они подготовили выставку для Музея Владимира Набокова...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Самые простые и распространенные пиктограммы могут стать источником неловкости в общении. Но и совсем отказаться от эмодзи было бы обидно — они делают наши послания и реакции более живыми, эмоциональными, облегчают контакт, помогают «не отстать от жизни». Тогда как нам ориентироваться в этом вавилонском столпотворении символов? Как общаться на языке эмодзи, не рискуя быть неправильно понятым?
...Самые простые и распространенные пиктограммы могут...
...Этот материал — часть совместного проекта Грамоты...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...