Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
У носителей русского языка, в том числе и у пользователей Грамоты, часто возникают сложности с написанием слов на -овка и -ёвка: речовка, но ночёвка; плащовка, но размежёвка; мелочовка, но дешёвка. Какое правило тут действует? В более старых словарях речёвка, плащёвка и мелочёвка пишутся через ё, а сегодняшняя норма допускает только о. Проследим короткую, но бурную историю этих слов.
...У носителей русского языка, в том числе и у пользователей...
...Когда появились речовки? Слово речовка впервые фиксируется...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Источники и причины появления новых слов Многие слова, которые мы сегодня воспринимаем как привычные и существовавшие всегда, когда-то были новыми единицами. Так, слово столица образовано от слова стол при помощи суффикса -иц-, но со временем эта связь перестала ощущаться: сегодня мы не видим в слове столица то значение, которое есть у стола. А во многих случаях слова, когда-то послужившие основой для новых, сами ушли из языка: говядина (от ст.-слав. говѩдо — крупный рогатый ...
...Источники и причины появления новых слов Многие слова...
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Новые технологии «отвязали» текст не только...
...Начало. Чтение вслух Письменность появилась примерно...
Ежегодная лекция о новых находках состоялась 20 ноября 2023 года. Академик РАН Алексей Гиппиус, продолжая традицию, начатую его учителем, Андреем Анатольевичем Зализняком, рассказал о результатах раскопок прошедшего сезона: о пятнадцати новгородских грамотах и четырех грамотах из Старой Руссы. Трансляцию можно посмотреть на канале Института славяноведения РАН.
...Ежегодная лекция о новых находках состоялась 20 ноября...
...Самая древняя из найденных в 2023 году новгородских...
В русском языке регулярно появляются новые слова, а старые нередко приобретают новые значения. Опасны ли эти процессы и не теряем ли мы русский язык? Есть ли вообще в языке константы? Эти и другие темы ведущий программы Михаил Швыдкой обсудил с гостями студии — специалистами по лингвистике, культурологии и литературной критике.
...В русском языке регулярно появляются новые слова...
...В программе участвовали: Ольга Северская ...
25 сентября в Рязанской библиотеке имени А. М. Горького состоялась презентация книги «„Дорогой для меня цвет семейности“. Фотоальбом династии Срезневских». На XI Межрегиональном фестивале национальной книги «Читающий мир» это издание стало победителем в номинации «Издание, вносящее вклад в диалог культур».
...25 сентября в Рязанской библиотеке имени А. М. Горького...
...Имя слависта Измаила Срезневского (1812–1880)...
Академик Виктор Владимирович Виноградов одним из первых разработал принципы филологического жанра «история слов». В его книге, которая так и называется «История слов», рассказано, как произошли те или иные слова, каково было их этимологическое значение, как изменялись значения и форма слов, как они использовались в классической литературе и в современных произведениях.
...Академик Виктор Владимирович Виноградов одним из первых...
...Чрезвычайно интересно проследить историю слова речь...
«Надо обсудить это с моим GPT» — эта фраза уже не звучит как шутка из стендап-номера о новой технологической реальности. Искусственный интеллект стал для многих привычным собеседником. В этой статье мы попробовали разобраться, чем стиль общения чат-ботов так пленяет многих людей и как нечеловеческие собеседники уже вписываются (и еще могут вписаться) в нашу жизнь.
...«Надо обсудить это с моим GPT» —...
...От утилитарности к человечности Беседы с искусственным...