Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Совсем недавно, в ноябре 2021 года, пресса писала, что приняты новые правила, в которых буква «ё» стала обязательной. Теперь появились сообщения, что русское правописание вовсе избавляется от «ё». Научный сотрудник Института русского языка им. В. В. Виноградова и член Орфографической комиссии РАН Владимир Пахомов рассказывает изданию «N+1», что происходит с правилами орфографии и какие изменения нас ждут.
...Совсем недавно, в ноябре 2021 года, пресса писала,...
...Правила орфографии и пунктуации, которыми должны руководствоваться...
Институт лингвистических исследований Российской академии наук (ИЛИ РАН) приглашает принять участие в Международной научной конференции, посвященной столетию со дня рождения специалиста по лексикографии и диалектологии, много лет занимавшего позицию главного научного сотрудника ИЛИ РАН, — Федора Павловича Сороколетова. Ф. П. Сороколетов (08.03.1924 — 20.12.2008) — доктор филологических наук, профессор, автор более двухсот научных трудов по ...
...Институт лингвистических исследований Российской академии...
Даже сегодня, общаясь с теми, кто родился в 1930-е и 1940-е годы (как правило, коренными москвичами), мы отмечаем, что они произносят некоторые слова не так, как мы привыкли. В чем своеобразие старомосковской орфоэпической традиции и как она соотносится с современными нормами? Ответить на эти и другие вопросы Грамоте помогла кандидат филологических наук, старший научный сотрудник отдела фонетики Института русского языка имени В. В. Виноградова РАН Ольга Антонова.
...Даже сегодня, общаясь с теми, кто родился в ...
...Кто и когда говорил по-старомосковски Живой язык...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
Наше внимание привлекли несколько весенних выпусков передачи Ольги Северской. Педагог, филолог Наталья Кулибина говорила о том, как научить ребенка читать; лингвист Александра Плетнева обратила внимание на сходства и различия языка лубка и церковнославянского; поэт и богослов Ольга Седакова рассказала о поэтике богослужебных песнопений. В специальном выпуске коллеги и друзья вспоминают академика РАН Юрия Апресяна. Все выпуски доступны на канале.
...Наше внимание привлекли несколько весенних выпусков...
...Как заниматься чтением с не умеющими читать?...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
Считается, что языки, на которых говорят большие группы населения, становятся проще. Одна из гипотез объясняет этот процесс большой долей людей, для которых этот язык не является родным: они упрощают чужой язык по мере овладения им. Однако новое исследование ставит под сомнение эту связь. Лингвисты из Института Макса Планка оценили грамматическую сложность 1314 языков и пришли к выводу, что она не снижается даже в тех сообществах, где многие члены сообщества говорят на неродном языке.
...Считается, что языки, на которых говорят большие группы...
Дети очень быстро начинают говорить на родном языке, при этом речь взрослых, обращенная к детям, часто бывает обеднена и упрощена. Исследователи обратили внимание на это противоречие и попробовали его объяснить. О том, что помогает ребенку понять устройство языка, доктор филологических наук, заведующая отделом теории грамматики ИЛИ РАН Мария Дмитриевна Воейкова рассказала в докладе «Вспомогательные механизмы языка и их роль в усвоении языка ребенком».
...Дети очень быстро начинают говорить на родном языке...
...Разговаривая с матерью, маленький ребенок получает...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...