Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Когда носитель русского языка оказывается в Болгарии, то невольно удивляется: «А почему тут все написано нашими буквами?» Хотя мы и привыкли воспринимать русский алфавит как нечто родное, те же болгары стали использовать кириллические буквы раньше нас. Когда и зачем возникла кириллица, кто разработал новый алфавит и как он связан с глаголицей, латиницей и греческим алфавитом?
...Когда носитель русского языка оказывается в Болгарии...
...Где пишут кириллицей Кириллическую письменность помимо...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Многие встречали утверждение, что мозг якобы игнорирует...
Ведущая программы «Наблюдатель» Фекла Толстая пригласила представителей близкой ей филологии, членов-корреспондентов РАН Елену Березович и Ирму Муллонен, академиков Алексея Гиппиуса и Николая Казанского, чтобы расспросить об их научных интересах и состоянии академической науки в России. Встреча была приурочена к трехсотлетию Российской академии наук, которое отмечается в этом году.
...Ведущая программы «Наблюдатель» Фекла Толстая...
...По мнению профессора Уральского федерального университета...
Весенний сезон 2023 года ведущие популярного подкаста посвятили истории русского языка. Научный руководитель Грамоты, научный сотрудник Института русского языка РАН Владимир Пахомов и журналист Александр Садиков размышляют о том, что во все времена люди спорили по-русски о порче языка, осуждали новомодные иностранные заимствования и ругали современные им словари.
...Весенний сезон 2023 года ведущие популярного подкаста...
...Сезон состоит из пяти выпусков, каждый из которых посвящен...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Благодаря появлению цифровых устройств мы можем читать больше, а доступ к информации у нас есть почти всегда. Но как это влияет на то, насколько хорошо мы понимаем прочитанное? Исследователи из Университета Валенсии (Испания) провели метаанализ (сравнительный обзор) более двух десятков исследований, опубликованных в период с 2000 по 2022 год, в которых приняли участие почти 470 тысяч человек. Во всех работах, вошедших в выборку, их авторы оценивали, насколько хорошо участники понимали ...
...Благодаря появлению цифровых устройств мы можем читать...
22 мая в Институте Пушкина начнет работать трехдневный IV Костомаровский форум. Подробную программу форума можно посмотреть здесь. В нее включены более 30 мероприятий, в том числе с участием экспертов Грамоты. Рассказываем о них подробнее. 22 мая в 14:30 состоится панельная дискуссия «Языковой вкус эпохи: русский язык в медиапространстве» с участием Ксении Киселевой — главного редактора ...
...22 мая в Институте Пушкина начнет работать...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...