Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность, шарм), Krisenmodus (кризисный режим) — такими разными словами запомнился 2023 год по версии разных источников. Объявление «слов года» в ноябре-декабре часто вызывает обсуждения и споры. Почему эта акция стала традиционной во многих странах и везде пользуется успехом? Чего в ней больше: любопытства и соревновательного азарта, желания уловить общественные настроения или внимания к развитию языка?
...АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность...
...Немецкие основоположники Первым языком, для которого...
Специалисты из Нью-Йоркского университета создали модель машинного обучения (нейросеть), которая анализирует электрическую активность коры головного мозга, связанную с речью, и воспроизводит задуманные человеком слова. Для обучения модели исследователи обратились к группе из пяти пациентов с диагностированной рефрактерной эпилепсией и нарушениями развития речи. В этом состоянии пациент не реагирует на лечение противоэпилептическими препаратами в адекватных дозах и комбинациях, то есть не ...
...Специалисты из Нью-Йоркского университета создали ...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
В языках, на которых говорят в промышленно развитых странах, обычно есть около дюжины основных терминов для обозначения цвета, тогда как в языках, на которых говорят более изолированные группы, их часто меньше (вернее, они распределены неравномерно: некоторые части цветового спектра могут почти не иметь соответствующих слов). Это связано с тем, что в жизни людей из этих групп просто нет объектов и ситуаций, которые требуют использования таких слов. Однако владение вторым языком может повлиять на ...
...В языках, на которых говорят в промышленно развитых...
Мы уже писали о том, какие блоги о языке можно найти в «Телеграме» и в социальных сетях. Но интересные источники лингвистических новостей и историй продолжают появляться, так что всегда есть что добавить к нашему списку. Представляем пять телеграм-каналов, авторы которых увлекательно и доступно рассказывают о тонкостях русского и других языков и рассматривают язык в разных контекстах — от географии до судебной экспертизы.
...Мы уже писали о том, какие блоги о языке...
...Что почитать на Грамоте Автор этого канала —...
Перемены в языке не в последнюю очередь связаны с переменами в обществе. Подтверждение этому тезису можно найти как в истории, так и в окружающей нас действительности. Газеты, радио, телевидение сыплют «пиарами», «траншами», реклама глушит «чумовыми джок-дайлами», «офшорами» и «таймшерами». Мы все больше привыкаем к вхождению в наш повседневный язык большого количества новых слов иноязычного происхождения, но, привыкая к ним, хорошо бы отдавать себе отчет в правильности и уместности их употребления, а зачастую и в элементарном понимании значения того или иного слова.
...Перемены в языке не в последнюю очередь связаны...
...Уже второй год, отправляя студентов на практику, я...
Образовательная платформа «ПостНаука» опубликовала компиляцию видеороликов, которые посвящены языкам и их изучению. Лингвисты Владимир Плунгян, Александр Пиперски и Кирилл Бабаев рассказали о лексических и фонетических особенностях разных языков, о том, есть ли среди них объективно сложные, как изучение мертвых языков помогло развитию корпусной лингвистики и как ученые продолжают открывать всё новые языки.
...Образовательная платформа «ПостНаука» опубликовала...
...Распространено мнение, что хоть слова в языках...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...