Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Как правильно писать недавно появившиеся в языке слова? Нередко на практике сразу рождается несколько параллельных вариантов написания. О принципах, которыми должны руководствоваться составители нормативных орфографических словарей, рассказывает статья доктора филологических наук, председателя Орфографической комиссии РАН (2000–2014) Владимира Лопатина.
...Как правильно писать недавно появившиеся в языке слова...
...Я не буду рассуждать о том, что такое языковая норма...
Дефис вместо тире часто ставят даже те, кто познал тайны «-тся/-ться» и знает кунфу расстановки запятых. Казалось бы, какая разница — чуть покороче палочка или чуть подлиннее? На самом деле разница есть. Более того, в этом вопросе есть и неочевидные тонкости, которые осложняют жизнь корректоров и иногда ставят в тупик пользователей Грамоты. Мы попробовали составить маленький путеводитель по простым и сложным случаям.
...Дефис вместо тире часто ставят даже те, кто познал...
...В чем разница Сначала посмотрим нашим героям в лицо...
Конструкции вроде в связи с необходимостью повышения эффективности деятельности коммунальных служб проводится ряд мероприятий — знакомая многим проблема бюрократического языка. О «канцелярите» как болезни языка писал еще Корней Чуковский, призывая писать просто и понятно. Но что делать с этой профессиональной деформацией чиновников? Возможно, решить эту проблему в России удастся с помощью новых технологий.
...Конструкции вроде в связи с необходимостью...
18 декабря в пространстве «Кибердом» были названы победители конкурса лучших сайтов и приложений российского сегмента интернета. Конкурс «Золотой сайт + золотое приложение» проводится ежегодно с 1997 года, но в этом году награду вручали за достижения 2023 года, когда состоялся перезапуск Грамоты. Сайты-претенденты оценивает жюри, состоящее из профессионалов отрасли. В конкурсе 88 разных номинаций, Грамота участвовала ...
...18 декабря в пространстве «Кибердом...
Сервис «Яндекс Переводчик» пополнился двумя языками народов Северного Кавказа — карачаево-балкарским и кабардино-черкесским. Пользователи уже могут выбрать их на сайте и в приложении переводчика, а также в Яндекс-поиске. Научное сопровождение проекта обеспечил Карачаево-Черкесский институт гуманитарных исследований им. Х. Х. Хапсирокова (КЧИГИ). Яндекс совместно с Домом народов России и Федеральным агентством по делам национальностей запустил проект ...
...Сервис «Яндекс Переводчик» пополнился...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Самые простые и распространенные пиктограммы могут стать источником неловкости в общении. Но и совсем отказаться от эмодзи было бы обидно — они делают наши послания и реакции более живыми, эмоциональными, облегчают контакт, помогают «не отстать от жизни». Тогда как нам ориентироваться в этом вавилонском столпотворении символов? Как общаться на языке эмодзи, не рискуя быть неправильно понятым?
...Самые простые и распространенные пиктограммы могут...
...Этот материал — часть совместного проекта Грамоты...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...