Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Академик Виктор Владимирович Виноградов одним из первых разработал принципы филологического жанра «история слов». В его книге, которая так и называется «История слов», рассказано, как произошли те или иные слова, каково было их этимологическое значение, как изменялись значения и форма слов, как они использовались в классической литературе и в современных произведениях.
...Академик Виктор Владимирович Виноградов одним из первых...
...Чрезвычайно интересно проследить историю слова речь...
Зачем вообще люди ругаются нецензурными словами? Что такое языковые табу? Как возникла и развивалась табуированная лексика в русском языке? Почему люди стали чаще пользоваться эвфемизмами вместо мата и хорошо ли это? Все эти волнующие общество темы лингвист, член Орфографической комиссии РАН, доцент кафедры русского языка Московского архитектурного института и эксперт Грамоты Мария Ровинская обсудила с ведущим подкаста Григорием Тарасевичем.
...Зачем вообще люди ругаются нецензурными словами? Что...
...Ведущий сразу предупредил, что матерные слова будут...
Ответственный редактор монографии — академик Николай Николаевич Казанский, специалист по классической филологии и индоевропеистике. Книга рассчитана на широкий круг читателей, которые интересуются российской наукой и ее историей.
...Ответственный редактор монографии — академик...
...Институт лингвистических исследований имеет богатую...
Включение интернет-сленга в авторитетные лексикографические издания отражает процесс естественной эволюции языка под влиянием цифровых платформ. Недавний пример — обновление словника Кембриджского словаря, в который вошли понятия из интернет-культуры последних лет. Skibidi — слово, которое может иметь различные значения, такие как «крутой» или «плохой», либо использоваться в качестве шутки. Термин приобрел популярность благодаря вирусному анимационному ...
...Включение интернет-сленга в авторитетные лексикографические...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Международное исследование выявило прямую зависимость между прозрачностью календарных наименований в языке и тем, насколько хорошо носители языка справляются с вычислением дат и сроков. Авторы новой работы сравнили непрозрачные и прозрачные системы. В непрозрачных названия дней и месяцев не имеют явной связи с их порядком (например, в английском — Tuesday, August). В прозрачных системах (например, в китайском) дни и месяцы часто обозначаются цифрами: вторник как день-2, а август как ...
...Международное исследование выявило прямую зависимость...
Инструменты, о которых пойдет речь ниже, не сделают всю работу за редактора, но способны существенно упростить ему жизнь. Они не только возьмут на себя рутинные задачи, такие как проверка орфографии и степени оригинальности текста, оформление списка литературы или замена кавычек, но и подскажут удачные решения в более сложных областях.
...Инструменты, о которых пойдет речь ниже, не сделают...
...Проверка орфографии Автоматическая проверка орфографии...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
Одна из особенностей современных массово-коммуникативных текстов — использование устаревшей лексики: историзмов и архаизмов. Между тем проблема актуализации устаревших единиц языка не исчерпывается одними лексемами. Часто на страницах современных изданий встречаются элементы дореформенной графики, такие как «ять», «и десятеричное» и др. Они встречаются в рекламных текстах, в названиях коммерческих предприятий и общественных организаций, в заголовках статей, в логотипах газет и журналов.
...Одна из особенностей современных массово-коммуникативных...
...Очень популярно сейчас стало, стилизуясь под дореволюционную...