Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В русском языке большинство русских фамилий склоняются, а вот с иностранными ситуация более сложная. В любом случае несклоняемыми чаще оказываются женские фамилии, чем мужские. Попробуем выделить несколько случаев, когда фамилия сохраняет неизменный вид во всех падежах.
...В русском языке большинство русских фамилий склоняются...
...Женские фамилии Все женские фамилии, оканчивающиеся...
В совместном исследовании сервиса «Яндекс Книги» и проекта «Московское долголетие» приняли участие более ста человек. Большинство из них были лидерами и членами литературных клубов проекта, в котором участвуют москвичи в возрасте 55+. Опрошенные поделились своими впечатлениями о книгах, которые помогли им в трудные моменты жизни, а также рассказали, какие произведения стоит прочитать до тридцати лет, какие герои и сюжеты произвели ...
...В совместном исследовании сервиса «Яндекс Книги...
Весенний сезон 2023 года ведущие популярного подкаста посвятили истории русского языка. Научный руководитель Грамоты, научный сотрудник Института русского языка РАН Владимир Пахомов и журналист Александр Садиков размышляют о том, что во все времена люди спорили по-русски о порче языка, осуждали новомодные иностранные заимствования и ругали современные им словари.
...Весенний сезон 2023 года ведущие популярного подкаста...
...Сезон состоит из пяти выпусков, каждый из которых посвящен...
Участники Тотального диктанта — люди, у которых есть мотивация писать грамотно. В чем тогда причина регулярных ошибок: сложные правила, редкие слова, недостатки школьного образования? Можно ли рассматривать ошибки как сигнал для изменения правил? Свой комментарий дала лингвист, член Филологического совета Тотального диктанта Светлана Викторовна Друговейко-Должанская.
...Участники Тотального диктанта — люди, у которых...
...Агнонимы Первая категория наиболее частотных ошибок...
Каким образом можно увидеть разницу в картине мира на конкретных языковых примерах? Журнал «Наука и жизнь» приводит интересные случаи такого рода в английском и русском языках.
...Каким образом можно увидеть разницу в картине мира...
...Грамматические и лексические особенности того языка...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...
Всероссийский центр изучения общественного мнения (ВЦИОМ) выяснил читательские предпочтения россиян. Опрос был приурочен к Книжной социологической премии им. Грушина, в нем участвовали 1600 человек в возрасте от 18 лет. Согласно исследованию, 87% опрошенных за последнюю неделю читали книги, статьи или другие материалы. В сравнении с прошлогодними опросами художественная литература (40%) впервые обогнала по популярности новости и сообщения в
...Всероссийский центр изучения общественного мнения (...
Единый государственный экзамен по русскому языку предстоит сдать каждому школьнику вне зависимости от того, в какой вуз он планирует поступать. О том, что нового в ЕГЭ по русскому языку в этом году, как к нему лучше подготовиться и избежать обидных ошибок, Грамоте рассказала филолог, учитель русского языка и литературы, методист, эксперт ЕГЭ Элина Стрейкмане.
...Единый государственный экзамен по русскому языку предстоит...
...Ключевые моменты и критерии оценки остались прежними...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...