Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Восьмого апреля в 43 странах прошла акция «Тотальный диктант». Четыре фрагмента текста Василия Авченко написали онлайн и на очных площадках. «Участники из 43 стран написали двадцатый диктант в очном формате, 103 страны присоединились к акции в рамках онлайн-марафона и онлайн-диктанта. В России диктант фирменной юбилейной ручкой xGold на очных площадках написали более 125 000 человек. Больше всего участников в России традиционно собралось в Москве, куда пришли чуть ...
...Восьмого апреля в 43 странах прошла акция «Тотальный...
Учитель, писатель и журналист Ирина Лукьянова в статье для издания «Мел» предлагает на уроках русского языка и литературы растить коммуникативно грамотных взрослых.
...Учитель, писатель и журналист Ирина Лукьянова в статье...
...Почему на уроках русского языка не происходит живой...
День русского языка традиционно отмечается в день рождения Александра Сергеевича Пушкина. В пресс-конференции участвуют: — член Совета при Президенте Российской Федерации по русскому языку Константин Деревянко; — и. о. ректора Государственного института русского языка им. А. С. Пушкина Наталья Трухановская; — доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник Института русской литературы (Пушкинского дома) РАН Борис Орехов; — главный редактор ...
...День русского языка традиционно отмечается в день рождения...
То, как мы изучаем русский язык в школе, часто противоречит научному подходу. Одна из главных проблем, встающих перед учителем, — как преподносить темы, которые являются предметом лингвистических споров.
...То, как мы изучаем русский язык в школе, часто противоречит...
...Среди таких дискуссионных вопросов, например, оказываются...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
Стартап Metamentor, основанный студентами МФТИ, создал систему обработки рукописей на базе генеративного искусственного интеллекта. Система уже несколько месяцев тестируется в издательстве «Эксмо». «Алгоритмы анализируют синтаксическую сложность каждого произведения, разнообразие лексики, распознают фрагменты текста, требующие корректировки, исключения или добавления возрастной маркировки в соответствии с действующим законодательством ...
...Стартап Metamentor, основанный студентами МФТИ...
В Библиотеке по естественным наукам РАН лингвист Антон Сомин расскажет о драматичном периоде в истории отечественной письменности, когда русский язык едва не сменил алфавит. Мы привыкли воспринимать кириллицу как единственно возможную графическую основу русского языка. Однако история знает периоды, когда ее статус был под вопросом. На лекции лингвист Антон Сомин проанализирует амбициозные проекты начала XX века, которые могли навсегда изменить облик русского ...
...В Библиотеке по естественным наукам РАН лингвист...