Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
После ста с лишним лет безуспешных попыток удалось расшифровать основной подтип дофарской письменности — древней системы письма, обнаруженной в Дофаре (одной из провинций Омана). Исследование, опубликованное в журнале Jaarbericht Ex Oriente Lux, описывает прорывное открытие в понимании этой системы письма. Когда лингвист Ахмад Аль-Джаллад из Университета штата Огайо (США) изучал фотографии дофарских надписей, он обратил внимание на один из ...
...После ста с лишним лет безуспешных попыток удалось...
Компания «Контур.Толк» провела исследование антипредпочтений россиян в деловой переписке. Результатами поделилась «Газета.ru». Большинство респондентов предпочитают нейтрально-деловой стиль общения (31%) или дружеский, но без панибратства (30%). При этом 72% участников исследования отметили, что шаблонные или чрезмерно формальные фразы затрудняют понимание смысла: 14% сталкиваются с этой проблемой часто, 58% — периодически. Мнения россиян о том, что вызывает ...
...Компания «Контур.Толк» провела исследование...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Группа депутатов (Ярослав Нилов и другие) и сенатор Елена Афанасьева внесли в Государственную Думу законопроект, который предлагает сделать обязательным знание русского языка для всех категорий иностранных граждан, претендующих на получение гражданства РФ. Предлагаемые изменения коснутся пункта 2 статьи 16 («Прием в гражданство Российской Федерации отдельных категорий иностранных граждан и лиц без гражданства») Федерального закона «О гражданстве Российской ...
...Группа депутатов (Ярослав Нилов и другие) и сенатор...
Естественные языки складывались сами собой. В них много нелогичного, случайного, избыточного, двусмысленного, сложного. А что если попробовать создать «разумный язык», специально «скроить» его так, чтобы он точно описывал мир и облегчал взаимопонимание? История знает несколько таких попыток: грандиозных, но неудачных.
...Естественные языки складывались сами собой. В них много...
...Лингвистические утопии просветителей Джон Уилкинс...
Единый государственный экзамен по русскому языку предстоит сдать каждому школьнику вне зависимости от того, в какой вуз он планирует поступать. О том, что нового в ЕГЭ по русскому языку в этом году, как к нему лучше подготовиться и избежать обидных ошибок, Грамоте рассказала филолог, учитель русского языка и литературы, методист, эксперт ЕГЭ Элина Стрейкмане.
...Единый государственный экзамен по русскому языку предстоит...
...Ключевые моменты и критерии оценки остались прежними...
Существуют ли в действительности мужской и женский стили? И проявляются ли они только на письме? Мы примерно представляем, «о чем говорят мужчины», но как они говорят? И есть ли в таком случае особый женский язык? Обо всем этом, пережив длинные праздники имени Восьмого Марта, журналист Ксения Туркова поговорила с заведующей лабораторией гендерных исследований Московского государственного лингвистического университета, доктором филологических наук, профессором Аллой Кирилиной.
...Существуют ли в действительности мужской и женский...
...Ксения Туркова: Алла Викторовна, у вас как у специалиста...