Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
8 сентября — Международный день грамотности. Уровень грамотности в России — один из самых высоких в мире. По последним данным Института статистики ЮНЕСКО, он составляет 99,93%. Кроме того, Россия находится на втором месте в мире по числу публичных библиотек: их 46 тысяч. Ее обходит только Китай, где их больше 51 тысячи. Но всеобщее умение читать и писать — цель, которая была достигнута в нашей стране еще в
...8 сентября — Международный день грамотности...
Государственная дума приняла закон, запрещающий прием в школы детей мигрантов без проверки знания русского языка. Первое чтение прошло 10 декабря, после внесения поправок закон был одобрен во втором и третьем чтениях 11 декабря. За принятие закона проголосовали 409 депутатов, один — против, воздержавшихся не оказалось. Законопроект, внесенный группой депутатов во главе с председателем Госдумы Вячеславом Володиным, его заместителем Ириной Яровой и
...Государственная дума приняла закон, запрещающий прием...
Чем общение людей отличается от общения обезьян, которых обучили основам жестового языка? А еще есть всем известные осмысленные танцы пчел и знаковые системы других живых существ — это язык или нет? С этих вопросов начинается книга переводчика, журналиста, преподавателя иностранных языков Яны Хлюстовой, которая владеет в той или иной степени шестью языками.
...Чем общение людей отличается от общения обезьян, которых...
...Первая часть книги посвящена глобальным вопросам языкознания...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Национальный корпус русского языка (НКРЯ) — ключевой...
Слова пожалуйста и спасибо считаются универсальными составляющими вежливого общения. Мы привыкли думать, что эти слова следует употреблять независимо от обстоятельств, просто потому, что так принято. Но исследователи из Калифорнийского университета в Лос-Анджелесе выяснили, что в практике употребления слова пожалуйста гораздо больше нюансов, чем может показаться на первый взгляд. Авторы работы, опубликованной в журнале Social Psychology Quarterly, записали на видео ...
...Слова пожалуйста и спасибо считаются универсальными...
Социокультурный тренд «гочао» наблюдается в Китае уже несколько лет и свидетельствует о формировании новой китайской идентичности. Тому, как этот тренд проявляется в языке, посвящена статья в сборнике научных трудов «Пути Поднебесной».
...Социокультурный тренд «гочао» наблюдается...
...В условиях глобализации в Китае появился...
Владикавказский научный центр Российской академии наук (ВНЦ РАН) начал сотрудничество с ведущими российскими ИТ-специалистами с целью расшифровки рукописей нартских сказаний с помощью искусственного интеллекта. Предварительные тесты показали обнадеживающие результаты в работе с историческими документами. В архиве рукописей центра хранится больше десяти тысяч текстов — это одна из крупнейших коллекций такого рода на Северном Кавказе. В 1930–
...Владикавказский научный центр Российской академии наук...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...