Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
Почти два миллиона детей учат язык своего народа в рамках основной школьной программы, еще около трехсот тысяч — в системе дополнительного образования. Об этом сообщила замдиректора департамента государственной общеобразовательной политики и развития дошкольного образования Минпросвещения РФ Анна Тимофеева, выступая на пресс-конференции в «Татар-информе». Она также высказалась за то, чтобы изучение родного языка начиналось еще до школы.
...Почти два миллиона детей учат язык своего народа в&...
19 апреля Дом творчества Переделкино станет площадкой однодневного фестиваля «Энергия жизни: Север, Сибирь и Дальний Восток», посвященного культуре и языкам коренных малочисленных народов России. Мероприятие проводится в рамках литературной мастерской, приуроченной к 90-летию Владимира Санги, основателя нивхской литературы. Особое внимание будет уделено вопросам сохранения исчезающих языков. В 15:00 младшие научные сотрудники Научного центра по сохранению, возрождению ...
...19 апреля Дом творчества Переделкино станет площадкой...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...
После ста с лишним лет безуспешных попыток удалось расшифровать основной подтип дофарской письменности — древней системы письма, обнаруженной в Дофаре (одной из провинций Омана). Исследование, опубликованное в журнале Jaarbericht Ex Oriente Lux, описывает прорывное открытие в понимании этой системы письма. Когда лингвист Ахмад Аль-Джаллад из Университета штата Огайо (США) изучал фотографии дофарских надписей, он обратил внимание на один из ...
...После ста с лишним лет безуспешных попыток удалось...
Книжный сервис «Литрес» проанализировал читательскую активность россиян в 2025 году. Выводы: интерес к чтению растет, причем в основном в регионах. Наши соотечественники стали уделять чтению на 10% больше времени, чем годом ранее. В авангарде этого тренда оказалась Магаданская область, жители которой стали самыми активными читателями в стране. В топ-10, согласно методологии учета времени в активные дни чтения, вошли ...
...Книжный сервис «Литрес» проанализировал...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...