Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...создавать инструменты — нет мотивации создавать больше...
9 августа отмечается Международный день коренных народов мира. А с 2022 года по 2032 год ООН проводит Десятилетие языков коренных народов, цель которого — сохранение, возрождение и продвижение языков коренных народов, которые находятся под угрозой исчезновения. Одна из форм поддержки таких языков связана с расширением их представленности в научной литературе. Это помогает расширять лексику языка и делает его более востребованным в современном мире, привлекает внимание к ...
...Также факт выхода публикаций может привлечь больше...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...перестали, и это правильно: где меньше субъективизма, там больше...
...Но, кажется, языку больше подходят другие метафоры....
...похоже на активацию врожденного механизма — больше...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...А нас больше всего интересуют живые слова, которые...
...достойных» включения в словарь, гораздо больше...
...разделять ли эти значения или дождаться, пока накопится больше...
Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...
...газете», работа над созданием фонда началась больше...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...Сейчас в нем больше шести миллионов текстов, в...
Насколько хорошо россияне помнят героев произведений русской литературы и обстоятельства жизни их авторов? Всероссийский центр изучения общественного мнения (ВЦИОМ) представил результаты телефонного опроса и предложил их интерпретацию. Участники исследования отвечали на четыре вопроса в пределах школьной программы. Все вопросы были открытыми, в формате «устного экзамена», так что угадать правильный ответ было нельзя. Часть вопросов содержала ...
...Больше всего оказалось тех, кто ответил на два вопроса...
Наше представление о том, что для изучения языка необходимы словари и грамматика, существовало не всегда. Опираясь на «Историю русской письменности» филолога Виктора Марковича Живова, попробуем разобраться, как текстологический подход к языковой норме оказался вытеснен грамматическим и как это повлияло на нашу письменную традицию.
...Наше представление о том, что для изучения языка необходимы...
...регламентацией языка письменного: раз нельзя было больше...
...славянском восприятии этой формы получалось, что Христос больше...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...Таким образом, для обращения к словарю больше...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...литературой, поэтому таких проектов будет становиться все больше...