Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Язык постоянно развивается, так что некоторые слова выходят из активного употребления и забываются. Это происходит по разным причинам: одни слова обозначали исчезнувшие реалии, другие вытеснены синонимами, третьи остались только в поэтической речи. Даже если мы больше так не говорим, знание этих слов полезно для понимания текстов прошлых эпох. Мы предлагаем вам вспомнить, что значат десять старых слов из русской классической литературы.
...Язык постоянно развивается, так что некоторые слова...
В справочник «Официально о русском языке» на сайте Грамоты добавлен раздел со ссылками на словари, фиксирующие нормы современного русского литературного языка при его использовании в качестве государственного языка Российской Федерации. Ранее список этих словарей был утвержден распоряжением премьер-министра РФ Михаила Мишустина. Всего словарей четыре: Орфографический словарь русского языка как государственного языка Российской Федерации (разработчик — Институт ...
...В справочник «Официально о русском языке»...
Заимствованные слова, если их активно употребляют, довольно быстро обживаются в языке. Даже если вначале слово заимствуется как неизменяемое, обычно оно подстраивается под существующие в языке модели словоизменения и само начинает участвовать в образовании новых слов.
Среди укоренившихся в нашем языке иностранных слов мы спрятали исконно русские слова, которые восходят к праславянскому. Сможете ли вы правильно определить, какое из слов не было заимствовано? Будьте внимательны, слова, пришедшие к нам из церковнославянского, считаются заимствованными.
...Заимствованные слова, если их активно употребляют,...
В ответ на запрос издания «Лента.ру» Роскомнадзор заявил, что список слов, запрещенных к использованию в СМИ, не изменился после выхода «Толкового словаря государственного языка Российской Федерации». В этом издании в словарной статье лексемы «нецензурный» (часть 1, с. 388) перечислены 14 корней: как хорошо известные матерные, так и те, которые раньше не были под запретом. Словарь утверждает, что ...
...В ответ на запрос издания «Лента.ру...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Чем человеческий язык отличается от коммуникации животных? Какие нейронные механизмы лежат в основе понимания и производства речи? Что современная нейробиология может подсказать о том, как оптимизировать изучение второго и последующих языков? Обо всем этом расскажет Анна Павлова — старший преподаватель магистерской программы МГППУ «Когнитивные нейронауки и нейротехнологии» и старший преподаватель департамента психологии факультета социальных наук НИУ ВШЭ. Лекция ...
...Чем человеческий язык отличается от коммуникации животных...
Кочевники-гунны были одной из главных движущих сил Великого переселения народов. Они прошли от Манчжурии до Западной Европы и создали влиятельную, хотя и недолговечную империю в Юго-Восточной Европе в IV–V веках. При этом этническая и языковая принадлежность гуннов остается неясной: они не оставили письменных источников. Ранее предполагалось, что представители племенного союза хунну, на основе которого сформировались гунны, говорили ...
...Кочевники-гунны были одной из главных движущих...
Мероприятие предполагает обмен опытом разработки цифровых словарей, презентацию методов цифровой лексикографии и обсуждение практических аспектов их применения. Организаторы — Сектор типологии Института языкознания РАН и Отдел корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН. В круг тем, которые будут затрагиваться на воркшопе, входят: цифровые платформы для публикации и подготовки словарей; опыт использования лексикографических ...
...Мероприятие предполагает обмен опытом разработки цифровых...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...О начале работы над корпусом объявили участники...