Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
В литературных текстах прошлого есть странные для современного читателя цветообозначения. Кандидат филологических наук, переводчик и прозаик Мария Елифёрова в книге «Тайна синего вина и другие филологические истории» проясняет несколько загадок, связанных с цветом (и не только) в мировой литературе.
...В литературных текстах прошлого есть странные для современного...
...«Любопытство для ученого не порок, а норма жизни...
Глагол «трусить» — это на самом деле два глагола-омографа, которые пишутся одинаково, а произносятся по-разному. Более того, у одного из этих глаголов есть два значения, о чем напоминает журнал «Наука и жизнь».
...Глагол «трусить» — это на самом деле...
...Если в глаголе трусить поставить ударение на первый...
Конгресс приурочен к Году педагога и наставника в России и станет главным событием IV съезда Общества русской словесности. 9 ноября состоится пленарное заседание и награждение победителей Международного конкурса «Учитель и его ученики на пространстве СНГ», посвященного двухсотлетию со дня рождения Константина Ушинского и Году русского языка как языка межнационального общения в СНГ. На 10–11 ноября намечены основные мероприятия конгресса, в том числе: Съезд учителей и ...
...Конгресс приурочен к Году педагога и наставника в России...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают произношение слова «договор» и его производных, причем на этом примере рассказывается о том, что наряду с литературной нормой существует вполне допустимая устная норма.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова выясняет истоки появления слова «стрекулист» и оттенки его значения в разные исторические периоды; указывает на смысловые различия в словах «приказный» и «приказной».
...Ведущая рубрики «Русский устный», член редакционного...
В привычном слове «чертополох» мало кто сегодня чувствует присутствие черта. Однако этимология этого названия прямо указывает на нечистую силу. О магической функции чертополоха — статья в журнале «Наука и жизнь».
...В привычном слове «чертополох» мало кто...
...Название «чертополох» связано с народным...
Московская традиционная олимпиада по лингвистике — это ежегодная олимпиада для школьников, которую совместно проводят отделение теоретической и прикладной лингвистики филологического факультета МГУ, Институт лингвистики РГГУ и факультет филологии НИУ ВШЭ при поддержке Московского центра непрерывного математического образования. В ходе олимпиады (которая будет проходить в три тура) школьникам предложат несколько самодостаточных лингвистических задач; решение каждой из них напоминает ...
...Московская традиционная олимпиада по лингвистике &mdash...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...