Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Баски, уже многие сотни лет живущие в предгорьях Пиренеев на границе Испании и Франции (именно в их честь получил свое название Бискайский залив), — удивительный и загадочный народ, культура и язык которого совсем не похожи на культуру и языки других народов Южной Европы. Вот и правила образования числительных (да и сами их названия) в баскском языке весьма своеобразны. Предлагаем решить лингвистическую задачу про баскские числительные, опубликованную в журнале «Наука и жизнь».
...Баски, уже многие сотни лет живущие в предгорьях Пиренеев...
...Даны арифметические примеры на умножение на баскском...
В экспертном голосовании за одиннадцать слов-кандидатов участвовали более четырехсот филологов из разных городов России. В острой конкурентной борьбе «вайб» обошел «скуфа» и «прилет».
...В экспертном голосовании за одиннадцать слов-кандидатов...
...Тройка лидеров определилась в первые часы, но...
В литературных текстах прошлого есть странные для современного читателя цветообозначения. Кандидат филологических наук, переводчик и прозаик Мария Елифёрова в книге «Тайна синего вина и другие филологические истории» проясняет несколько загадок, связанных с цветом (и не только) в мировой литературе.
...В литературных текстах прошлого есть странные для современного...
...«Любопытство для ученого не порок, а норма жизни...
Сага «Звездные войны» давно стала культурным феноменом. При этом использование имен и понятий, присущих именно этой киновселенной, распространилось далеко за пределы фанатского сообщества. Сотрудница Хемницкого технического университета Кристина Санчес-Стокхаммер проверила, как терминология «Звездных войн» повлияла на современный английский язык. Ее интересовала частота появления выбранных ею слов в четырех разных корпусах английского языка, в том числе в Британском ...
...Сага «Звездные войны» давно стала культурным...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
О первых итогах прошедшей акции рассказал на пресс-конференции в ТАСС руководитель проекта «Тотальный диктант» Вячеслав Беляков. По его данным, по всему миру в акции участвовал 1 294 401 человек. 132 164 человека написали Тотальный диктант очно на площадках в России, 4086 человек — на площадках за рубежом, 26 тысяч человек написали Тотальный диктант в режиме онлайн в системе автоматической проверки, 3514 человек в
...О первых итогах прошедшей акции рассказал на пресс-конференции...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
В этом году в работе форума принимают участие около 270 человек, представляющие 68 субъектов РФ. Среди участников — представители Исполнительного комитета СНГ, ЮНЕСКО, ведущих ИТ-компаний, образовательных и научных центров России, Кыргызстана, Узбекистана и Таджикистана. Таким образом, впервые за семь лет форум проходит в международном формате. Участники обсудят исследования и достижения в области изучения русского языка, поделятся опытом разработки учебных материалов и новых методик ...
...В этом году в работе форума принимают участие около...