Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Около двух тысяч представителей коренных малочисленных народов Севера и Дальнего Востока поделятся своими знаниями с исследователями в ходе двух континентальных экспедиций: «Чистая Арктика — Восток-77» и «Россия 360». Об этом сообщает ТАСС со ссылкой на пресс-службу проекта «Чистая Арктика — Восток-77». Маршруты экспедиций специально проложены так, чтобы дать специалистам возможность встретиться с
...Около двух тысяч представителей коренных малочисленных...
Носители языка понимают языковую норму по-разному и с недоверием относятся к ситуациям, в которых норма допускает варианты, объясняет научный консультант Грамоты Владимир Пахомов. Грамота законспектировала его выступление на научной конференции «Медиатекст: векторы развития и перспективы изучения», которая состоялась в рамках IV Костомаровского форума.
...Носители языка понимают языковую норму по-разному и...
...Ошибочные представления о русском языке, которые...
Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.
...Территориальное распространение языков, диалектов и...
...Откуда берутся «всемирные» слова Слова...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Российская государственная детская библиотека выложила на своем сайте список вопросов и ответов первого этапа Всероссийской олимпиады «Символы России. Русский язык: история письменности». С апреля по октябрь 2023 года дети и подростки могли отправить организаторам свои вопросы (не более пяти). Из них для олимпиады были отобраны по десять лучших в каждую из двух возрастных категорий; их авторам обещаны дипломы и призы. Всего на конкурс поступило более 3350 вопросов. Вот ...
...Российская государственная детская библиотека выложила...
Коллективные ассоциативные поля похожи на клавиатуру. Писатель, как пианист, играет на этих клавишах. Он нажимает клавишу, молоточек бьет по струне — читатель слышит звук. Но если в мозгу читателя нужных струн не натянуто, то молоточек бьет в пустоту, звука нет, и что же тогда делать? Как прикажете играть на рояле без струн? А переводчик постоянно сталкивается с такой задачей.
...Коллективные ассоциативные поля похожи на клавиатуру...
...Для начала — один реальный случай и ...
5 апреля стали известны имена победителей и призеров Всероссийской олимпиады «Символы России. Русский язык: история письменности». Их список опубликован на сайте Российской государственной детской библиотеки, которая выступает соучредителем олимпиады. Участники олимпиады соревновались в двух возрастных категориях, 10–12 лет и 13–16 лет. На втором, финальном этапе старшим предлагалось ответить, среди прочих, на такие вопросы. К
...5 апреля стали известны имена победителей и ...
О начале разработки сообщил марийский лингвист, научный сотрудник Марийского института языка, литературы и истории Андрей Чемышев. Проекту уже дали название «iВика», созвучное с марийским женским именем Айвика. В целом набор функций цифрового помощника будет таким же, как у других подобных продуктов: он сможет найти информацию в интернете и зачитать ее, добавить встречу в календарь, включить песню, рассказать сказку или анекдот. Изюминка — в языке. Колонки с ...
...О начале разработки сообщил марийский лингвист, ...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...