Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Какие школьные дисциплины пригодились россиянам больше всего в жизни и чем, по их мнению, следовало бы дополнить школьную программу? Исследование на эту тему провели сервисы «Работа.ру» и «Деловая среда». Больше всего опрошенных (70%) назвали самым полезным предметом русский язык. 27% отдали свои голоса за иностранный язык, а 25% — за литературу. Авторы исследования также выяснили, чего россиянам не хватает в школьной программе. Третьим по популярности стал запрос ...
...Какие школьные дисциплины пригодились россиянам больше...
Появление языка — один из поворотных моментов эволюции, выделивший человека среди других видов. Но можно ли считать язык исключительно нашим ноу-хау? Последние научные данные говорят о том, что элементы довольно сложных систем коммуникации есть и у других животных. Например, недавно у кашалотов выделили нечто похожее на алфавит. И вот теперь на очереди — слоны. Ранее было известно, что бутылконосые дельфины способны привлекать внимание конкретного ...
...Появление языка — один из поворотных моментов...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Национальный корпус русского языка (НКРЯ) — ключевой...
В эту подборку вошли в основном разного рода словари и энциклопедии для средней и старшей школы, изданные в последние 20 лет, и несколько книг для детей младшего школьного возраста, только начинающих задумываться об устройстве языка, на котором они говорят.
...В эту подборку вошли в основном разного рода словари...
...Книги о лингвистике могут помочь в освоении школьной...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Если повторить одно и то же слово много раз, в какой-то момент оно покажется бессмысленным набором звуков. Многие проверяли на себе это забавное явление хотя бы раз в жизни. Но, как выяснилось, им интересуются и исследователи. Авторы статьи, опубликованной в журнале Memory, провели эксперимент с целью понять, легко ли вызвать это ощущение целенаправленно. В ходе эксперимента 94 студента должны были много раз подряд записывать одно и то же слово. Они проделывали это с 12 словами (например, со ...
...Если повторить одно и то же слово много раз, в какой-то...
Ольга Седакова — поэт, филолог, переводчик, историк культуры. На лекции «Стихотворный перевод и природа поэзии» речь пойдет о стихотворном переводе в его отношении к оригинальному творчеству. Перевод, как известно, имеет дело с невыполнимой задачей: написать (в замысле) то же стихотворение на другом языке и чаще всего — в другое время. Это ремесленная задача или творческая? Можно ли отличить переводной стихотворный текст от ...
...Ольга Седакова — поэт, филолог, переводчик...