Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Круглый стол, организованный Федеральным институтом родных языков народов РФ, прошел 4 апреля в ЦВК «Экспоцентр» и на онлайн-платформе «ММСО.Коннект». В нем участвовала Мария Лебедева — заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина, а также руководитель образовательного направления Грамоты. Она рассказала о преимуществах билингвизма и о том, как можно ...
...Круглый стол, организованный Федеральным институтом...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Ольга Седакова — поэт, филолог, переводчик, историк культуры. На лекции «Стихотворный перевод и природа поэзии» речь пойдет о стихотворном переводе в его отношении к оригинальному творчеству. Перевод, как известно, имеет дело с невыполнимой задачей: написать (в замысле) то же стихотворение на другом языке и чаще всего — в другое время. Это ремесленная задача или творческая? Можно ли отличить переводной стихотворный текст от ...
...Ольга Седакова — поэт, филолог, переводчик...
Как правильно писать недавно появившиеся в языке слова? Нередко на практике сразу рождается несколько параллельных вариантов написания. О принципах, которыми должны руководствоваться составители нормативных орфографических словарей, рассказывает статья доктора филологических наук, председателя Орфографической комиссии РАН (2000–2014) Владимира Лопатина.
...Как правильно писать недавно появившиеся в языке слова...
...Я не буду рассуждать о том, что такое языковая норма...
Акции, которые проверяют умение грамотно писать, позволяют участникам вспомнить то, чему их учили в школе, расширить словарный запас и почувствовать себя частью большого сообщества, говорящего на одном языке. В мире проводится несколько подобных акций, у каждой из них — своя история и свои особенности. Обычно это либо диктант для всех желающих, либо соревнования по спеллингу. По случаю двадцатилетнего юбилея нашего Тотального диктанта мы решили рассказать о некоторых других общенациональных праздниках грамотности.
...Акции, которые проверяют умение грамотно писать, позволяют...
...Французские культурные диктанты По легенде, Евгения...
Рекомендуем посмотреть несколько программ, которые вышли в эфир в последнее время. Из них можно узнать, как интернет-мемы становятся частью языка, о чем спорили составители первого русского академического словаря и какие значения могло иметь слово «мир» и его родственники. Все выпуски доступны на канале.
...Рекомендуем посмотреть несколько программ, которые...
...«Изи катка», «ван лав», «...
За последние 30 лет эмодзи (смайлы) стали универсальным феноменом. К 2015 году, согласно исследованиям, 92% людей использовали их в онлайн-общении. Одна из причин популярности эмодзи в том, что они могут быть понятны каждому — по крайней мере базовые символы, обозначающие радость, грусть или гнев. Но даже их люди могут интепретировать по-разному, как выяснили авторы статьи в журнале PLOS ONE. К исследованию привлекли 253 добровольцев из ...
...За последние 30 лет эмодзи (смайлы) стали универсальным...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...