Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Словарный запас — это совокупность всех слов, которые знает человек. Какие есть методики его измерения? Правда ли, что современный человек знает больше слов, чем Пушкин? Как богатый словарный запас может помочь в обычной жизни? Расширяем и углубляем представления о словарном запасе вместе с кандидатом филологических наук, руководителем образовательного направления Грамоты Марией Лебедевой.
...Словарный запас — это совокупность всех...
...Два мешка слов «про запас» Исследователи...
На днях Американское диалектологическое общество объявило свое слово 2025 года — одним из последних. Это повод наконец подвести итоги: какие слова в прошедшем году стали знаковыми по версии авторитетных словарей, аналитических компаний, издательств и научных институтов. И поразмышлять над тем, о чем свидетельствует этот выбор.
...На днях Американское диалектологическое общество объявило...
...Кто и как определяет слова года Экспертный подход...
Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
...Родству языков посвящена такая область лингвистики,...
...Жизнь и карьера Морриса Сводеша Моррис Сводеш...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова рассказывает о семействе слов, заканчивающихся на «…знайка», в частности, об изобретённом А. В. Суворовым словечке «немогузнайка», прослеживет его толкование в разных словарях.
...Ведущая рубрики «Русский устный», член редакционного...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Редакционная политика — удобный инструмент, который помогает создавать тексты не только средствам массовой информации, но и бизнес-изданиям, государственным порталам, онлайн-проектам, блогерам, копирайтерам и маркетологам. Какую пользу она может принести и что надо учесть при ее разработке? Опишем в общих чертах, как обычно устроена редполитика, чтобы каждая команда, работающая с текстами, могла затем приспособить ее для своих нужд.
...Редакционная политика — удобный инструмент...
...Что такое редполитика Редакционная политика &mdash...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В ХМАО — Югре ведется работа по созданию...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...