Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
Согласно словарю Ожегова шаль — это тоже платок, только большой. Допустимо ли говорить «платки и шали»? Разобраться поможет публикация в журнале «Наука и жизнь».
...Согласно словарю Ожегова шаль — это тоже платок...
...Шаль, платок и полушалок......
...Слово шаль заимствовано в XVIII веке из польского (...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Разные языки или разные диалекты?...
...Задача с двумя неизвестными Представим, что есть два...
Компания October Group проанализировала, как часто жители Москвы и Московской области ищут в интернете сведения об обучении детей иностранным языкам. Специалистов интересовала пятерка самых популярных языков: английский, китайский, хинди, испанский и французский. Согласно выводам компании, которыми поделились «Известия», китайский оказался единственным из выбранных языков, интерес к которому устойчиво растет. Если с июля 2020 по июль 2021 года московские ...
...Все больше москвичей хотят учить своих детей китайскому...
...Компания October Group проанализировала, как часто...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...Современные онлайн-ресурсы расширяют возможности исследователей...
...1. Новое в русской лексике База данных снабжена...
Словарный запас — ключевое условие успешной учебы, а потом и карьеры. Но чтобы его расширять, необходимы совместные усилия семьи и школы, а у родителей не всегда хватает времени и идей, чтобы систематически заниматься с ребенком. Британские исследователи проанализировали результаты опроса родителей и учителей и предложили свои рекомендации.
...Словарный запас — ключевое условие успешной...
...Чтобы хорошо учиться, детям нужно больше слов...
...Зачем пополнять словарный запас Дети постоянно узнают...
Недавно группа депутатов Госдумы внесла законопроект, согласно которому вывески, тексты в рекламе, названия товаров, районов и жилых комплексов должны быть написаны на русском языке. Исследовательский центр рекрутингового портала Superjob.ru провел опрос, чтобы узнать, поддерживают ли граждане такую инициативу. 53% участников опроса поддержали идею законопроекта. Они приводили следующие аргументы: «Надо беречь русский язык»; «В нашей стране должно быть все понятно для ...
...Больше половины россиян поддерживают запрет англицизмов...
...Недавно группа депутатов Госдумы внесла законопроект...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...Простые новостные заголовки больше нравятся читателям...
...«Чем проще, тем лучше» — это...
Департамент оценки и методологии АНО «Россия — страна возможностей» провел второе исследование (с 2020 года), чтобы выявить ключевые надпрофессиональные компетенции, максимально востребованные ведущими работодателями России. Впервые в базовый профиль вошел критерий «языковая грамотность». Базовый профиль — это компетенции, которые респонденты в целом посчитали наиболее существенными или критичными для успешной ...
...Российские работодатели стали больше ценить языковую...
...Департамент оценки и методологии АНО «Россия...