Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Компания October Group проанализировала, как часто жители Москвы и Московской области ищут в интернете сведения об обучении детей иностранным языкам. Специалистов интересовала пятерка самых популярных языков: английский, китайский, хинди, испанский и французский. Согласно выводам компании, которыми поделились «Известия», китайский оказался единственным из выбранных языков, интерес к которому устойчиво растет. Если с июля 2020 по июль 2021 года московские ...
...Компания October Group проанализировала, как часто...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Портал «Грамота.ру» следит за успехами проекта «Тотальный диктант». Ежегодная образовательная акция привлекает все больше участников. В 2014 году диктант писали 64 тысячи человек в 352 городах мира. Ключевые составляющие успешного проекта — оригинальный текст (в этом году автором текста был Алексей Иванов), грамотный менеджмент и лингвистическое обеспечение на академическом уровне. Мы поговорили с председателем экспертной комиссии Тотального диктанта Натальей Борисовной Кошкарёвой — не только о диктанте.
...Портал «Грамота.ру» следит за успехами...
...Лингвисты в полях Грамота: Наталья Борисовна, пользуясь...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Русский драматург Александр Николаевич Островский был...
...В научной библиотеке Всероссийского театрального общества...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Ситуация не такая уж редкая: девушка из России выходит замуж за иностранца, уезжает в другую страну, и там молодая семья ждет ребенка. Больше других волнуется будущая бабушка Т. М.: «Ребенку придется учиться говорить сразу на двух языках. Не повредит ли это его развитию?» На письмо обеспокоенной бабушки ответила психолингвист Ирина Михайловна Румянцева. С разрешения автора письма и Т. М. публикуем его почти полностью.
...Ситуация не такая уж редкая: девушка из России выходит...
...Уважаемая Т. М., ... тронута тем, что внучка...