Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Компания October Group проанализировала, как часто жители Москвы и Московской области ищут в интернете сведения об обучении детей иностранным языкам. Специалистов интересовала пятерка самых популярных языков: английский, китайский, хинди, испанский и французский. Согласно выводам компании, которыми поделились «Известия», китайский оказался единственным из выбранных языков, интерес к которому устойчиво растет. Если с июля 2020 по июль 2021 года московские ...
...Компания October Group проанализировала, как часто...
На нашей планете тысячи языков. Они относятся к разным языковым группам и семьям, а диалекты внутри них могут отличаться настолько сильно, что специалисты спорят, не стоит ли их считать отдельными языками. Почему это многообразие нас так завораживает? Возможно, одну из причин назвал Петр Вяземский: «Язык есть исповедь народа: в нем чудится его природа, его душа и быт родной».
...На нашей планете тысячи языков. Они относятся к разным...
...Мы выбрали для вас несколько книг об историческом развитии...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Есть ли у нейросетей шанс написать хороший художественный текст? Этому вопросу посвящена лекция кандидата филологических наук, заведующего отделом прикладной лингвистики Института языкознания РАН Дмитрия Коломацкого. А доктор физико-математических наук, профессор РАН и руководитель лаборатории в Институте ИИ МГУ Константин Воронцов рассказал о том, как людям пройти сингулярность, оставаясь умнее машин. Оба выступления прошли в рамках форума «Территория будущего. Москва 2030».
...Есть ли у нейросетей шанс написать хороший художественный...
...Какой из ИИ писатель? В начале лекции Дмитрий...
Фразеологизм — это устойчивое выражение, значение которого не сводится к сумме значений его компонентов. Как лингвокультурология изучает фразеологию, чем русские идиомы отличаются от идиом других языков и как они себя чувствуют в эпоху мемов и эмодзи? Об этом Грамоте рассказала доктор филологических наук, главный научный сотрудник Института языкознания РАН Мария Ковшова.
...Фразеологизм — это устойчивое выражение,...
...Даже огурец может быть символом Лингвокультурология...
Портал «Грамота.ру» следит за успехами проекта «Тотальный диктант». Ежегодная образовательная акция привлекает все больше участников. В 2014 году диктант писали 64 тысячи человек в 352 городах мира. Ключевые составляющие успешного проекта — оригинальный текст (в этом году автором текста был Алексей Иванов), грамотный менеджмент и лингвистическое обеспечение на академическом уровне. Мы поговорили с председателем экспертной комиссии Тотального диктанта Натальей Борисовной Кошкарёвой — не только о диктанте.
...Портал «Грамота.ру» следит за успехами...
...Лингвисты в полях Грамота: Наталья Борисовна, пользуясь...
Подавляющее большинство (96%) женщин, участвовавших в опросе книжного сервиса «Литрес» и платформы для знакомств Mamba, считают привлекательной грамотную речь. Среди участников-мужчин это мнение разделяют 76%. Результаты опроса публикует ТАСС. 63% женщин и 53% мужчин называют уровень грамотности решающим фактором для выбора партнера. Только для 3% женщин этот момент оказался незначимым (среди мужчин таких 23%). Как можно объяснить разницу между мужчинами ...
...Подавляющее большинство (96%) женщин, участвовавших...
Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.
...Русская топонимика может показаться запутанной и нелогичной...
...Раздельное написание топонимов Географические названия...