Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Многие встречали утверждение, что мозг якобы игнорирует...
О русском языке можно не только читать, но и слушать. Мы собрали очень разные подкасты и радиопрограммы: архивные и самые новые, часовые и минутные, с приглашенными экспертами и авторские. Из них можно узнать много нового и неожиданного про русский язык: его историю и современное состояние, значение слов и фразеологических оборотов, про неологизмы и жаргонизмы, про речевой этикет и историю алфавита.
...О русском языке можно не только читать, но и слушать...
...Рекомендуем выбрать подходящую длительность, ведущих...
Последние два полевых сезона не только внесли вклад в представления о культуре и истории древнего Новгорода, но и стали событием для изучения берестяной письменности в целом. Было найдено четырнадцать якутских грамот — одиннадцать в 2024 году и три в 2025-м. Об этих и других находках рассказал в традиционной лекции доктор филологических наук, академик РАН Алексей Гиппиус.
...Последние два полевых сезона не только внесли вклад...
...Ясак Некоторые грамоты со скорописью начала XVIII&...
Нас с детства приучают, что грамотный человек не должен употреблять слова-паразиты. Они не несут смысловой нагрузки, раздражают слушающих и отвлекают внимание от сути высказывания. Тогда откуда они берутся, почему мы их произносим и какие слова рискуют стать паразитами? Лингвисты тут могут нас удивить.
...Нас с детства приучают, что грамотный человек не должен...
...Почему «паразиты»? Можно представить себе...
Известный факт: мы больше доверяем людям, похожим на нас. Это верно и по отношению к тем людям, чья речь похожа на нашу: выбором слов, грамматических конструкций, произношением. Но какие механизмы социальной психологии стоят за этим? Ответить на эти вопросы помогла недавняя работа междисциплинарной исследовательской группы под руководством Терезы Матцингер из Венского университета. Группа рассматривала две версии. Согласно первой, люди доверяют тем, кого интуитивно ...
...Известный факт: мы больше доверяем людям, похожим на...
Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.
...Территориальное распространение языков, диалектов и...
...Откуда берутся «всемирные» слова Слова...
Фразеологизм — это устойчивое выражение, значение которого не сводится к сумме значений его компонентов. Как лингвокультурология изучает фразеологию, чем русские идиомы отличаются от идиом других языков и как они себя чувствуют в эпоху мемов и эмодзи? Об этом Грамоте рассказала доктор филологических наук, главный научный сотрудник Института языкознания РАН Мария Ковшова.
...Фразеологизм — это устойчивое выражение,...
...Даже огурец может быть символом Лингвокультурология...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...