Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Все мы при решении рабочих вопросов, чтении новостей...
Инициатива Crowdsourcing Romeyka, возглавляемая профессором Кембриджского университета Иоанной Ситариду, приурочена к Международному десятилетию языков коренных народов (2022–2032), объявленному ООН. Его цель — «привлечение внимания мировой общественности к критическому положению многих языков коренных народов и мобилизация заинтересованных сторон и ресурсов для их сохранения, возрождения и продвижения». Ромейка считается исчезающим ...
...Инициатива Crowdsourcing Romeyka, возглавляемая ...
Группа специалистов из Бирмингемского университета обнаружила, как именно наше тело реагирует на ошибки в речи других людей. В частности, исследователи выявили корреляцию между восприятием ошибок и вариабельностью сердечного ритма (ВСР). Продолжительность интервалов между ударами сердца обычно варьируется, когда мы расслаблены, но становится постоянной, когда мы находимся в стрессе. Новое исследование выявило статистически значимое снижение ВСР в ответ на грамматические нарушения. Причем ...
...Группа специалистов из Бирмингемского университета...
В творчестве Пушкина много загадок, а отгадку часто надо искать за пределами самого текста — прежде всего в античной литературе и мифологии. Издание, подготовленное в издательстве «Грамота», — больше, чем просто словарь. Его можно назвать путеводителем по миру пушкинских поэтических символов и эстетических намеков.
...В творчестве Пушкина много загадок, а отгадку...
...В допушкинскую эпоху считалось непоэтичным использовать...
Известно, что владение двумя языками на одном уровне нагружает мозг дополнительной работой. Однако это может быть полезно для развития памяти. Ученые проверили эту гипотезу в играх на угадывание слов. В исследовании участвовали испано-англоязычные билингвы и англоязычные монолингвы. Услышав слово, участники должны были найти соответствующую картинку среди множества изображений на экране. При этом у них регистрировались движения глаз с помощью айтрекеров. Авторы выбирали изображения для ...
...Известно, что владение двумя языками на одном уровне...
15–16 сентября 2023 года в Институте русского языка им. В. В. Виноградова РАН (Москва) пройдет III конференция «Языки России в контакте с русским языком». Основные темы докладов: явления в грамматике и лексике автохтонных языков России, обусловленные контактом с русским языком или контактами автохтонных языков друг с другом; радикальные изменения в грамматике и лексике малых языков России в ситуации языкового сдвига (массового перехода носителей на русский язык или на ...
...15–16 сентября 2023 года в Институте русского...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...