Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Международный пятидневный форум для преподавателей русского языка стран Северной Африки и Ближнего Востока Terra Rusistica открылся в Тунисе 15 апреля. Организаторами выступают Международная ассоциация преподавателей русского языка и литературы (МАПРЯЛ), Тунисская ассоциация преподавателей русского языка и литературы, кафедра восточных языков Высшего института языков Карфагенского университета и Русский дом в Тунисе. Это одно из самых масштабных мероприятий ...
...Международный пятидневный форум для преподавателей...
Текст, написанный нейросетью, прошел в финал литературного конкурса для авторов и чтецов аудиокниг «Проект особого значения». Его цель — поспособствовать популяризации профессии инженера и литературного жанра научной фантастики, а также помочь молодым писателям и чтецам выйти на большую читательскую аудиторию. Организаторы конкурса — АО «ЗАСЛОН» и платформа для digital-авторов «ЛитРес: Самиздат» — специально включили сгенерированный ...
...Текст, написанный нейросетью, прошел в финал литературного...
На самом деле этот подкаст — не совсем о русском языке. Девятнадцать коротких выпусков — это истории о том, каким путем в русский язык попали разные непонятные слова и что они означают. Несмотря на некоторые лингвистические неточности, эти увлекательные истории расширяют наше понимание современной речи. Чтобы дать представление о содержании подкаста, опишем вкратце содержание двух выпусков.
...На самом деле этот подкаст — не совсем о...
...Тема первого выпуска — англицизмы,...
Работа над расширением возможностей Грамоты продолжается. В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник». Теперь можно прямо отсюда увидеть все правила, которые уже есть в Учебнике Грамоты, и перейти на интересующее пользователя интерактивное упражнение. 2. Для тех, кто использует интерактивные упражнения в бумажном виде, есть ...
...Работа над расширением возможностей Грамоты продолжается...
Когда взрослые разговаривают друг с другом, они опираются на свои знания и предположения о том, как и о чем будет (скорее всего) говорить другой человек. Это облегчает им задачу по расшифровке звуковой информации, особенно когда голос собеседника приглушен, плохо слышен на фоне шума, речь неразборчива или ее пониманию мешает сильный акцент. В новом исследовании Массачусетского технологического института и Гарвардского университета, опубликованном в журнале Nature Human ...
...Когда взрослые разговаривают друг с другом, они опираются...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...