обучающая машина | Журнал | Поиск по Грамоте

Российские лингвисты научили алгоритм правильно «переводить» знаки препинания

Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или ...

...Пунктуационная асимметрия — давно известная переводчикам...

Грамота меняется, но не изменяет себе

Этой осенью Грамота вступает в эпоху перемен. В чем будут заключаться эти перемены? Какая идея стоит за ними? И, самое главное, будет ли Грамота по-прежнему самым авторитетным сетевым источником сведений о русском языке? О смысле обновления и планах на будущее рассказывает главный редактор портала Ксения Киселева.

...Этой осенью Грамота вступает в эпоху перемен. В чем...

...Маска, я вас знаю? В ноябре 2023 года Грамоте исполнится...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Притча во языцех

Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.

...Соглашаясь с необходимостью законодательного регулирования...

...Текст закона требует уточнений Юрий Караулов ...

Что такое старомосковское произношение

Даже сегодня, общаясь с теми, кто родился в 1930-е и 1940-е годы (как правило, коренными москвичами), мы отмечаем, что они произносят некоторые слова не так, как мы привыкли. В чем своеобразие старомосковской орфоэпической традиции и как она соотносится с современными нормами? Ответить на эти и другие вопросы Грамоте помогла кандидат филологических наук, старший научный сотрудник отдела фонетики Института русского языка имени В. В. Виноградова РАН Ольга Антонова.

...Даже сегодня, общаясь с теми, кто родился в ...

...Кто и когда говорил по-старомосковски Живой язык...

Почему так трудно выбрать номинацию для людей с инвалидностью?

5 мая отмечается Международный день борьбы за права инвалидов. Парадоксально, но само название дня, возможно, уже нарушает эти права. Ведь с точки зрения современной этики слово «инвалид» относится к числу стигматизирующих, так что формулировать предмет борьбы следует иначе. Или дело тут не только в словах? С какими проблемами сталкиваются те, кто хочет найти самую точную и вежливую номинацию для уязвимых групп?

...5 мая отмечается Международный день борьбы за права...

...Кто такие инвалиды В 2021 году социальное медиа «...

Исследование: внутренний язык больших языковых моделей ближе всего к английскому

Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...

...Большинство нейросетевых языковых моделей обучаются...

Разработаны инструменты выявления сгенерированных фрагментов в научных текстах

Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...

...Современные генеративные модели, такие как ChatGPT,...

В Балтийском федеральном университете создали чат-бота на основе трудов Канта

Исследователи Балтийского центра нейротехнологий и искусственного интеллекта БФУ им. Канта натренировали большую языковую модель на текстах трудов Иммануила Канта. В результате, по их словам, модель научилась поддерживать диалог о философских понятиях. Пресс-служба БФУ опубликовала несколько цитат из ответов бота. Например, вот как он отреагировал на вопрос, возможна ли ложь во спасение: «Дорогой друг, я считаю, что ложь не может быть использована во спасении. Ведь ложь противоречит ...

...Исследователи Балтийского центра нейротехнологий и...

Филологи и редакторы оказались востребованы в качестве ИИ-тренеров

Пока все ждали, что искусственный интеллект вытеснит гуманитариев, работающих с текстами, произошло обратное: именно они становятся незаменимыми специалистами в обучении нейросетей. Спрос на AI-тренеров — профессионалов, которые учат искусственный интеллект правильно общаться с людьми, — вырос почти вдвое за год, по данным сервиса по поиску работы и сотрудников HeadHunter. Задача ИИ-тренера — готовить обучающие данные, создавать ...

...Пока все ждали, что искусственный интеллект вытеснит...

Почитать на грамоте