Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.
...Революция нейросетей началась с текста. Но в ...
...Математик Константин Воронцов: «Текст становится тормозом...
...Грамота: В 2024 году Нобелевскую премию по...
Премию имени М. В. Ломоносова I степени за научные работы Ученый совет МГУ присудил Наталье Лукашевич — доктору технических наук, ведущему научному сотруднику НИВЦ МГУ и профессору кафедры теоретической и прикладной лингвистики филологического факультета. Наталья Лукашевич создала цикл статей о методах автоматического анализа текстов на русском языке (включая их классификацию, извлечение информации, анализ тональности, семантический анализ и другие виды аналитической обработки ...
...Ломоносовскую премию 2023 года вручили за исследования...
...Премию имени М. В. Ломоносова I степени за научные...
Пол Грэм — американский программист, предприниматель, один из создателей бизнес-инкубатора Y Combinator для стартапов в сфере информационных технологий. А еще человек пишущий — автор нескольких книг по программированию и многочисленных эссе, например «Как начать стартап» и «Как правильно возражать». В октябре он опубликовал в своем блоге текст об умении писать тексты. Грамота перевела его для вас, воспользовавшись помощью нейросетевых технологий.
...Пол Грэм — американский программист, предприниматель...
...Пол Грэм: «Мир, разделенный на пишущих и не пишущих...
...Обычно я неохотно делаю прогнозы относительно технологий...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Разработаны инструменты выявления сгенерированных фрагментов...
...Современные генеративные модели, такие как ChatGPT,...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...От древнерусского до блогов: как изменился Национальный...
...Национальный корпус русского языка (НКРЯ) — ключевой...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
Сможете ли вы угадать, кто такой халадур (или что это)? А найти аналог французского выражения «он стреляет из четырех ружей» в русском языке? Такие задания можно найти в книге «Тридцать шесть подсвечников», написанной веселыми российскими лингвистами. Мы выбрали пять языковых игр и предлагаем вам сыграть в одну из них прямо сейчас. Если вам станет интересно — в книге их гораздо больше!
...Сможете ли вы угадать, кто такой халадур (или что это...
...Необычные игры в слова: пять вариантов для интеллектуальной...
...1. Двое из ларца В этой лингвистической игре...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...Семантические издания Толстого, Пушкина и Чехова —...
...«Семантическое издание — это представление...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...В метасловаре пользователь сначала видит общую картину...
...Метасловарь как агрегатор Задать вопрос справочной...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Кому и зачем нужен Национальный корпус русского языка...
...Грамота: С какими целями создавался корпус? А. К.:...