В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Знать правила расстановки кавычек необходимо не только школьникам и писателям, но и тем, кто составляет договоры, инструкции, экспликации для выставок, объявления. Общие принципы усвоить нетрудно, а вот умение применять их к месту достигается тренировкой. В сложных случаях пригодится языковое чутье и внимательное отношение к стилю.
...Знать правила расстановки кавычек необходимо не только...
...Виды кавычек В русской (и не только) пунктуации есть...
В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.
...В любой библиотеке мира словари русского языка будут...
...Лексиконы эпохи Просвещения выражали новые понятия...
День русского языка традиционно отмечается в день рождения Александра Сергеевича Пушкина. В пресс-конференции участвуют: — член Совета при Президенте Российской Федерации по русскому языку Константин Деревянко; — и. о. ректора Государственного института русского языка им. А. С. Пушкина Наталья Трухановская; — доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник Института русской литературы (Пушкинского дома) РАН Борис Орехов; — главный редактор ...
...День русского языка традиционно отмечается в день рождения...
Известный факт: количество названий цветов и оттенков цвета в разных языках отличается. Эти различия в языке, как выясняется, влияют и на наше зрительное восприятие цвета. Совместное исследование Норвежского университета естественных и технических наук и Университета Осло показало, что люди, говорящие на языках с несколькими словами для обозначения оттенков, воспринимают их быстрее. Например, носители русского языка, в котором есть слова голубой и
...Известный факт: количество названий цветов и оттенков...
Сегодня завершился Всероссийский профессиональный конкурс «Лучший учитель родного языка и родной литературы». Церемония награждения победителей и призеров прошла в Поволжском университете физической культуры, спорта и туризма. В специальной номинации Грамоты «Родной язык — источник вдохновения» победила учитель начальных классов и языка коми Татьяна Попова (Республика Коми). Она получила специальный приз — планшет и
...Сегодня завершился Всероссийский профессиональный конкурс...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Поначалу слово из английского, французского или чешского языка кажется знакомым... и тут выясняется, что у него совершенно другое значение — иногда прямо противоположное. Любой, кто имеет дело с иностранными языками, хоть раз попадал впросак из-за «ложных друзей переводчика». Какие языковые процессы приводят к появлению таких слов? Можно ли их распознать и уберечься от ошибок?
...Поначалу слово из английского, французского или чешского...
...Что это за друзья такие Впервые эту метафору употребили...