В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Как хорошо вы замечаете ошибки? Давайте проверим, сможете ли вы работать корректором. Мы взяли предложения из художественных текстов, написанных современным русским языком и опубликованных после 1960 года, и специально добавили в них ошибки.
Будьте внимательны: чтобы усложнить вам задачу, иногда мы добавляли орфографическую ошибку, иногда — пунктуационную, иногда — грамматическую. В каждом случае только один вариант ответа не содержит ни одной ошибки. Сможете ли вы его найти? На портреты писателей не рассчитывайте, они вам не помогут узнать правильный ответ!
...Как хорошо вы замечаете ошибки? Давайте проверим, сможете...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Справочной службе Грамоты часто в разных формах задают такой вопрос: «Последнее время дикторы стали склонять названия: в Останкине, в Конькове и т. д. У нас что, изменились правила русского языка или для дикторов сделали послабление, чтобы они себе не забивали голову?» Этот миф получил широкое распространение: будто бы варианты «в Болдине», «из Останкина», «в Пулкове» — «новояз», безграмотность, порча языка.
...Справочной службе Грамоты часто в разных формах...
...Встречаются даже такие эмоциональные высказывания:&...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
В издательстве «Грамота» вышел школьный «Словарь трудностей русского произношения». Он поможет ученикам 5–11-х классов правильно произносить те слова, которые включены в школьную программу и часто встречаются в их речевой практике. О том, каким законам подчиняется развитие звуковой стороны языка и какие задачи решает новый словарь, мы поговорили с одним из его авторов, доктором филологических наук, ведущим научным сотрудником отдела фонетики Института русского языка им. В. В. Виноградова РАН Дмитрием Савиновым.
...В издательстве «Грамота» вышел школьный...
...Грамота: Чем ваш словарь отличается от обычного орфоэпического...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...
Ведущий канала «Основа» Борис Веденский и доктор филологических наук, автор книги «Происхождение языка» Светлана Бурлак выясняли, был ли у человечества единый праязык, смогут ли все языки объединиться в один и как английскому языку повредила глобализация.
...Ведущий канала «Основа» Борис Веденский...
...Обезьяны в определенный момент научились обмениваться...