Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Каждый год специалисты фиксируют, что происходит с языком: какие слова становятся популярными, как меняется норма, каким образом влияют на язык новые законодательные инициативы. Всю правду о том, как жилось русскому языку в уходящем году, раскроет научный руководитель Грамоты, а также председатель филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН и ведущий подкаста «Розенталь и Гильденстерн» Владимир Пахомов. Лекция ...
...Каждый год специалисты фиксируют, что происходит с...
О русском языке можно не только читать, но и слушать. Мы собрали очень разные подкасты и радиопрограммы: архивные и самые новые, часовые и минутные, с приглашенными экспертами и авторские. Из них можно узнать много нового и неожиданного про русский язык: его историю и современное состояние, значение слов и фразеологических оборотов, про неологизмы и жаргонизмы, про речевой этикет и историю алфавита.
...О русском языке можно не только читать, но и слушать...
...Рекомендуем выбрать подходящую длительность, ведущих...
В подлинности «Слова» чаще сомневаются историки и литературоведы, а не лингвисты. О том, какие лингвистические аргументы позволяют говорить о подлинности «Слова», филолог Елена Галинская пишет в статье для журнала «Наука и жизнь».
...В подлинности «Слова» чаще сомневаются...
...Уже два столетия не утихают споры об одном из главных...
Россия не первая страна, которая сталкивается с задачей адаптации мигрантов. В декабре 2024 года Госдума приняла в трех чтениях закон, запрещающий зачислять в российские школы детей-неграждан, которые не владеют русским языком. Чему учит мировой опыт обучения иноязычных детей и что говорит об этом международное право? Попробуем посмотреть на общую картину.
...Россия не первая страна, которая сталкивается...
...Что говорят международные конвенции Согласно международным...
Полвека назад все было просто и понятно: вот писатель, вот журналист, а вот — редактор. В начале XXI века все запуталось: появились копирайтеры, райтеры, блогеры и контент-менеджеры. И немедленно вступили в переписку друг с другом и с заказчиками. Это подборка о современных принципах работы с текстами — мы включили в нее самые актуальные книги.
...Полвека назад все было просто и понятно: вот писатель...
...С появлением интернета изменился не только процесс...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Ежегодная лекция о новых находках состоялась 20 ноября 2023 года. Академик РАН Алексей Гиппиус, продолжая традицию, начатую его учителем, Андреем Анатольевичем Зализняком, рассказал о результатах раскопок прошедшего сезона: о пятнадцати новгородских грамотах и четырех грамотах из Старой Руссы. Трансляцию можно посмотреть на канале Института славяноведения РАН.
...Ежегодная лекция о новых находках состоялась 20 ноября...
...Самая древняя из найденных в 2023 году новгородских...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Новый номер доступен на сайте журнала. Напомним, что на сайте выложены в открытый доступ все номера журнала за 1967–2022 годы.
...Новый номер доступен на сайте журнала. Напомним, что...
...В новом номере: о вариантах русского ударения и...