Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...nbsp;сожалению, мало, а их подготовка (ручной поиск...
Овладеть каким-либо языком — значит приобрести определенный, максимально возможный словарный запас, усвоить грамматический строй изучаемого языка и научиться ими пользоваться в речевой практике. Все эти стороны в овладении языком одинаково важны, взаимосвязаны и взаимообусловлены.
...Овладеть каким-либо языком — значит приобрести...
...их использованием, например: придумать словарный поиск...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...nbsp;например, учебные материалы; она нацелена на поиск...
В русском языке, как известно, есть два способа образования сравнительной степени: с помощью суффиксов («холоднее», «веселей») и путем прибавления к форме положительной степени слова «более» («более холодный», «более веселый»). В отношении синтетической простой формы сравнительной степени типа «веселее» у языковедов споров не возникает: она признаётся морфологической (если, конечно, вообще категория степеней сравнения причисляется к морфологическим категориям). По поводу же образований типа «более холодный» в специальной литературе существуют две противоположные точки зрения.
...В русском языке, как известно, есть два способа...
...И пока этот поиск шел, синтаксическое влияние...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Там тоже есть поиск, но не такой сложный...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...Поиск ответов на эти вопросы и составляет суть...
В конференции участвовали лингвисты, лексикографы, руководители электронных библиотек. Вела конференцию член редакционного совета «Грамоты.ру» Юлия Сафонова.
...В конференции участвовали лингвисты, лексикографы,...
...возможности по электронным словарным базам таковы: поиск...
...по всем словарям, поиск по отдельным словарям, по...
...выбранным, по одному, по нескольким, поиск по слову...
В 2024 году Грамота предложила филологам оценить одиннадцать слов, которые удовлетворяли нашим критериям и поэтому вошли в шорт-лист «слов года». Вот эти слова: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилет, пов, сап, скуф и нормис. Мы попробуем показать, чем интересны эти слова, а заодно ответим на самые распространенные вопросы: почему тут есть слова, которых никто не знает, почему тут есть слова, которые все давно знают, и, наконец, почему в этом списке сплошные заимствования?
...В 2024 году Грамота предложила филологам оценить...
...неизвестно большинству носителей русского языка, поиск...
Один из мифов о русском языке гласит, что написание е вместо ё — грубая орфографическая ошибка. На самом деле согласно правилам русского правописания употребление буквы ё в большинстве случаев необязательно.
...Один из мифов о русском языке гласит, что...
...в некоторых случаях на основе о (так как шел поиск...
...Становится понятно: шел поиск такого буквенного знака...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...