Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Точное соответствие
Найдено 50 публикаций
Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.

...Михаил Копотев о роли сгенерированных нейросетью текстов...

...Нейросети учатся на текстах, созданных человеком. Но...

... По мере их поступления можно дообучать языковую модель — с учетом этого она будет становиться лучше и научится искать ошибки у китайских, немецких, русских и всех остальных учеников....

...В нашем примере модель будет хорошо искать ошибки, собранные из текстов, например, финских студентов, но будет хуже cправляться с ошибками китайских студентов. Опасен ли такой сценарий? Да, если забыть про первый путь: сбор оригинальных данных....

...В таком случае языковой модели ставят задачу: Вот тысяча учебных текстов, в которых мы отметили ошибки, — создай еще миллион похожих, и тогда мы научим электронного ассистента искать ошибки самостоятельно. Есть ли тут проблема? Конечно....

...Обучение и самообучение: как синтетические данные влияют...

Роспатент выдал свидетельство о регистрации Национального корпуса удмуртского языка

Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН.  Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...

...Пока что в нем около 6 млн словоупотреблений...

...Система дает возможность искать определенные словоформы и сочетания, поиск по грамматическим показателям, авторам, годам публикации, подкорпусам, просматривать морфологический разбор слова и т. п....

...Роспатент выдал свидетельство о регистрации Национального...

29 июня ушел из жизни Владимир Владимирович Лопатин

  Владимир Владимирович был активным участником всех самых главных лингвистических проектов последней трети XX и начала XXI века. Все годы работы нашего портала он был его научным консультантом. Он один из авторов академической «Русской грамматики» 1980 года, обобщившей все достижения отечественного языковедения (авторы «Русской грамматики» были удостоены Государственной премии СССР 1982 года), лингвистического энциклопедического словаря ...

...Ему было 86 лет...

...Все, кто пишет, редактирует, корректирует тексты, давно знают: ответы на самые сложные вопросы, связанные с написанием слов, в том числе недавно заимствованных русским языком, надо искать в «словаре Лопатина» — это сочетание стало уже почти таким же устойчивым, как «словарь Даля...

...29 июня ушел из жизни Владимир Владимирович Лопатин...

Кому и зачем нужен Национальный корпус русского языка

Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ —  насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.

...Получить всю картотеку одним кликом и другие, менее...

...Девятнадцать лет назад в России появился электронный...

...Или вы хотите узнать, как то же самое слово употребляет конкретный автор — у вас есть возможность искать его в подкорпусе этого автора.  Еще один способ заинтересовать массового пользователя — портрет слова....

...Учитель может искать примеры из литературы, выбирая их в соответствии с возрастом и уровнем учеников.  Основной корпус — для всех. Там можно получить в том числе и ответы на простые вопросы. Ирина Виноградова Например, вам интересно, как употребляется какое-то слово....

...Кому и зачем нужен Национальный корпус русского языка...

В Москве прошла первая стратегическая сессия «Информационные технологии и языки народов России»

В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.

...Мероприятие организовано Домом народов России при поддержке...

...В современном мире, чтобы язык сохранялся и ...

...В архиве можно искать по фамилии, имени, отчеству и месту жительства, поиск выдаст оригинальный документ и расшифровку текста....

...В Москве прошла первая стратегическая сессия «Информационные...

В Марий Эл разрабатывают умную колонку, говорящую на марийском языке

О начале разработки сообщил марийский лингвист, научный сотрудник Марийского института языка, литературы и истории Андрей Чемышев. Проекту уже дали название «iВика», созвучное с марийским женским именем Айвика. В целом набор функций цифрового помощника будет таким же, как у других подобных продуктов: он сможет найти информацию в интернете и зачитать ее, добавить встречу в календарь, включить песню, рассказать сказку или анекдот. Изюминка — в языке. Колонки с ...

...Голосовой помощник сможет отвечать на вопросы, искать информацию и рассказывать сказки...

...О начале разработки сообщил марийский лингвист, ...

...В Марий Эл разрабатывают умную колонку, говорящую на...

Эвфемизмы: от суеверий до политкорректности

Эвфемизмы, или слова-заместители, мы употребляем в тех случаях, когда слово, которое напрашивается в этом контексте, считается непристойным, оскорбительным или неуместным по каким-то другим причинам. И такие «мягкие» формулировки появляются не только на месте ругательств — эвфемизмами заменяют и многие другие лексические единицы. Для каких групп слов они используются чаще всего? Попробуем показать отдельные фрагменты этой большой картины.

...«Благозвучные» слова используют не только вместо ругательств...

...Эвфемизмы, или слова-заместители, мы употребляем в&...

...  Необходимость искать эвфемизмы для называния людей с ментальными заболеваниями объясняется еще и тем, что некоторые старые термины (идиот, дебил, слабоумный, кретин) широко используются как оскорбления и тем самым способствуют стигматизации этой группы....

...Эвфемизмы: от суеверий до политкорректности...

Чтобы добыть драгоценное слово…

Живучесть словесных игр, переходящих из поколения в поколение, свидетельствует об их необходимости для умственного развития детей. Играя, они тренируют умение быстро вспоминать и точно употреблять нужные слова по заданным признакам, то есть активно владеть своим словарным багажом.

...Обучающие игры со словами: непроверяемые написания...

...Живучесть словесных игр, переходящих из поколения в...

...Мы стали искать возможность организовать словарную работу школьников как гораздо более активную. Поэтому в другой школе (преподавательница О. З. Кантаровская) словарные слова не предлагались в готовом виде....

...За пределами изучения остается огромное количество непроверяемых слов, и надо искать возможности их запоминать. Одна из этих возможностей — отправить учащихся в самостоятельные поиски таких слов. Поначалу это дается им нелегко....

...Чтобы добыть драгоценное слово…...

Цифра в публицистическом тексте

Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.

...Включение цифры в текст часто приводит к очевидным...

...Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее....

...  Часто говорят, что цифры управляют миром; нет...

...Цифра в публицистическом тексте...

Что лингвистическая теория может дать школьному образованию?

На первый взгляд теоретические вызовы, стоящие перед современной лингвистической наукой, бесконечно далеки от проблем школьного русского. Но если предложить школьникам задуматься над почему-вопросами об устройстве языка, это расширит их научную картину мира и сделает освоение родного языка более увлекательным, считает доктор филологических наук, заведующий кафедрой теоретической и прикладной лингвистики филологического факультета МГУ Сергей Георгиевич Татевосов.

...Доклад лингвиста Сергея Татевосова на Международном...

...На первый взгляд теоретические вызовы, стоящие перед...

...Но как искать такие аргументы, более или менее понятно:  например, надо исследовать, как человеческий мозг отвечает на языковые и неязыковые стимулы (и в этом месте лингвистика встречается с нейронаукой)....

...Если обращать внимание детей на загадки языка, искать вместе с ними ответы на почему-вопросы, они  увидят нечто, что человеческому разуму предстоит раскрыть. Такой взгляд мог бы сделать изучение русского и других языков намного более привлекательным и увлекательным....

...Что лингвистическая теория может дать школьному образованию...

Больше точных совпадений не найдено, показать близкие результаты?

Показать