Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Среди традиционно спорных вопросов перевода — вопрос о том, допустимо ли вторгаться в структуру фраз оригинала. Искусство в этом, как и в других вопросах, вроде соотношения точности и свободы в переводе, состоит в том, чтобы умело лавировать между двумя крайностями. Как именно происходит непростой выбор формы и какими соображениями руководствуются переводчики, рассказывает переводчик с французского Наталья Мавлевич.
...Среди традиционно спорных вопросов перевода &mdash...
...Надо ли подстригать фразы оригинала, как деревья в&...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...Веха — один из псевдонимов Хлебникова....
Филолог Юлия Сафонова рассказывает в журнале «Наука и жизнь» о забытых русских словах.
...Филолог Юлия Сафонова рассказывает в журнале &...
...В книгах детского писателя Николая Носова были герои...
К числу включенных в декабре 2023 года слов, называющих актуальные явления и предметы, относятся, например, датасет, ИИ, ИТ-профессия, ИТ-специалист, косплей, косплейный, косплеер, майнинг, маркетплейс, медиакарта, мурал, инвестиционно привлекательный. Словарь также пополнили термины разных специальностей и областей знания, например: благополучатель, инофон (человек, не владеющий русским языком, для которого русский язык неродной, дети-инофоны), каподастр (ограничитель на грифе ...
...К числу включенных в декабре 2023 года слов, называющих...
В конце августа депутаты Госдумы поинтересовались у министра просвещения Сергея Кравцова, почему среди классиков, рекомендованных для подготовки к ЕГЭ-2024, нет произведений Пушкина, Лермонтова, Гоголя и других ключевых авторов. Вопрос возник после того, как 25 августа Федеральный институт педагогических измерений (ФИПИ) опубликовал проект контрольно-измерительных материалов КИМ к будущему экзамену. Спустя несколько дней в пресс-службе Минпросвещения дали разъяснения: «
...В конце августа депутаты Госдумы поинтересовались у...
В Российской академии наук подготовлена новая, переработанная и значительно дополненная, редакция «Правил русской орфографии и пунктуации». Работа над ней велась давно, с начала 1990-х годов. Текст правил готовился коллективом специалистов сектора орфографии и орфоэпии Института русского языка им. В. В. Виноградова, а затем — на всех этапах работы — подробно рассматривался, обсуждался на заседаниях Орфографической комиссии при Отделении литературы и языка РАН.
...В Российской академии наук подготовлена новая, переработанная...
...В составе комиссии — не только работники Академии...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
13 сентября Саратовская городская дума объявила фотоконкурс: горожанам предложено сфотографировать как можно больше вывесок на иностранных языках и с использованием транслитерации. «Приглашаем всех желающих присылать фотографии вывесок, размещенных на зданиях, расположенных на территории Саратова. Три участника конкурса, приславшие фотографии наибольшего количества таких объектов, получат призы», — сообщает телеграм-канал думы. Организаторы принимают фото до 25 ...
...13 сентября Саратовская городская дума объявила ...