Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Точное соответствие
Найдено 430 публикаций
Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.

...Нейросети учатся на текстах, созданных человеком. Но...

...Обучение и самообучение: как синтетические данные влияют...

...Если данных по каким-то причинам мало, у разработчиков есть два выхода: собирать их много лет или искусственно создать данные, похожие на уже существующие. Второй вариант и есть синтетические данные....

...Есть ли тут проблема? Конечно. Синтетические тексты содержат не все возможные языковые ошибки, а только те, которые встретились в исходных данных; при обучении эффект мультиплицирования увеличит вес именно этих ошибок....

...В языке действует закон Ципфа, который гласит, что частота слова обратно пропорциональна его рангу в частотном списке, то есть самое частотное слово встречается примерно в два раза чаще второго по частоте и так далее....

...Вообще, если есть хоть какие-то тексты, можно быстро и дешево создавать синтетические данные и работающую модель, которая постепенно насыщается новыми данными и совершенствуется. Такой сценарий кажется мне наиболее реалистичным....

...У нас есть тексты, написанные учащимися. С их помощью мы будет обучать  ассистента, показывая ему, какие ошибки могут допускать в русском языке иностранцы. Но текстов, к сожалению, мало, а их подготовка (ручной поиск ошибок) занимает очень много времени....

Ошибка ошибке рознь…

Распространенная сегодня негодующая точка зрения, которую метафорически можно обозначить как «Русский язык мы портим...», не разделяется авторами настоящей публикации. На наш взгляд, сегодня актуален не вопрос о состоянии русского языка, а вопрос о носителе русского языка. Для нас именно носитель, его культура, в том числе и языковая, — проблема (как для изучения, так и для формирования или, если угодно, коррекции).

...Распространенная сегодня негодующая точка зрения, которую...

...Ошибка ошибке рознь…...

...Любой говорящий знает, если у него есть аттестат зрелости, содержание программы средней школы, поэтому ударение в формах глагола звонить должен знать каждый....

...Поддержка профессионалов, оказание им всемерной помощи и есть, на наш взгляд, задача языковедов, такую помощь можно условно назвать поддержкой профессионала профессионалом....

...Пешковский писал: «Нормой признаётся то, что было, и отчасти то, что есть, но отнюдь не то, что будет». Иными словами, норма ретроспективна, она всегда результат, а не гипотеза. Норма консервативна, но динамична....

...Стремление поддерживать «чистоту» русского языка и еще более агрессивное желание «бороться» за такую чистоту похожи на «чистки» и «зачистки», они не способствуют консолидации носителей, то есть народа, а усугубляют общественную конфронтацию....

...Как гласит народная мудрость, ошибка в фальшь не ставится, то есть нельзя считать ошибку преднамеренным обманом. А как же относиться к ошибкам? И — можно ли избежать ошибок, говоря? Ошибка ошибке рознь — в каком смысле рознь?...

Фамилия, имя... матчество?

Вопрос о возможности заменить отчество на матчество в официальных документах вызывает сегодня бурные дискуссии, хотя это явление не так чуждо русской культуре, как может показаться.

...Вопрос о возможности заменить отчество на матчество...

...Фамилия, имя... матчество?...

...Древнерусские матери Для нас привычно, что у человека есть отчество, хотя оно есть не во всех культурах. Многие народы России, например эскимосы, буряты, калмыки, чукчи, до периода поздней империи или прихода советской власти не имели отчества....

...В данном случае эти прозвища не связаны с матерью, то есть речь не идет о матронимах в классическом понимании, но и они иллюстрируют иерархические отношения, как, например, андронимы (именование женщины по элементу имени мужа)1....

... А в сборнике саг «Круг земель» викинг Гутторм имеет матроним Гуннхильдссон, то есть сын Гуннхильды.  У современных исландцев «в качестве опознавательного имени используются либо патроним или матроним, либо фамилия....

...Однако на практике ЗАГСы отказываются заносить в документы матронимы за редкими исключениями, когда у имени матери есть мужской аналог: Евгений, Александр, Наталий, Марий2, Юлий. Если же такого аналога нет, то ЗАГС откажет. Следовательно, невозможно получить матчество Елизаветович, Оксанович и т. п....

Для чего нужен язык в первую очередь

Мы пользуемся языком, чтобы делиться информацией и обмениваться идеями. Гораздо сложнее понять, насколько язык необходим, чтобы мыслить. Сегодня есть данные, которые позволяют ученым утверждать, что язык и мышление существуют достаточно обособленно друг от друга. О новом исследовании рассказывает новостной портал Массачусетского технологического института. 

...Сегодня есть данные, которые позволяют ученым утверждать, что язык и мышление существуют достаточно обособленно друг от друга. О новом исследовании рассказывает новостной портал Массачусетского технологического института. ...

...Для чего нужен язык в первую очередь...

...«Я думаю, есть несколько наивных представлений и заблуждений, которые заставили людей твердо уверовать в то, что язык является инструментом мышления, — говорит Федоренко....

...Федоренко признаёт, что между языком и мыслью есть интуитивная связь. Во-первых, многие люди (впрочем, не все) думают словами, как бы проговаривая про себя мысли. Во-вторых, кажется разумным предполагать, что люди с грамотной, складной речью также являются хорошими мыслителями....

Как история языка разрешила спор Шишкова и Карамзина? Рассказывает филолог Юрий Кагарлицкий

В конце XVIII века вследствие расцвета частной жизни у русского дворянства появилась потребность более точно выражать мысли и чувства. Кандидат филологических наук, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН Юрий Кагарлицкий на канале «Говорим по-русски!» рассказал о споре Шишкова и Карамзина по поводу калькирования французских слов.

...В конце XVIII века вследствие расцвета частной...

...Как история языка разрешила спор Шишкова и Карамзина...

...У них есть общие значения, но есть и огромный пласт смысловых различий. Например, можно сказать Трогай! ямщику, чтобы он поехал, а у французского Touchez! нет такого значения, но есть другие, которых нет в русском.  С точки зрения логики Шишков был абсолютно прав....

Tone of voice: правила обращения с читателями

Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?

...Английский термин Tone of Voice (сокращенно ToV) обозначает...

...Tone of voice: правила обращения с читателями...

...  Tone of voice есть всегда, даже у тех, кто о нем никогда не задумывался. Раз есть текст, то есть и авторская интонация, даже если это всплывающее уведомление....

...Конкретно такой страницы не существует, но есть другие в меню. 404 — мы глубоко сожалеем о вашей потере. Такая страница есть, но на ней ничего нет. На страницу напал злобный кот, ищем возможности его устранения....

...Есть люди и бренды, которые умеют создавать мотивирующие, вдохновляющие тексты, побуждающие читателя действовать. Это хорошо получается у спортивных гигантов и крупных благотворительных проектов....

...От теории к практике У Грамоты тоже есть задача выбора тональности для статей, новостей и ответов справочной службы. Наш портал адресован широкой аудитории, всем, кому интересна история и жизнь языка....

...Среди них есть специалисты по русскому языку, люди с высшим образованием в других областях, редакторы, корректоры, копирайтеры, преподаватели, студенты и школьники, и ко всем мы относимся доброжелательно и с уважением....

Русский язык как государственный: что означает этот статус

Термин «государственный язык» используется в законодательстве, но не имеет однозначного толкования. Что это такое и в чем его функция, каждый понимает по-своему. Ясно одно: «государственный» в этом случае — категория не лингвистическая, а правовая.

...Термин «государственный язык» используется...

...Русский язык как государственный: что означает этот...

...Есть электронная версия.  Словарь социолингвистических терминов / под ред. В. Ю. Михальченко. М., 2006. Есть электронная версия....

...Есть электронная версия. Белоконь Н. В. Изменение Федерального закона «О государственном языке Российской Федерации» // Юридическая техника. 2023. № 17. Есть электронная версия. Вахтин Н. Б., Головко Е. В....

...Есть электронная версия. Мякшева О. В., Сиротинина О. Б. Современный русский литературный язык как государственный язык Российской Федерации. Русский язык в школе. 2019, 80 (3). С. 22–26. Есть электронная версия.  Руднев Д. А., Садова Т. С....

...Доктор филологических наук Мария Каленчук считает, что с лингвистической точки зрения нормы везде одинаковые: «Я не верю в то, что в русском языке как государственном есть другие нормы, чем в русском литературном языке....

...Но тут всегда есть опасность перестараться.  Речевая деятельность не может уместиться полностью в жесткие правовые рамки, в ней всегда будут неоднозначность, неточность, коммуникативные провалы, новые формы и сложные случаи....

Союз рекламистов и потребителей — против плохой рекламы

О том, как усовершенствовать отечественную рекламу и кто в состоянии это обеспечить, рассказывает генеральный директор Рекламного совета России, председатель комитета по рассмотрению обращений и практике применения норм саморегулирования и законодательства Дмитрий Степанович Бадалов.

...О том, как усовершенствовать отечественную рекламу...

...Союз рекламистов и потребителей — против плохой рекламы...

...На самом деле это антиконституционно, потому что в этом есть все-таки элемент цензуры. Но на уровне добровольного согласия на контроль — то есть в плане саморегулирования — это, наверное, возможно. Но и то это вряд ли сработает. Почему? Д. Б....

...Есть общие положения: мы касаемся вопросов этики и морали. В связи с этим процедура является неким подобием суда присяжных, когда присяжные являются одновременно и судьями. В отечественном Кодексе есть обобщающие установки, очень ясные, однако не прописанные конкретно....

...Мало того, у меня есть документы, которые я тоже «скачал» из интернета, где содержится полная непристойность....

...Ведь в Кодексе есть понятие страха, который не должна вызывать реклама. А что в таком случае чувство страха? Д. Б.: Есть некие общие нормы, и они воспринимаются экспертами достаточно адекватно, и при разборе обращений результат нам дает приложение этих норм к конкретике....

...То есть отслеживается реакция кругов, смежных с целевой аудиторией, и в первую очередь детей, которые могут «косвенно» эту рекламу увидеть. Мы от этого довольно далеки....

Лингвисты показали грамматическое разнообразие языков мира

Портал In Science рассказал о базе данных, которую создала международная группа ученых. В этой базе задокументировано грамматическое разнообразие сотен языков мира.

...Портал In Science рассказал о базе данных, которую...

...Лингвисты показали грамматическое разнообразие языков...

...К примеру, во многих языках есть отдельные местоимения «он» или «она», но в других также есть мужские и женские версии слов «я» и «ты».  Более подробно о результатах исследования можно прочитать в журнале Science Advances. ...

Национальный словарный фонд даст пользователям больше, чем просто хорошую библиотеку словарей

Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».

...Появление интернета изменило в том числе и привычные...

...Национальный словарный фонд даст пользователям больше...

...Среди исторических словарей есть словари, созданные в наше время, но описывающие прошлое состояние языка, например «Словарь древнерусского языка» или «Словарь языка Пушкина», а есть исторические словари, созданные раньше....

...Что такое Национальный словарный фонд: концепция и цели Национальные словарные фонды в виде цифровой платформы под разными названиями есть во многих странах, например в Англии, в Германии....

...Есть риск, что наши теоретические подходы и результаты в тот момент, когда они будут переведены на язык программирования, могут не сработать. Но мы рассчитываем и надеемся, что проект будет доведен до конца.  Текст подготовлен на основе передачи «Говорим по-русски!...

...  Есть также возможность обратиться к дополнительным словарям. Опция «Подробнее» позволит сравнить написание слова, ударение или его формы во всех имеющихся словарях. Параметры поиска информации устанавливает пользователь, он может из всех словарей выбрать те, которые ему нужны....

...С другой стороны, есть и практическое соображение: если мы начнем хоть в чем-то улучшать словари, мы не сможем остановиться.  Четыре модуля для пользователей Палитра возможностей, которые мы закладываем в Национальный словарный фонд, обширна. Эти возможности распределены по четырем модулям....

Больше точных совпадений не найдено, показать близкие результаты?

Показать
1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!