Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...Писатель Шамиль Идиатуллин: «Я был нормальный пацан...
...В «Слове пацана» есть хорошая фактическая...
Известный факт: мы больше доверяем людям, похожим на нас. Это верно и по отношению к тем людям, чья речь похожа на нашу: выбором слов, грамматических конструкций, произношением. Но какие механизмы социальной психологии стоят за этим? Ответить на эти вопросы помогла недавняя работа междисциплинарной исследовательской группы под руководством Терезы Матцингер из Венского университета. Группа рассматривала две версии. Согласно первой, люди доверяют тем, кого интуитивно ...
...Исследование: мы больше доверяем тем людям, чья речь...
...Известный факт: мы больше доверяем людям, похожим на...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Анна Павлова: «Фразеологизмы-конструкции частотны в...
...Синтаксические фразеологизмы-конструкции представляют...
Номер посвящен грамматическим процессам и системам в синхронии и диахронии. Отметим некоторые статьи, которые могут заинтересовать любителей русского языка: о корпусе раннего детского письма, о процессе семантического калькирования в XVIII–XIX веках, о грамматической специфике полонизма «панове / паны рада» ‘члены княжеского/королевского совета, сенаторы’.
...Номер посвящен грамматическим процессам и системам...
...Вышел второй номер журнала «Труды Института русского...
...Чем интересна письменная речь ребенка для лингвиста...
Что такое речевой этикет? Расхожие определения, которые можно нагуглить в интернете, несколько дезориентируют: они сводят речевой этикет к употреблению формул вежливости, типа «спасибо» и «пожалуйста», то есть к знанию определенной, не слишком сложной лексики. Увы, если бы все было так просто! Неочевидные особенности этикетных требований разных культур показывает филолог и переводчик Мария Елифёрова.
...Что такое речевой этикет? Расхожие определения, которые...
...Чем отличаются правила речевого этикета в русских и...
...Говоря о стилях речи, мы чаще всего представляем...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Чат-боты GPT и другие: что думают лингвисты о больших...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Право на имя...
...Выбор имени: родители, святцы и другие алгоритмы...
Поначалу слово из английского, французского или чешского языка кажется знакомым... и тут выясняется, что у него совершенно другое значение — иногда прямо противоположное. Любой, кто имеет дело с иностранными языками, хоть раз попадал впросак из-за «ложных друзей переводчика». Какие языковые процессы приводят к появлению таких слов? Можно ли их распознать и уберечься от ошибок?
...Поначалу слово из английского, французского или чешского...
...Ложные друзья переводчика: когда сходство слов из разных...
...Что это за друзья такие Впервые эту метафору употребили...
— Mama, sprich wie alle! — потребовал пятилетний Марк, сын моей русскоязычной знакомой, вернувшись из детского сада. И перестал разговаривать по-русски. Случай типичный. Ребенок не понимает, зачем ему нужен русский язык. Так возникает первая методическая проблема, с которой сталкивается преподаватель русского языка в диаспоре. Дальше проблемы идут косяком: времени на занятия мало, общение с окружающими ровесниками и взрослыми вытесняет из памяти ребенка язык русскоговорящих родителей.
...— Mama, sprich wie alle! — потребовал...
...«Мама, говори как все!», или Русский язык вне России...
...Как мы ловили идею, которая носится в воздухе Чтобы...