Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Специалисты в области изучения мозга давно предполагают, что владение двумя и более языками хорошо сказывается на исполнительных функциях (ИФ, англ. executive functions). Это группа процессов, которые регулируют целенаправленное поведение. Благодаря ИФ мы можем переключаться между задачами, тормозить ненужные или неуместные реакции и сосредоточивать внимание на чем-то. Некоторые исследования выявляют связь между ИФ и владением языками, другие не показывают такой связи. Самые убедительные ...
...Специалисты в области изучения мозга давно предполагают...
21 ноября Грамота представила список претендентов на звание «слова года». В него вошли слова, активно используемые в речи и вызывающие интерес у широкой аудитории: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилёт, пов, сап, скуф и нормис. Первоначальный список из 120 слов был сформирован на основе опросов на сайте и в социальных сетях Грамоты, а также анализа текстов СМИ и других источников. Партнером проекта ...
...21 ноября Грамота представила список претендентов...
«Мой авто» или «мое авто»? «Весной» или «весною»? О вариантах нормы и их функции в языковой системе рассказывает статья журнала «Наука и жизнь».
...«Мой авто» или «мое авто»?...
...Языковая норма необходима, чтобы система языка не разрушалась...
С помощью функциональной магнитно-резонансной томографии (фМРТ) нейробиологи ранее уже изучали зоны мозга, ответственные за обработку речи. Но изучить функции нейронов внутри этих областей до недавнего времени было сложно. Дело в том, что фМРТ может показать только интенсивность кровотока в определенных участках, но не активность самих клеток. Теперь же нейробиологи Массачусетского технологического института, используя высокоточную запись электрической активности мозга, определили ...
...С помощью функциональной магнитно-резонансной...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...В статье анализируется группа слов, описывающих личные...