Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
18 декабря в пространстве «Кибердом» были названы победители конкурса лучших сайтов и приложений российского сегмента интернета. Конкурс «Золотой сайт + золотое приложение» проводится ежегодно с 1997 года, но в этом году награду вручали за достижения 2023 года, когда состоялся перезапуск Грамоты. Сайты-претенденты оценивает жюри, состоящее из профессионалов отрасли. В конкурсе 88 разных номинаций, Грамота участвовала ...
...18 декабря в пространстве «Кибердом...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Долгое время среди научных журналистов и даже среди лингвистов была популярна идея «серебряной пули». Считалось, что уникальная языковая способность человека возникла благодаря одному конкретному событию — например, случайной генетической мутации. Эта теория объясняла язык как внезапно возникший инстинкт, но оставляла за скобками вопрос: почему другие животные, обладающие развитым мозгом, так и не заговорили. Новая работа, опубликованная в
...Долгое время среди научных журналистов и даже...
31 июля завершилась XXI Международная олимпиада по лингвистике. Представлявшая Россию команда «Белка», в состав которой вошли ученики московских школ, завоевала четыре награды (два «серебра» и две «бронзы») и вышла на второе место по среднему баллу участников. Соревнование для школьников из 36 стран проходило в Бразилии. Во время первого (индивидуального) тура участникам нужно было выполнить пять лингвистических ...
...31 июля завершилась XXI Международная...
Ситуация не такая уж редкая: девушка из России выходит замуж за иностранца, уезжает в другую страну, и там молодая семья ждет ребенка. Больше других волнуется будущая бабушка Т. М.: «Ребенку придется учиться говорить сразу на двух языках. Не повредит ли это его развитию?» На письмо обеспокоенной бабушки ответила психолингвист Ирина Михайловна Румянцева. С разрешения автора письма и Т. М. публикуем его почти полностью.
...Ситуация не такая уж редкая: девушка из России выходит...
...Уважаемая Т. М., ... тронута тем, что внучка...
В 2028 году Россия и мир будут отмечать двухсотлетие со дня рождения Льва Толстого. Цифровая эпоха, в которую мы живем, дает возможность посмотреть на его жизнь и наследие как на уникальную базу данных. Прочитать забытое и малоизвестное, присмотреться к языку, сопоставить источники, лучше понять его идеи и контекст, в котором они возникли. Руководитель группы Tolstoy Digital Фекла Толстая рассказала Грамоте о проекте «Слово Толстого», в котором соединились ее увлечение цифровыми методами в гуманитарных науках и интерес к семейной истории.
...В 2028 году Россия и мир будут отмечать...
...Грамота: Как возникла идея перевести Толстого в ...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Когда мы много знаем о какой-то теме, бывает трудно написать о ней так, чтобы наша мысль была понятна неспециалисту. Когнитивный психолог и психолингвист Стивен Пинкер предлагает несколько стратегий улучшения качества письма, которые помогут писать ясные и эффективные тексты с учетом разницы в картине мира между экспертом и его аудиторией.
...Когда мы много знаем о какой-то теме, бывает трудно...
...Стивен Пинкер известен своими увлекательными рассуждениями...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...Исследователь Института Макса Планка Олег Собчук в&...