Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты Школы лингвистики ВШЭ и других вузов. Школьники получают представление о разнообразии естественных языков, лингвистической типологии, современных достижениях фонетики, морфологии, синтаксиса, семантики, социолингвистики. Слушатели погружаются в проблемы современной компьютерной лингвистики, знакомятся с машинным обучением и его использованием в изучении языка. Занятия бесплатные. Актуальная информация о семинарах публикуется в группе ...
...Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты...
В последние годы благодаря развитию технологий нам удается узнать больше о коммуникации живых существ — от обезьян до птиц. В новом исследовании специалисты разобрались в том, как общаются между собой рыбы — красные груперы из семейства каменных окуней. Многие виды рыб используют звуки, но связать конкретный сигнал с определенным социальным поведением раньше было трудно. В новой работе научная группа из США и Пуэрто-Рико ...
...В последние годы благодаря развитию технологий...
В любом высказывании есть информация, которая не выражается никакими материальными знаками, а вычисляется слушателем. От нее зависит глубина понимания этого высказывания, а иногда и дальнейшие действия участников коммуникации. Одна из областей, где слушателю нужно приложить усилия для понимания предложения, — «восстановление» невыраженных субъектов. По каким правилам это делается и как их применять? Об этом Грамоте рассказала доктор филологических наук Галина Ивановна Кустова.
...В любом высказывании есть информация, которая...
...Проезжаю я, а слетает шляпа: где искать субъекта...
— Mama, sprich wie alle! — потребовал пятилетний Марк, сын моей русскоязычной знакомой, вернувшись из детского сада. И перестал разговаривать по-русски. Случай типичный. Ребенок не понимает, зачем ему нужен русский язык. Так возникает первая методическая проблема, с которой сталкивается преподаватель русского языка в диаспоре. Дальше проблемы идут косяком: времени на занятия мало, общение с окружающими ровесниками и взрослыми вытесняет из памяти ребенка язык русскоговорящих родителей.
...— Mama, sprich wie alle! — потребовал...
...Как мы ловили идею, которая носится в воздухе Чтобы...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Среди традиционно спорных вопросов перевода — вопрос о том, допустимо ли вторгаться в структуру фраз оригинала. Искусство в этом, как и в других вопросах, вроде соотношения точности и свободы в переводе, состоит в том, чтобы умело лавировать между двумя крайностями. Как именно происходит непростой выбор формы и какими соображениями руководствуются переводчики, рассказывает переводчик с французского Наталья Мавлевич.
...Среди традиционно спорных вопросов перевода &mdash...
...Надо ли подстригать фразы оригинала, как деревья в&...
Команда ученых из Италии, США и Швейцарии проверила, насколько хорошо большим языковым моделям удается убеждать собеседников в своей правоте. Авторы привлекли к участию 900 жителей США. Каждому из них случайным образом выдали собеседника (это мог быть другой участник или чат GPT-4), тему и задачу — защищать или оспаривать предложенный тезис. Также в одном из вариантов участнику (человеку или чат-боту) была заранее доступна информация о
...Команда ученых из Италии, США и Швейцарии проверила...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...