Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Как современные технологии помогают оценить сложность...
...Грамота: На что опираются системы оценки сложности/...
Дети очень быстро начинают говорить на родном языке, при этом речь взрослых, обращенная к детям, часто бывает обеднена и упрощена. Исследователи обратили внимание на это противоречие и попробовали его объяснить. О том, что помогает ребенку понять устройство языка, доктор филологических наук, заведующая отделом теории грамматики ИЛИ РАН Мария Дмитриевна Воейкова рассказала в докладе «Вспомогательные механизмы языка и их роль в усвоении языка ребенком».
...Дети очень быстро начинают говорить на родном языке...
...Диминутивы помогают ребенку усваивать язык...
...Разговаривая с матерью, маленький ребенок получает...
Раскройте любое издание, включите любой телеканал — и перед вами развернутся целые миры, о существовании которых вы могли и не подозревать. «Глобальные» претензии современной рекламы (зачастую абсурдные) отображает московский рекламный еженедельник «Экстра М»: «Мир кожи в Сокольниках» и «Электромир», «Мир потолка», «Мир окон» и «Мир ванн» (это названия московских магазинов). Группа компаний «Инрост», продавая обогреватели, зовет в «Мир идеального климата», «Весь мир Canon в магазинах „Конверс“!», «Мир мобильной связи» и «Волшебный мир компьютеров» (это слоганы — рекламные девизы).
...Раскройте любое издание, включите любой телеканал ...
...«Дивный новый мир» российской рекламы: социокультурные...
...Реклама — новая реальность И это современное...
С чем ассоциируется латинский язык у современных молодых людей? Кто-то вспомнит про католическое богослужение. Юристы имеют дело с латынью, когда изучают римское право. Тот, кто интересуется историей, ответит, что латинский — язык древних римлян. Но есть еще один важный аспект: латинский, став международным языком образованных людей, сильно повлиял на русский язык и культуру.
...С чем ассоциируется латинский язык у современных молодых...
...Русская латынь...
...Язык на особом положении Латинский язык присутствует...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Какими методами можно изучать язык животных...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Как лингвистическая экспертиза может повысить качество...
...Грамота: Какие проблемы должна решать лингвистическая...
Как уже все, наверное, слышали, словом года по версии Грамоты стал «вайб», а в отдельных номинациях победили «промпт», «маркетплейс», «подкаст» и «микроРНК». Мы попросили наблюдателей и участников акции поделиться впечатлениями и подвести предварительные итоги.
...Как уже все, наверное, слышали, словом года по версии...
...Грамота выбрала слово года. И как оно вам?...
...Дмитрий Смиркин, директор по связям с общественностью...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Русский как индоевропейский: общие корни заметны даже...
...Индоевропейские языки и другие языковые семьи...