Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Использование иностранных слов в современной российской жизни абсолютно закономерно и связано с прогрессом. Но не всякое значение употребляемых иностранных слов понятно, особенно для массового восприятия. Прежде всего это относится к узкопрофессиональным словам. Впрочем, неясными порой оказываются слова, политически и экономически предназначенные для активного употребления в самых широких слоях.
...Использование иностранных слов в современной российской...
...Русская речь в последнее время пополнилась и ...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
В интернете мы ведем диалоги и групповые беседы, обмениваясь текстовыми сообщениями. Как отмечают лингвисты, технологический прогресс породил новый вариант языка — устно-письменный язык интернета. Об особенностях этого явления рассказала доктор филологических наук Наталья Клушина в новом выпуске «Трудов Института русского языка им. В. В. Виноградова».
...В интернете мы ведем диалоги и групповые...
...Главная особенность коммуникации в интернете ...
К числу включенных в декабре 2023 года слов, называющих актуальные явления и предметы, относятся, например, датасет, ИИ, ИТ-профессия, ИТ-специалист, косплей, косплейный, косплеер, майнинг, маркетплейс, медиакарта, мурал, инвестиционно привлекательный. Словарь также пополнили термины разных специальностей и областей знания, например: благополучатель, инофон (человек, не владеющий русским языком, для которого русский язык неродной, дети-инофоны), каподастр (ограничитель на грифе ...
...К числу включенных в декабре 2023 года слов, называющих...
Департамент оценки и методологии АНО «Россия — страна возможностей» провел второе исследование (с 2020 года), чтобы выявить ключевые надпрофессиональные компетенции, максимально востребованные ведущими работодателями России. Впервые в базовый профиль вошел критерий «языковая грамотность». Базовый профиль — это компетенции, которые респонденты в целом посчитали наиболее существенными или критичными для успешной ...
...Департамент оценки и методологии АНО «Россия...
Предлагаем вниманию читателей статью Сергея Петровича Обнорского, опубликованную в журнале «Русский язык в школе» (№ 5–6, 1939). Статья представляет собой текст доклада, прочитанного на заседании Правительственной комиссии по разработке единой орфографии и пунктуации 7 октября 1939 года. В этой работе рассматриваются спорные орфографические вопросы, стоявшие перед лингвистами в 1930-е годы, при подготовке общеобязательного свода правил русского правописания.
...Предлагаем вниманию читателей статью Сергея Петровича...
...Предисловие «Грамоты.ру» Сергей Петрович...
Специалисты из Нью-Йоркского университета (NYU) предложили инновационный подход к пониманию многоязычия. Они разработали математическую формулу, которая позволяет оценить «интенсивность» и сбалансированность языкового опыта. Долгое время в лингвистике термин «билингв» использовался как бинарный показатель: человек либо владеет несколькими языками, либо нет. Однако такой подход не учитывает реальность, в которой один человек может свободно говорить ...
...Специалисты из Нью-Йоркского университета (NYU...
В связи с шестидесятилетием действующих правил правописания предлагаем вниманию читателей архивную статью Сергея Ефимовича Крючкова, опубликованную 26 мая 1956 года в «Учительской газете». В этой статье сообщается об утверждении нового свода правил русского правописания, который официально действует до сих пор (сам свод правил был принят весной и издан в августе 1956 года, к началу нового учебного года). Автор рассказывает о принципах унификации правописания, о практических шагах по введению нового свода.
...В связи с шестидесятилетием действующих правил правописания...
...Предисловие «Грамоты.ру» Сергей Ефимович...