Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Грамота: Все, кто работает с языком как исследователи...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Ученые уточнили место и время появления индоевропейской...
...Происхождение индоевропейских языков остается дискуссионным...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...«Заговори, чтобы я тебя увидел»...
...Исследователь Института Макса Планка Олег Собчук в&...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...Вышел четвертый номер журнала «Русская речь» за 2023...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова напоминает об авторе текста эпитафии на Пискаревском кладбище, поэтессе Ольге Берггольц, а также рассказывает о других ленинградских деятелях культуры.
...Ведущая рубрики «Русский устный», член редакционного...
...Ольга Берггольц...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...Нейросеть — слово 2023 года по версии Грамоты...
...В этом году наш портал впервые провел собственную акцию...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...Прогноз: текстовые данные для обучения нейросетей могут...
...В течение многих лет такие компании, как OpenAI...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Ольга Крючкова: «Работа по сбору и сохранению диалектной...
...Диалектный корпус позволяет ставить и решать новые...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Бумага или «цифра»? Влияние формата чтения на понимание...
...Чтение как неестественный процесс Многие исследования...