Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...И вообще, вот всем этим мусором, который просто у нас в голове застрял. 99% того, что мы делаем, когда пользуемся языком, это вспоминаем: как это было сказано? как это можно воспроизвести?...
...Для нас образцовый язык, тот, который надо изучать, — это язык писателей. Это связано с особенностями русской культуры, с тем, что весь нерв русской жизни был именно в художественной литературе....
...Как нас учили? Модель языка должна описывать не только то, что мы непосредственно зафиксировали в конкретном тексте, но и то, что в принципе может — или не может — быть в языке. И это казалось завораживающе глубокой мыслью....
...Мы легко говорим о том, что уже знаем, что у нас уже есть в голове. Корпус дает нам целую философию: язык — это имитация, грамматики нет. Поэтому он так сильно меняется при межпоколенческой передаче. Поэтому мы так часто ошибаемся, поэтому в языке так много исключений....
...Нас всех учили, что лингвистика — это наука о языке. А почему не о речи? О текстах? Говорят, что тексты вторичны, потому что они построены по правилам языка. Но этих правил никто не видел, и мы даже не знаем, существуют ли они на самом деле, а тексты — вот они, перед нами. В корпусе....
В Российской академии наук подготовлена новая, переработанная и значительно дополненная, редакция «Правил русской орфографии и пунктуации». Работа над ней велась давно, с начала 1990-х годов. Текст правил готовился коллективом специалистов сектора орфографии и орфоэпии Института русского языка им. В. В. Виноградова, а затем — на всех этапах работы — подробно рассматривался, обсуждался на заседаниях Орфографической комиссии при Отделении литературы и языка РАН.
...В Российской академии наук подготовлена новая, переработанная...
...О работе над новой редакцией правил русского правописания...
...Нас обвиняют еще и в келейности, кулуарности работы, в «нечастых публичных выступлениях»....
...Нас никто не торопил, нам ее никто не навязывал — никакого общественно-политического заказа, как в прежние времена, не было....
...Нас упрекают, в частности, в излишней академичности изложения (эти замечания, как и многие другие, мы принимаем с благодарностью)....
...Подготовкой правил правописания, отслеживанием и формулированием орфографических норм традиционно занимается у нас в России Академия наук. Современная русская орфография — результат длительного исторического саморазвития....
...В чем только нас сейчас не обвиняют! В желании угодить властям, выслужиться, заработать политический капитал. В реформаторстве — ведь само слово «реформа» сейчас в устах многих звучит ругательством (хотя, по совести говоря, в нашем проекте едва ли можно усмотреть реформу)....
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Тем самым мы можем сказать, что у нас есть интуитивно правильное описание семантики в математических терминах....
...Мы выбираем некоторое слово, которое нас интересует, и создаем вокруг него окно «видимости» определенного размера (например, пять слов слева и пять слов справа)....
... Например, если мы возьмем вектор слова король, вычтем из него вектор слова мужчина и прибавим вектор слова женщина, у нас получится значение, которое максимально близко к вектору слова королева....
...Каждое из этих чисел отражает совместную встречаемость со словом, которое нас интересует, некоторого другого слова. И, таким образом, все высказывания в некотором наборе текстов превращаются в многомерное пространство, которое мы даже не можем помыслить....
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Как современные технологии помогают оценить сложность...
...Теперь у нас есть возможность собрать большую коллекцию текстов и выявить самые разные, далеко не всегда очевидные, признаки этих текстов....
...Нас не смутят сложные слова (избушка, лукошко и т. п.), устаревшие обороты, необычный порядок слов (в домике том жили три медведя): что-то ребенок поймет из иллюстраций, что-то дофантазирует....
...Например, за рубежом издаются газеты, написанные ясным языком; у нас выпущен гайд Сбербанка, где объясняется, как описывать банковские продукты ясным языком. Значит, в каждом случае будут действовать свои критерии?...
...У нас был случай, когда пользователи пытались определить, для какого возраста оптимальны матерные частушки. Выяснилось, что ученикам начальной школы эти тексты уже вполне по силам. Там действительно сложность низкая: и фразы короткие, и слова частотные, бытовые....
Арик Кершенбаум — зоолог из Кембриджского университета, специалист по коммуникации животных. Он изучает волков, гиббонов и дельфинов, чтобы «не только лучше понимать, как они живут и как их сохранить, но и больше узнать об эволюции нашего собственного языка». В его первой книге «Путеводитель зоолога по Галактике» речь шла о возможной жизни на других планетах. В начале 2024 года вышла в свет новая книга — «Почему животные разговаривают». Грамота перевела его интервью, опубликованное в британском издании The Guardian.
...Арик Кершенбаум — зоолог из Кембриджского...
...Зоолог Арик Кершенбаум: «Мы все хотим знать, что говорят...
...Это просто наблюдаемый факт: мы развили то, чего нет у других животных, а они развили то, чего нет у нас. Было бы здорово иметь крылья, но у нас их нет, и я не расстраиваюсь по этому поводу. Точно так же я не расстраиваюсь, что у животных нет языка....
...» У нас много проблем с сохранением видов, так что было бы полезно услышать от гиббона что-то вроде: «Вот черт, здесь нет еды». Во-вторых, наряду с приходом ИИ мы переживаем экологический кризис....
О том, какие пунктуационные и орфографические «вызовы» требуют решения, ведущая программы Ольга Северская поговорила с членом Орфографической комиссии РАН, доцентом кафедры русского языка МАрхИ и преподавателем НИУ ВШЭ Марией Ровинской.
...О том, какие пунктуационные и орфографические...
...«Говорим по-русски!»: в правилах русской пунктуации...
...Отсюда, например, ненужное обособление обстоятельств: у нас в кафе, (запятая не нужна!) обслуживание по очереди. Нередко люди пытаются оправдаться, говоря об авторской пунктуации, но за ней обязательно должен стоять авторский замысел, идея....
... Коллеге мы скорее простим орфографическую ошибку, которую, вероятно, сочтем опиской; а вот неправильное пунктуационное оформление нас насторожит. Мария Ровинская По мнению Марии Ровинской, существующие академические справочники неполны....
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием....
...Новые возможности восприятия книг: что лучше, буквы...
...Люди привязываются к «материальному носителю», потому что с любимыми книгами нас связывают воспоминания....
... Процессы, сопровождающие чтение И тем не менее, читая сложный текст в шумном месте или пытаясь понять условия договора перед тем, как его подписать, каждый из нас невольно шевелит губами. В книге «Развитие мозга....
Новый выпуск программы «Говорим по-русски!» посвящен двухсотлетию со дня рождения «Евгения Онегина»: 21 мая 1823 года (по новому стилю) А. С. Пушкин начал работу над романом в стихах, совершившим революционный поворот как в литературе, так и в языке. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Новый выпуск программы «Говорим по-русски!»...
...«Говорим по-русски!»: начало работы Пушкина над романом...
...Эльмира Маратовна Афанасьева, доктор филологических наук, главный научный сотрудник Института Пушкина, и Николай Викторович Перцов, доктор филологических наук, главный научный сотрудник ИРЯ РАН, знакомят нас с началом работы А. С....
Русский язык не только вещь в себе, но и вещь в нас и вокруг нас. Меня давно уже интересует проблема взаимодействия русского языка с языками наук, языками искусств и разными видами человеческой деятельности.
...Русский язык не только вещь в себе, но и вещь в нас и вокруг нас. Меня давно уже интересует проблема взаимодействия русского языка с языками наук, языками искусств и разными видами человеческой деятельности....
...Григорий Крейдлин: «Увидеть, как связаны единицы мира...
... dégoût) понятие отвращения связано преимущественно с вкусовыми ощущениями, а у нас отвращение скорее обозначает телесное поведение: тело как бы отворачивается от стимульного объекта....
Грамота поздравляет всех своих друзей, подписчиков и партнеров с наступающим Новым годом! Пусть русский язык по-прежнему нас удивляет, радует, вдохновляет, бросает нам вызов и украшает нашу жизнь! А мы постараемся и дальше пополнять словарные запасы, разрешать ваши сомнения, объяснять правила и рассказывать об увлекательной и не всегда предсказуемой жизни языка. С праздником! Пусть будет много хорошего в новом году!
...С Новым годом!...
...Пусть русский язык по-прежнему нас удивляет, радует, вдохновляет, бросает нам вызов и украшает нашу жизнь! А мы постараемся и дальше пополнять словарные запасы, разрешать ваши сомнения, объяснять правила и рассказывать об увлекательной и не всегда предсказуемой жизни языка. С праздником!...