Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Грамота: Все, кто работает с языком как исследователи...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Нейросети проиграли людям при поиске грамматических...
...Большие языковые модели (чат-боты на основе искусственного...
Предлагаем вниманию читателей статью Сергея Петровича Обнорского, опубликованную в журнале «Русский язык в школе» (№ 5–6, 1939). Статья представляет собой текст доклада, прочитанного на заседании Правительственной комиссии по разработке единой орфографии и пунктуации 7 октября 1939 года. В этой работе рассматриваются спорные орфографические вопросы, стоявшие перед лингвистами в 1930-е годы, при подготовке общеобязательного свода правил русского правописания.
...Предлагаем вниманию читателей статью Сергея Петровича...
...Основные принципы орфографической нормализации...
...Предисловие «Грамоты.ру» Сергей Петрович...
Когда взрослые разговаривают друг с другом, они опираются на свои знания и предположения о том, как и о чем будет (скорее всего) говорить другой человек. Это облегчает им задачу по расшифровке звуковой информации, особенно когда голос собеседника приглушен, плохо слышен на фоне шума, речь неразборчива или ее пониманию мешает сильный акцент. В новом исследовании Массачусетского технологического института и Гарвардского университета, опубликованном в журнале Nature Human ...
...Как взрослые понимают бессвязную речь маленького ребенка...
...Когда взрослые разговаривают друг с другом, они опираются...
Как бы преподаватель ни относился к заимствованным словам, он должен научить студента правильно и уместно пользоваться этой лексикой. Для этого нужно объяснять не только значения заимствованных слов, но и их сочетаемость, системно-языковые отношения с синонимами, антонимами, родо-видовыми и тематическими включениями в родственные лексические группы.
...Как бы преподаватель ни относился к заимствованным...
...Заимствованная лексика в преподавании русского языка...
...В последние десятилетия русский литературный язык испытывает...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...К двухсотлетию со дня рождения Владимира Ивановича...
...Весть из Вермонта В конце 1989 года в «Литературной...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...Существует ли авторская пунктуация?...
...За прошедшие десять лет интернет вырос многократно,...
Российская Федерация — многонациональное государство. На ее территории функционируют более 150 языков, из которых около ста — языки коренных народов России, остальные — это языки компактно или диаспорно проживающих некоренных этносов. Полиэтничность Российского государства выражена в начальных строках Конституции: «Мы — многонациональный народ России».
...Российская Федерация — многонациональное...
...Этнокультурная и языковая ситуация в современной России...
...Государственно-политические аспекты лингвокультурной...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...22 января лингвист Александр Пиперски подведет лингвистические...
...2023 год стал вызовом для наук о языке во...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Российская нейросеть превзошла конкурента от OpenAI...
...Сравнение двух языковых моделей проводили методом Side-by-Side...