Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В новый год — с новым проектом! Институт русского языка им. В. В. Виноградова РАН в рамках сотрудничества с Государственным институтом русского языка им. А. С. Пушкина создает видеоверсию программы «Говорим по-русски!» — о новом и интересном в русистике, в русском языке и его преподавании. С ведущим научным сотрудником ИРЯ РАН Ольгой Северской будут беседовать исследователи и преподаватели лучших центров развития русистики. Запуск проекта намечен на январь 2023 ...
...В новый год — с новым проектом! Институт русского...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Необходимость заговорить с незнакомым человеком часто ставит нас в тупик. При всем желании найти вежливое, нейтральное, современное и уместное слово получается не всегда. «Товарищ» остался в СССР, «гражданин» звучит тревожно, «господин» режет слух, «женщину» и «мужчину» странно считать обращениями. Приходится признать, что в этом месте в русском языке есть проблема.
...Необходимость заговорить с незнакомым человеком...
...Раньше было проще Чтобы выбрать обращение, мы мгновенно...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
Новый перевод классической книги сделан с издания 2007 года и поэтому отражает более актуальные научные данные по сравнению с изданием 1994 года. Научный соредактор книги Валерий Шульгинов, социолингвист, автор телеграм-канала «Лингвоед», рассказал по просьбе Грамоты о том, чем взгляд Пинкера на язык может быть интересен сегодняшним читателям.
...Новый перевод классической книги сделан с ...
...«Язык как инстинкт» Стивена Пинкера, одна...