Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Владимир Владимирович был активным участником всех самых главных лингвистических проектов последней трети XX и начала XXI века. Все годы работы нашего портала он был его научным консультантом. Он один из авторов академической «Русской грамматики» 1980 года, обобщившей все достижения отечественного языковедения (авторы «Русской грамматики» были удостоены Государственной премии СССР 1982 года), лингвистического энциклопедического словаря ...
... Владимир Владимирович был активным участником...
Об интересных латинских терминах из области биологии можно узнать в серии статей журнала «Наука и жизнь» (части 1, 2, 3, 4, 5, 6, 7, 8, 9), написанных биологом, автором «Латинско-русского словаря для биологов» Татьяной Подоскиной.
...Об интересных латинских терминах из области биологии...
...Латинский язык, хоть и считается мертвым, используется...
К языку средств массовой информации в последние годы читающей либо слушающей публикой и изучающими его специалистами-филологами предъявляются многочисленные и, увы, чаще всего вполне обоснованные претензии. Публику раздражает или шокирует, а специалистам кажется неоправданным или даже неприемлемым многое: и перенасыщение языка СМИ американизмами, и обилие в нем жаргонной, «блатной» и даже матерной лексики, и нарушение нормального темпа и нормативного интонационного рисунка речи.
...К языку средств массовой информации в последние годы...
...Кое-какие из этих претензий можно счесть, конечно,...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...
В 2028 году Россия и мир будут отмечать двухсотлетие со дня рождения Льва Толстого. Цифровая эпоха, в которую мы живем, дает возможность посмотреть на его жизнь и наследие как на уникальную базу данных. Прочитать забытое и малоизвестное, присмотреться к языку, сопоставить источники, лучше понять его идеи и контекст, в котором они возникли. Руководитель группы Tolstoy Digital Фекла Толстая рассказала Грамоте о проекте «Слово Толстого», в котором соединились ее увлечение цифровыми методами в гуманитарных науках и интерес к семейной истории.
...В 2028 году Россия и мир будут отмечать...
...Грамота: Как возникла идея перевести Толстого в ...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Русский драматург Александр Николаевич Островский был...
...В научной библиотеке Всероссийского театрального общества...