Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
По случаю Европейского дня языков, который отмечается 26 сентября, социологическая служба Евростат представила последние данные о предпочтениях школьников Евросоюза при выборе второго языка (помимо местного) в качестве обязательного для изучения. Самым популярным оказался английский — это касается и среднего общего, и среднего технического образования. Его выбрали 96,8% и 78,6% соответственно. Второе место в общеобразовательных школах занял испанский язык (26,8%), за ним следуют ...
...По случаю Европейского дня языков, который отмечается...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...
Необходимость заговорить с незнакомым человеком часто ставит нас в тупик. При всем желании найти вежливое, нейтральное, современное и уместное слово получается не всегда. «Товарищ» остался в СССР, «гражданин» звучит тревожно, «господин» режет слух, «женщину» и «мужчину» странно считать обращениями. Приходится признать, что в этом месте в русском языке есть проблема.
...Необходимость заговорить с незнакомым человеком...
...Раньше было проще Чтобы выбрать обращение, мы мгновенно...
Авторская, или писательская, лексикография может быть определена в целом как теория и практика создания словарей языка отдельных авторов. Теория авторской лексикографии охватывает широкий круг проблем: это определение статуса, объема, содержания данного научного направления, прагматической специфики авторских словарей, выявление макро- и микроструктуры таких справочников, их объяснительного аппарата, системно-типологической организации. Сюда же относятся и вопросы истории авторской лексикографии.
...Авторская, или писательская, лексикография может быть...
...Важнейшие характеристики авторской лексикографии В...
Новый перевод классической книги сделан с издания 2007 года и поэтому отражает более актуальные научные данные по сравнению с изданием 1994 года. Научный соредактор книги Валерий Шульгинов, социолингвист, автор телеграм-канала «Лингвоед», рассказал по просьбе Грамоты о том, чем взгляд Пинкера на язык может быть интересен сегодняшним читателям.
...Новый перевод классической книги сделан с ...
...«Язык как инстинкт» Стивена Пинкера, одна...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Чтение как неестественный процесс Многие исследования...