Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...понимания масштаба работы, которую новая разработка может...
Книга филолога, прозаика и литературного критика, заслуженного профессора МГУ Владимира Новикова «Слов модных полный лексикон» рассказывает о новых словах и выражениях, которые вошли в моду в первой четверти XXI века. Из нее можно узнать не только о лексических новациях последних лет, но и о том, какие слова были в ходу еще недавно.
...Книга филолога, прозаика и литературного критика, заслуженного...
...Никто не может точно предсказать, какие модные слова...
... Даже «несимпатичное» слово может...
...Слово может быть переосмыслено: так, Владимир...
Новое золото, белая изба и треугольные конверты — все эти реалии остались в прошлом, поэтому смысл многих строк не только у Лескова или Грибоедова, но даже у Высоцкого может быть непонятен современному читателю. Некоторые отгадки предлагает статья в журнале «Наука и жизнь».
...Новое золото, белая изба и треугольные конверты &mdash...
...Со временем значение многих слов меняется, что может...
В любом высказывании есть информация, которая не выражается никакими материальными знаками, а вычисляется слушателем. От нее зависит глубина понимания этого высказывания, а иногда и дальнейшие действия участников коммуникации. Одна из областей, где слушателю нужно приложить усилия для понимания предложения, — «восстановление» невыраженных субъектов. По каким правилам это делается и как их применять? Об этом Грамоте рассказала доктор филологических наук Галина Ивановна Кустова.
...В любом высказывании есть информация, которая...
...nbsp;другом, то при неличной форме глагола субъект может...
...Например, субъект инфинитива может совпадать с ...
...предикатива и инфинитива: у предикатива может...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...пояснений узкоспециальных фактов как общеизвестных может...
...Случайный посетитель может остаться и подписаться &...
...mdash; а может уйти к тому, кто пишет живее, понятнее...
Самые простые и распространенные пиктограммы могут стать источником неловкости в общении. Но и совсем отказаться от эмодзи было бы обидно — они делают наши послания и реакции более живыми, эмоциональными, облегчают контакт, помогают «не отстать от жизни». Тогда как нам ориентироваться в этом вавилонском столпотворении символов? Как общаться на языке эмодзи, не рискуя быть неправильно понятым?
...Самые простые и распространенные пиктограммы могут...
...Такой подход может показаться перестраховкой, но он...
...А старшим стоит помнить, что молодежь может приписать...
...Пример использования: может кто-то подсказать, что...
Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или ...
...сдержанна, чем русская, где восклицательный знак может...
...восклицательный знак при переводе на французский может...
...» во французском переводе может стать нейтральным...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В частности, это может проявляться в обилии...
...Нейросеть может лишь воспроизводить уже готовые идеи...
... Также нейросеть может избыточно использовать...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...способов обозначения эмоций в разных языках может...
...Например, испанское слово malo может значить &lsquo...
...их недостаточной полнотой и чистотой), а может...
Перемены в языке не в последнюю очередь связаны с переменами в обществе. Подтверждение этому тезису можно найти как в истории, так и в окружающей нас действительности. Газеты, радио, телевидение сыплют «пиарами», «траншами», реклама глушит «чумовыми джок-дайлами», «офшорами» и «таймшерами». Мы все больше привыкаем к вхождению в наш повседневный язык большого количества новых слов иноязычного происхождения, но, привыкая к ним, хорошо бы отдавать себе отчет в правильности и уместности их употребления, а зачастую и в элементарном понимании значения того или иного слова.
...Перемены в языке не в последнюю очередь связаны...
...Иноязычный компонент может представлять собой чистую...
...Двуязычное дублирование может представлять собой и&...
...Иноязычное влияние может встречаться в тексте...