Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Во время стрима «Лингвисты о лингвистках. Феминитивы в научном освещении» сотрудники Института языкознания РАН, ведущие подкаста «Глагольная группа» Игорь Исаев и Дмитрий Коломацкий обсудили явление, которое не уходит из новостной повестки и вызывает бесконечные споры. В обсуждении прозвучали экспертные мнения члена-корреспондента РАН Евгения Головко, доктора филологических наук Валерия Ефремова, блогера, преподавателя, автора книги «В начале было кофе» Светланы Гурьяновой, а в дополнительных материалах можно услышать научного сотрудника РГГУ Ирину Фуфаеву и научного сотрудника Института славяноведения РАН Глеба Пилипенко.
...Во время стрима «Лингвисты о лингвистках...
...Что такое феминитивы? С точки зрения лингвистической...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
О реформах русского языка до революции и в советское время и о том, почему необходим общеобязательный свод правил, рассказывает доктор филологических наук Владимир Лопатин.
...О реформах русского языка до революции и в советское...
...Вплоть до конца XIX века никаких систематизированных...
Анализируя опыт защиты родного языка в аудиовизуальных средствах зарубежных стран, обратимся к примеру Франции, которая является одним из пионеров электронных СМИ и где принцип свободы печати был закреплен законом еще в 1881 году. Публичная демонстрация телеприемника состоялась в 1931 году, а в 1935-м Эйфелева башня стала самой мощной телевизионной станцией в мире. Много лет автор этой статьи работал собкором советского телевидения и радио во Франции, и на его глазах формировалась нынешняя система контроля над всей сетью французского телевидения и радиовещания.
...Анализируя опыт защиты родного языка в аудиовизуальных...
...До начала восьмидесятых годов телевидение и радио во...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Дети очень быстро начинают говорить на родном языке, при этом речь взрослых, обращенная к детям, часто бывает обеднена и упрощена. Исследователи обратили внимание на это противоречие и попробовали его объяснить. О том, что помогает ребенку понять устройство языка, доктор филологических наук, заведующая отделом теории грамматики ИЛИ РАН Мария Дмитриевна Воейкова рассказала в докладе «Вспомогательные механизмы языка и их роль в усвоении языка ребенком».
...Дети очень быстро начинают говорить на родном языке...
...Разговаривая с матерью, маленький ребенок получает...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...