Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Исследование: даже неспециалисты склонны писать законы...
...Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам....
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...Проект по изучению языка Wordfreq закрылся из-за загрязнения...
...Спир также отметила, что данные веб-скрейпинга стало сложнее добывать, так как платформы вроде Twitter (ныне носящий название X) и Reddit начали взимать плату за доступ к своим API....
Благодаря появлению цифровых устройств мы можем читать больше, а доступ к информации у нас есть почти всегда. Но как это влияет на то, насколько хорошо мы понимаем прочитанное? Исследователи из Университета Валенсии (Испания) провели метаанализ (сравнительный обзор) более двух десятков исследований, опубликованных в период с 2000 по 2022 год, в которых приняли участие почти 470 тысяч человек. Во всех работах, вошедших в выборку, их авторы оценивали, насколько хорошо участники понимали ...
...При чтении со смартфона мы усваиваем содержание хуже...
...«Испанские исследователи сравнивали разные данные, полученные на протяжении многих лет, — отмечает она. — Но распространенность цифровых технологий в период с 2000 по 2022 год изменилась, и практики чтения тоже....
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Причем данные не были предварительно размечены — модель сама «догадывалась», как связать видео и звук в единый сюжет. Модель также не была предварительно обучена на каких-либо текстовых данных; она сама выделяла слова из массива аудиоданных....
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...История русской письменности глазами ученых и популяризаторов...
...Затронута проблема докирилловской славянской письменности, по поводу которой существует огромное количество псевдонаучных спекуляций: Истрин критически рассмотрел все данные о так называемых славянских рунах....
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные. Буквы соединяются в слова и предложения, потому что модель оценивает вероятность такого сочетания. Но она не оценивает достоверность и точность указанных сведений....
В России по данным последней переписи населения живет 190 народов, специалисты насчитывают больше 150 языков. Примерно треть из этих языков находится под угрозой исчезновения, поскольку число их носителей сокращается. Вместе с носителями уходит культура, уходят многие традиции и знания. Чтобы затормозить этот процесс и сохранить языковое разнообразие, необходимы специальные усилия. Поддержка языков и культуры коренных народов может принимать очень разные ...
...9 августа отмечается День коренных народов мира...
...Осуществляются масштабные проекты, цель которых — зафиксировать, обработать и сохранить данные о редких языках. Например, в 2025 году ученые намерены привлечь к исследованиям представителей коренных малочисленных народов Севера и Дальнего Востока....
Всем знакома картинка, на которой обезьяна поэтапно превращается в человека, в руках у которого на последней стадии эволюции появляется книга. Мы выбрали пять книг, которые посвящены влиянию чтения на людей, роли библиотек в современном цифровом мире, методам повышения продуктивности чтения и тому, как заинтересовать книгами детей.
...Всем знакома картинка, на которой обезьяна поэтапно...
...Пять вдумчивых книг о чтении для тех, кому интересен...
...Авторы анализируют не только статистические данные, но и социальные, культурные аспекты чтения и взаимодействия с книгой в библиотечном пространстве. Книга вносит вклад в понимание актуальных вызовов и проблем, которые стоят перед библиотеками в современности....
Стилистически окрашенные утвердительные частицы «ок» и «ага» используют в интернет-диалогах едва ли не чаще, чем нейтральное «да». В третьем номере журнала «Труды Института русского языка им. В. В. Виноградова» за 2024 год филолог Елена Шмелева описывает историю этих слов в русском языке и анализирует наиболее частотные конструкции, в которых они употребляются.
...Стилистически окрашенные утвердительные частицы «...
...Как частицы «ок» и «ага» вытеснили обычное «да» в интернет-общении...
...Для анализа Елена Шмелева привлекла материалы Основного корпуса НКРЯ и подкорпуса «Социальные сети», а также данные личной переписки с друзьями и коллегами в мессенджерах....
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Выбор лица: как глагол согласуется с подлежащим типа...
...Исследователям полученные результаты дают интересные данные об асимметрии признаков подлежащего....
...Большое количество оценок позволяет обрабатывать языковые данные с помощью статистических критериев....