НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Чтобы правильно диагностировать у ребенка затруднения при чтении, необходима консультация специалиста. Но тревога родителей по этому поводу тоже может быть довольно точным индикатором наличия проблем, выяснили исследователи Университета Западного Онтарио (Канада). В исследовании принимали участие 34 школы Онтарио. Авторы работы обратились к родителям учащихся и попросили заполнить анкету об академическом развитии их детей. Параллельно дети проходили стандартизированные тесты на чтение и ...
...Чтобы правильно диагностировать у ребенка затруднения...
Преподаватели Чувашского государственного университета им. И. Н. Ульянова разработали обучающие курсы чувашского языка на платформе Сбербанка Edutoria. Об этом 5 июля сообщила пресс-служба администрации главы республики. Курс «Чувашский язык» состоит из 13 лекций. Также на платформе можно пройти курс «История и культура Чувашии» — для тех, кто хочет ознакомиться с основными теориями происхождения чувашского народа, историей Чувашии, кто желает прикоснуться к ее ...
...Преподаватели Чувашского государственного университета...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Даже тот, кто не посвятил жизнь науке, сталкивается с текстами, написанными в научном стиле. Любой реферат или доклад, учебник или научно-популярный блог использует особые языковые средства, которые отвечают его задачам. Текст в этом функциональном стиле не просто передает информацию, но стремится доказать ее истинность, ценность, а во многих случаях и новизну.
...Даже тот, кто не посвятил жизнь науке, сталкивается...
...Три подстиля для разных задач Традиционно выделяют...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Слово препинание связано с церковнославянским глаголом прѣпинати ‘препятствовать, задерживать’. Таким образом, знаки препинания призваны служить сигналами паузы, заминки, остановки перед каким-либо препятствием, возникшим на пути плавного течения речи. Однако они нередко становятся «знаками преткновения»: если в области орфографии лишь немногие правила остаются неизвестны или не вполне ясны большинству выпускников средней школы, то пунктуация представляет для многих из ...
...Слово препинание связано с церковнославянским глаголом...