НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Цифровые образовательные материалы получат народы, не имеющие достаточного количества учебников родного языка и литературного чтения. Об этом сообщает ТАСС со ссылкой на пресс-службу издательства «Наука». Суть проекта в том, что активисты-киберволонтеры собирают данные о существующих учебных пособиях, созданных носителями языков и учеными. Эти пособия и другая литература, помогающая сохранять и преподавать языки коренных народов, сначала выпускается ...
...Цифровые образовательные материалы получат народы,...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...
Газета The Sunday Times инициировала масштабную кампанию Get Britain Reading («Пусть Британия читает!») на фоне новых данных, показывающих, что жители страны всех возрастов теперь чаще читают посты в социальных сетях, чем книги. Согласно исследованию, проведенному благотворительной организацией The Reading Agency среди четырех тысяч взрослых британцев, печатные книги выпали из тройки самых популярных форматов чтения у молодых людей до 35 лет. Их
...Газета The Sunday Times инициировала масштабную кампанию...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Далеко не каждый сможет читать серьезную научную литературу, ведь тексты, написанные в научном стиле, ориентированы на специалистов в конкретной области знания. При этом многие люди интересуются науками как любители, увлекаются биологией, астрономией, физикой, историей, лингвистикой, математикой. Для них существуют научно-популярные тексты, в которых научное содержание представлено в яркой и легкой для восприятия форме.
...Далеко не каждый сможет читать серьезную научную литературу...
...Стилистические разногласия Научно-популярный стиль...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...