Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...устойчивые словосочетания, которые часто встречаются в текстах...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...разметки одних и тех же сущностей в разных текстах...
Когда нужно двоеточие? Ответ на экзамене, за который ставится высокая оценка, включает пункт о двоеточии между обобщающим словом и однородными членами, правило постановки двоеточия в бессоюзном предложении при определенном значении частей и интонации, правила введения в предложение прямой речи. Вспоминают иногда о возможности постановки двоеточия в сложносочиненном предложении (ССП), хотя это и редкий и необязательный знак в ССП.
...Когда нужно двоеточие? Ответ на экзамене, за который...
...nbsp;Розенталем и найденные нами в разных текстах...
...В современных текстах нам не удалось найти примеров...
Считается, что современная молодежь стала меньше читать, но это иллюзия. Разница между поколениями состоит не в том, что молодые люди читают меньше (они читают, и немало), а в том, что они читают другое.
...Считается, что современная молодежь стала меньше читать...
...значения этих слов, потому что встречали их в текстах...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...естественном языке, — обычно обучаются на текстах...
Тексты учебников должны не только соответствовать программе, но и быть доступными, разнообразными по жанрам и стилям, насыщенными актуальной лексикой. Можно ли объективно оценить такие сложные характеристики? Специалисты из Института Пушкина Антонина Лапошина и Мария Лебедева применили количественные методы к анализу учебников русского языка для начальной школы.
...Тексты учебников должны не только соответствовать программе...
...и другие важные элементы обучения; как лексика в текстах...
Как русская языковая картина мира соотносится с мировосприятием носителей других языков и культур? Какие языковые примеры позволяют нам сравнивать картины мира? Как были переосмыслены некоторые заимствованные в русский язык слова? Об этом — лекция доктора филологических наук, члена-корреспондента РАН Алексея Дмитриевича Шмелева.
...Как русская языковая картина мира соотносится с ...
...В церковных текстах его обычно передавали как...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...полагается на вероятность (что в изученных ею текстах...
Откуда в русских словах беглые гласные и как это явление связано с падением редуцированных в древнерусском языке? Объясняет преподаватель Алексей Лебедев в журнале «Наука и жизнь».
...Откуда в русских словах беглые гласные и ...
...Мы видим в старых текстах такое написание знакомых...