НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Благодаря появлению цифровых устройств мы можем читать больше, а доступ к информации у нас есть почти всегда. Но как это влияет на то, насколько хорошо мы понимаем прочитанное? Исследователи из Университета Валенсии (Испания) провели метаанализ (сравнительный обзор) более двух десятков исследований, опубликованных в период с 2000 по 2022 год, в которых приняли участие почти 470 тысяч человек. Во всех работах, вошедших в выборку, их авторы оценивали, насколько хорошо участники понимали ...
...Благодаря появлению цифровых устройств мы можем читать...
Чтения пройдут в смешанном формате и начнутся в 14:00. Очная часть состоится в конференц-зале Института русского языка им. В. В. Виноградова РАН (Москва, ул. Волхонка, 18/2). Ссылка для участия на платформе ZOOM будет разослана дополнительно. Программа чтений опубликована на сайте Института русского языка им. В. В. Виноградова РАН.
...Чтения пройдут в смешанном формате и начнутся в 14:...
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Сложно организованные сообщества требуют сложных систем...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
С 13 октября по 10 ноября 2022 года более 500 преподавателей русского языка из почти 70 стран мира примут участие в дистанционных методических мероприятиях, которые проведут для них российские коллеги: преподаватели известных вузов и успешных языковых школ, авторы и издатели популярных учебных пособий по русскому языку как иностранному (РКИ), опытные специалисты в сфере дистанционного обучения. Методические мероприятия организованы при поддержке Федерального агентства по делам Содружества ...
...С 13 октября по 10 ноября 2022 года более 500 преподавателей...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Омский государственный университет им. Ф. М. Достоевского приглашает принять участие в конференции «Новейшая филология: междисциплинарная парадигма исследований», посвященной памяти профессора Галины Георгиевны Галич. Среди тем, которые предлагаются к обсуждению: жанры письменной речи: историко-культурный и структурно-функциональный аспекты; актуальные направления лингвоантропологии: новое о человеке в языке, речи, тексте; актуальные проблемы ...
...Омский государственный университет им. Ф. ...