Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Арик Кершенбаум — зоолог из Кембриджского университета, специалист по коммуникации животных. Он изучает волков, гиббонов и дельфинов, чтобы «не только лучше понимать, как они живут и как их сохранить, но и больше узнать об эволюции нашего собственного языка». В его первой книге «Путеводитель зоолога по Галактике» речь шла о возможной жизни на других планетах. В начале 2024 года вышла в свет новая книга — «Почему животные разговаривают». Грамота перевела его интервью, опубликованное в британском издании The Guardian.
...Арик Кершенбаум — зоолог из Кембриджского...
...Почему вы решили написать эту книгу? Моя предыдущая...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Как всегда, статьи номера посвящены проблемам современного русского языка, истории языка и языку художественной литературы. Отметим отдельно три статьи, которые нас заинтересовали.
...Как всегда, статьи номера посвящены проблемам современного...
...О принципах составления нормативных словарей русского...
В новом разделе «Библиотека о Толстом» теперь есть возможность удобного поиска по свидетельствам современников Толстого и исследованиям толстоведов. Пока что в библиотеку включены записи трех важнейших свидетелей жизни Толстого: врача Душана Маковицкого, пианиста Александра Гольденвейзера и жены писателя Софьи Андреевны Толстой, — но коллекция свидетельств будет пополняться. Также у специалистов и любителей будет возможность ...
...В новом разделе «Библиотека о Толстом...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...