«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2023 году были внесены изменения в Федеральный закон «О государственном языке Российской Федерации». Новая редакция предписывает использовать заимствованные слова только в случае отсутствия русских аналогов. О том, как создавался новый нормативный словарь иностранных слов, а также о том, как меняется русский язык, газете «Санкт-Петербургские ведомости» рассказала доктор филологических наук, заместитель директора по научной работе Института лингвистических исследований РАН Марина Приемышева.
...В 2023 году были внесены изменения в Федеральный...
...Цель создания нормативного словаря иностранных слов...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...
Из всех вопросов, на которые справочная служба Грамоты ответила в апреле, мы выбрали три, которые многим могут быть интересны. В них пользователи спрашивают про отдельные слова и формы, но, по сути, затрагивают более широкие проблемы: склонение существительных, омонимию падежей и орфографическое освоение иностранных заимствований.
...Из всех вопросов, на которые справочная служба Грамоты...
...Грамматика Вопрос: Скажите, пожалуйста, слова робот...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
В пресс-конференции РИА «Новости» по случаю Дня родного языка, который отмечается 21 февраля, принимали участие заместитель председателя Совета при Президенте по поддержке русского языка и языков народов России, руководитель Грамоты Константин Деревянко, первый заместитель председателя комитета Госдумы по делам национальностей Ильдар Гильмутдинов, директор Института языкознания РАН, доктор филологических наук Андрей Кибрик и заместитель руководителя Россотрудничества Павел Шевцов. Грамота законспектировала основные тезисы выступавших.
...В пресс-конференции РИА «Новости» по случаю...
...Константин Деревянко: «Стратегия повышения...