Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Один из способов пополнения словарного запаса языка — эпонимия. «Эпоним» буквально переводится с греческого как «дающий имя», и когда-то это слово обозначало мифическое или историческое лицо, в честь которого назвали страну, город или народ. Какими путями возникали эпонимы в русском и других языках и в каких группах имен встречается особенно много эпонимов? Рассказывает лингвист и переводчик Мария Елифёрова.
...Один из способов пополнения словарного запаса языка...
...В этом смысле принято говорить, что Александр Македонский...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
Специалисты компании «Яндекс» научили нейросеть создавать выжимку из текстов на русском языке и представлять его основные идеи в виде тезисов. Статью объемом до 30 тысяч знаков можно сократить до небольшого конспекта в 300–1000 знаков. Протестировать функцию может любой желающий, зайдя через «Яндекс.Браузер» на сайт 300.ya.ru. Нужно просто загрузить ссылку на нужный материал, и нейросеть переработает его. Тезисы появятся в том же окне. Ссылку на краткое содержание ...
...Специалисты компании «Яндекс» научили нейросеть...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
В рамках исследования авторы работы (сотрудники двух факультетов МГУ — иностранных языков и регионоведения, вычислительной математики и кибернетики) протестировали способность пяти ведущих больших языковых моделей — ChatGPT-4, Gemini-pro-1.5, Claude 3 Opus, Llama3-70b и Microsoft Phi-3 — выполнять письменные задания из популярных учебников, выпущенных издательствами Oxford University Press и Pearson Education. Моделям требовалось выполнить следующие ...
...В рамках исследования авторы работы (сотрудники...
В Институте русского языка имени В. В. Виноградова РАН состоится масштабное теоретико-практическое мероприятие, посвященное цифровой лексикографии и ее применению в лингвистических исследованиях. Организаторы — Сектор типологии Института языкознания РАН совместно с Отделом корпусной лингвистики и лингвистической поэтики ИРЯ РАН. В состав программного комитета вошли Владимир Плунгян, Лариса Шестакова, Анна Кулева и Юрий Макаров.
...В Институте русского языка имени В. В. ...
Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало. Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных ...
...Современные программы, которые генерируют тексты, научились...