Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
17–19 ноября 2022 года в Институте языкознания РАН прошла международная конференция «Лингвистический форум 2022: традиционные речевые формы и практики». Конференция относится к серии ежегодных лингвистических форумов, начатых Институтом языкознания в 2019 году и посвященных каждый раз тому или иному общественно значимому вопросу лингвистической науки. Первый форум 2019 года «Коренные языки России и мира» был связан с Годом коренных языков ООН. Форум 2020 года «
...17–19 ноября 2022 года в Институте языкознания...
В русском языке большинство русских фамилий склоняются, а вот с иностранными ситуация более сложная. В любом случае несклоняемыми чаще оказываются женские фамилии, чем мужские. Попробуем выделить несколько случаев, когда фамилия сохраняет неизменный вид во всех падежах.
...В русском языке большинство русских фамилий склоняются...
...Женские фамилии Все женские фамилии, оканчивающиеся...
Источники и причины появления новых слов Многие слова, которые мы сегодня воспринимаем как привычные и существовавшие всегда, когда-то были новыми единицами. Так, слово столица образовано от слова стол при помощи суффикса -иц-, но со временем эта связь перестала ощущаться: сегодня мы не видим в слове столица то значение, которое есть у стола. А во многих случаях слова, когда-то послужившие основой для новых, сами ушли из языка: говядина (от ст.-слав. говѩдо — крупный рогатый ...
...Источники и причины появления новых слов Многие слова...
Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало. Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных ...
...Современные программы, которые генерируют тексты, научились...
1 декабря, в воскресенье, в здании факультета гуманитарных наук НИУ ВШЭ пройдет уже восемнадцатый по счету Московский фестиваль языков. Это событие объединяет тех, кто увлечен изучением языков, их историей и культурой. Гости фестиваля смогут познакомиться с десятками языков — как широко распространенных, так и редких. В программу включены лекции о лингвистике, письменностях, взаимосвязи языка и мышления, культуры, политики. Среди ...
...1 декабря, в воскресенье, в здании факультета...
Товарные знаки, нарушающие правила орфографии, деструктивно воздействуют на грамотность потребителя, а значит, могут быть приравнены к аморальным. Такое решение принял российский специализированный суд по интеллектуальным правам в России, сообщает Агентство правовой информации. Компания «Колос» обратилась в Роспатент с заявкой на регистрацию бренда алкогольной продукции «чöрная щука» (вместо буквы ё авторы употребили о-умлаут), но получила отказ. Ведомство ...
...Товарные знаки, нарушающие правила орфографии, деструктивно...
После того как в среду, 22 ноября, портал Грамоты был перезапущен в новом дизайне и с новой поисковой системой, команда внимательно следила за реакцией пользователей. Анализ обратной связи позволяет нам совершенствовать работу портала. Вот некоторые изменения, которые были внесены: большинство ссылок и редиректов стали работать корректно; снижен порог, отсекающий в выдаче нерелевантные ответы справочной службы, — теперь пользователи видят гораздо больше ответов;
...После того как в среду, 22 ноября, портал Грамоты был...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...