Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
Научный руководитель Грамоты, председатель Филологического совета Тотального диктанта Владимир Пахомов рассказал изданию Lenta.ru, почему не состоялась реформа русской орфографии 1964 года и стоит ли ожидать кардинальных изменений правил правописания в ближайшем будущем.
...Научный руководитель Грамоты, председатель Филологического...
...В 1960-е годы в реформе русской орфографии...
3 октября в Москве стартует Форум классных руководителей. Он пройдет уже в третий раз и соберет 3000 педагогов и кураторов групп профессионального образования из всех регионов страны. Программа Форума посвящена актуальным вопросам педагогики и воспитания, разным сферам деятельности классного руководителя или куратора группы в СПО. Спикерами и экспертами выступят специалисты в различных областях. Форум пройдет в две смены: 3–5 октября — для классных руководителей 1–6-х ...
...3 октября в Москве стартует Форум классных руководителей...
5 апреля стали известны имена победителей и призеров Всероссийской олимпиады «Символы России. Русский язык: история письменности». Их список опубликован на сайте Российской государственной детской библиотеки, которая выступает соучредителем олимпиады. Участники олимпиады соревновались в двух возрастных категориях, 10–12 лет и 13–16 лет. На втором, финальном этапе старшим предлагалось ответить, среди прочих, на такие вопросы. К
...5 апреля стали известны имена победителей и ...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
Сто баллов за единый государственный экзамен (ЕГЭ) по русскому языку получили 2636 выпускников. Такие данные привел руководитель комиссии разработчиков контрольных измерительных материалов ЕГЭ Роман Дощинский на пресс-конференции Рособрнадзора. Это на 12,5% меньше, чем в прошлом году: тогда высший балл получили 3014 человек. Впрочем, в 2022 году стобалльников было еще меньше — 2375 человек. Роман Дощинский обратил внимание на высокий уровень освоения ...
...Сто баллов за единый государственный экзамен (ЕГЭ)...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...