НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Во вкладке «Комментарии», как пишут составители, будут представлены материалы двух видов: ответы на популярные вопросы и заметки об орфографии конкретных слов (например, как авторы пришли к определенной форме слова, выбрав из нескольких вариантов); заметки, разъясняющие принципы, устройство и социальную значимость орфографического словаря, его роль как стабилизатора орфографической системы. Эксперты не всегда дают однозначный ответ (что и понятно, если речь ...
...Во вкладке «Комментарии», как пишут составители...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...
Говоря о выборе системы письма, мы не будем затрагивать вопросы исконного, если можно так выразиться, выбора: происхождения систем письма и формирования письменных ареалов. Далее будет говориться лишь о ситуации последних веков, включая современность.
...Говоря о выборе системы письма, мы не будем затрагивать...
...В это время уже не создаются новые системы письма (...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
На обновленной Грамоте образовательное направление становится одним из главных. Мы хотим как можно более понятно и подробно объяснять, как устроены правила, в чем их логика и узкие места, как проще их запомнить. Учебные материалы обращены не только к учителям и школьникам, но и к тем взрослым, кто хочет увереннее себя чувствовать, когда говорит и пишет на родном языке. Мы попросили руководителя направления Марию Юрьевну Лебедеву рассказать о том, как будет устроен образовательный трек.
...На обновленной Грамоте образовательное направление...
...Начну с признания. Русский язык в школе я не очень-то...
О том, как устроена проверка работ Тотального диктанта, по каким критериям его оценивают и как решают спорные вопросы, рассказала главный редактор издательства «Грамота» и председатель московской экспертной комиссии Тотального диктанта Ольга Згировская.
...О том, как устроена проверка работ Тотального...
...Кто проверяет Значительную часть проверяющих составляют...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Зачем вообще люди ругаются нецензурными словами? Что такое языковые табу? Как возникла и развивалась табуированная лексика в русском языке? Почему люди стали чаще пользоваться эвфемизмами вместо мата и хорошо ли это? Все эти волнующие общество темы лингвист, член Орфографической комиссии РАН, доцент кафедры русского языка Московского архитектурного института и эксперт Грамоты Мария Ровинская обсудила с ведущим подкаста Григорием Тарасевичем.
...Зачем вообще люди ругаются нецензурными словами? Что...
...Ведущий сразу предупредил, что матерные слова будут...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...