Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...
Подавляющее большинство (96%) женщин, участвовавших в опросе книжного сервиса «Литрес» и платформы для знакомств Mamba, считают привлекательной грамотную речь. Среди участников-мужчин это мнение разделяют 76%. Результаты опроса публикует ТАСС. 63% женщин и 53% мужчин называют уровень грамотности решающим фактором для выбора партнера. Только для 3% женщин этот момент оказался незначимым (среди мужчин таких 23%). Как можно объяснить разницу между мужчинами ...
...Подавляющее большинство (96%) женщин, участвовавших...
В течение первого года жизни нейропластичность максимальна: в это время формируется больше всего новых нейронов и связей между ними. Исследователи давно предполагали, что с самого раннего возраста мозг младенцев, родившихся в монолингвальных и билингвальных семьях, работает по-разному в том, что касается обработки речи. Однако ограничения в технологиях не позволяли понять, что происходит непосредственно в мозге, когда ребенок слышит речь. Группа ...
...В течение первого года жизни нейропластичность...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
В номер вошли статьи, посвященные как современному русскому языку, так и его историческому развитию. Их можно прочитать на сайте журнала.
...В номер вошли статьи, посвященные как современному...
...В новом номере: о возможности создания фитопортретов...