Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Во вкладке «Комментарии», как пишут составители, будут представлены материалы двух видов: ответы на популярные вопросы и заметки об орфографии конкретных слов (например, как авторы пришли к определенной форме слова, выбрав из нескольких вариантов); заметки, разъясняющие принципы, устройство и социальную значимость орфографического словаря, его роль как стабилизатора орфографической системы. Эксперты не всегда дают однозначный ответ (что и понятно, если речь ...
...Во вкладке «Комментарии», как пишут составители...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...
Вопрос, когда и где зародилась письменность, уже долгие годы является предметом научных дискуссий. Предшественниками письма считаются, например, глиняные таблички, которые древние шумеры оставляли в залог товаров. Их возраст — около десяти тысяч лет. Однако протописьмо, возможно, возникло раньше. На это могут указывать записи в храмовом комплексе Гёбекли-Тепе, изученные археологами из Эдинбургского университета (Великобритания). Постройки Гёбекли-Тепе находятся на ...
...Вопрос, когда и где зародилась письменность, уже...
Разговор в программе «Наблюдатель» начинается с главного вопроса, который задает ведущая Фекла Толстая: есть ли вообще в России диалекты в XXI веке? Что от них осталось? Лингвисты Игорь Исаев (Институт языкознания РАН), Валерий Ефремов (РГПУ им. А. И. Герцена), Александра Ольховская (Институт Пушкина) и Нелли Красовская (ТГПУ им. Л. Н. Толстого) отвечают на этот вопрос по-разному, но очень эмоционально.
...Разговор в программе «Наблюдатель»...
...Когда мы говорим о диалектах, мы отмечаем в ...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Языковеды давно спорят о том, насколько уникальны элементы, составляющие основу человеческой речи. В последние годы появляется всё больше аргументов в пользу того, что речеподобные структуры есть и у других видов. Так, исследования бенгальских вьюрков показывают, что в их пении действуют определенные правила построения последовательностей звуков, которые напоминают базовые принципы человеческой грамматики. Вьюрки не просто издают случайные звуки — их песни состоят из ...
...Языковеды давно спорят о том, насколько уникальны элементы...