Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Зоны мозга, связанные с обработкой речи, почти не «подают голос», когда мы читаем грамматически простые и понятные предложения. Однако их активность возрастает, когда мы продираемся сквозь сложный текст. Но насколько сложным он должен быть? Исследователи из Массачусетского технологического института решили проверить, как речевые зоны реагируют на фразы разной сложности. Для начала они выбрали 1000 предложений из художественной литературы, расшифровок устной речи, текстов ...
...Зоны мозга, связанные с обработкой речи, почти не &...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...
В рамках научных мероприятий, посвященных трехсотлетию Российской академии наук, 25 октября 2024 года в новосибирском Академгородке пройдет круглый стол «Русская языковая личность в межнациональном общении». Среди ключевых тем круглого стола: вклад отечественной междисциплинарной науки в изучение вербальной культуры; разработка теоретических подходов и методов для изучения языка и типологии русской языковой личности в контексте ...
...В рамках научных мероприятий, посвященных трехсотлетию...
«Газета.ру» пишет об исследовании тавтологии, опубликованном в научном журнале Journal of Pragmatics. Его авторы — сотрудники Санкт-Петербургского государственного университета, Мадридского университета Комплутенсе (Испания) и Высшей школы экономики (Москва) Елена Вилинбахова, Виктория Эскандель-Видаль и Наталья Зевахина.
...«Газета.ру» пишет об исследовании тавтологии...
...Лингвисты провели эксперимент, в основе которого...
Языковеды давно спорят о том, насколько уникальны элементы, составляющие основу человеческой речи. В последние годы появляется всё больше аргументов в пользу того, что речеподобные структуры есть и у других видов. Так, исследования бенгальских вьюрков показывают, что в их пении действуют определенные правила построения последовательностей звуков, которые напоминают базовые принципы человеческой грамматики. Вьюрки не просто издают случайные звуки — их песни состоят из ...
...Языковеды давно спорят о том, насколько уникальны элементы...
Компания «Яндекс» начала набор школьных учителей для участия в проекте по дообучению нейросети «Алиса». Об этом стало известно из размещенных интернет-компанией вакансий. Согласно опубликованной информации, требуются специалисты по математике, литературе, английскому языку и истории. Педагоги будут выполнять функции ИИ-тренеров в рамках образовательного направления проекта. От кандидатов требуется знание методики преподавания и
...Компания «Яндекс» начала набор школьных...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...