Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Одна из целей в обучении иностранному языку — помочь студенту понимать живую речь носителей. Здесь может быть полезен просмотр видео — не только обучающих фрагментов, но и любимых сериалов или фильмов. Вопрос в том, включать ли при этом субтитры на языке оригинала. Один подход заключается в том, чтобы смотреть запись без вспомогательных инструментов, в расчете на то, что студент научится различать знакомые слова на слух и по контексту ...
...Одна из целей в обучении иностранному языку ...
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Чем отличается язык молодежи Традиционные СМИ ориентируются...
Лев Киселев (RE-pac) — популяризатор рэп-фристайла в России. Читает рэп уже лет двадцать, шестнадцать лет занимается фристайлом и почти столько же преподает его, а последние девять лет руководит «Фристайл-мастерской». Кто-то ходит в нее годами, кто-то приходит посмотреть, а кто-то — остается. Грамота расспросила его о том, как научиться рифмовать на ходу и какая от этого польза.
...Лев Киселев (RE-pac) — популяризатор рэп-фристайла...
...Грамота: Что такое рэп-фристайл? Лев Киселев: Фристайл...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
В языках, на которых говорят в промышленно развитых странах, обычно есть около дюжины основных терминов для обозначения цвета, тогда как в языках, на которых говорят более изолированные группы, их часто меньше (вернее, они распределены неравномерно: некоторые части цветового спектра могут почти не иметь соответствующих слов). Это связано с тем, что в жизни людей из этих групп просто нет объектов и ситуаций, которые требуют использования таких слов. Однако владение вторым языком может повлиять на ...
...В языках, на которых говорят в промышленно развитых...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Анализируя опыт защиты родного языка в аудиовизуальных средствах зарубежных стран, обратимся к примеру Франции, которая является одним из пионеров электронных СМИ и где принцип свободы печати был закреплен законом еще в 1881 году. Публичная демонстрация телеприемника состоялась в 1931 году, а в 1935-м Эйфелева башня стала самой мощной телевизионной станцией в мире. Много лет автор этой статьи работал собкором советского телевидения и радио во Франции, и на его глазах формировалась нынешняя система контроля над всей сетью французского телевидения и радиовещания.
...Анализируя опыт защиты родного языка в аудиовизуальных...
...До начала восьмидесятых годов телевидение и радио во...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...