Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Текст, написанный нейросетью, прошел в финал литературного конкурса для авторов и чтецов аудиокниг «Проект особого значения». Его цель — поспособствовать популяризации профессии инженера и литературного жанра научной фантастики, а также помочь молодым писателям и чтецам выйти на большую читательскую аудиторию. Организаторы конкурса — АО «ЗАСЛОН» и платформа для digital-авторов «ЛитРес: Самиздат» — специально включили сгенерированный ...
...Текст, написанный нейросетью, прошел в финал литературного...
Зачем вообще люди ругаются нецензурными словами? Что такое языковые табу? Как возникла и развивалась табуированная лексика в русском языке? Почему люди стали чаще пользоваться эвфемизмами вместо мата и хорошо ли это? Все эти волнующие общество темы лингвист, член Орфографической комиссии РАН, доцент кафедры русского языка Московского архитектурного института и эксперт Грамоты Мария Ровинская обсудила с ведущим подкаста Григорием Тарасевичем.
...Зачем вообще люди ругаются нецензурными словами? Что...
...Ведущий сразу предупредил, что матерные слова будут...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
Источники и причины появления новых слов Многие слова, которые мы сегодня воспринимаем как привычные и существовавшие всегда, когда-то были новыми единицами. Так, слово столица образовано от слова стол при помощи суффикса -иц-, но со временем эта связь перестала ощущаться: сегодня мы не видим в слове столица то значение, которое есть у стола. А во многих случаях слова, когда-то послужившие основой для новых, сами ушли из языка: говядина (от ст.-слав. говѩдо — крупный рогатый ...
...Источники и причины появления новых слов Многие слова...
В апреле 1992 года, по старой привычке, включаю радио и слышу беседу двух ученых мужей, Владимира Петровича Нерознака и Михаила Викторовича Горбаневского, о проблемах филологической науки, о проблемах языка, о том, что словарь Владимира Ивановича Даля был издан Обществом любителей российской словесности и хорошо было бы это Общество возродить. Не буду ничего говорить о своих переживаниях в тот момент. Дело в том, что я была уверена: я единственная, кого интересует это Общество...
...В апреле 1992 года, по старой привычке, включаю радио...
...Я позвонила Владимиру Петровичу Нерознаку, в то время...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
В языках, на которых говорят в промышленно развитых странах, обычно есть около дюжины основных терминов для обозначения цвета, тогда как в языках, на которых говорят более изолированные группы, их часто меньше (вернее, они распределены неравномерно: некоторые части цветового спектра могут почти не иметь соответствующих слов). Это связано с тем, что в жизни людей из этих групп просто нет объектов и ситуаций, которые требуют использования таких слов. Однако владение вторым языком может повлиять на ...
...В языках, на которых говорят в промышленно развитых...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...В статье анализируется группа слов, описывающих личные...