Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
С помощью функциональной магнитно-резонансной томографии (фМРТ) нейробиологи ранее уже изучали зоны мозга, ответственные за обработку речи. Но изучить функции нейронов внутри этих областей до недавнего времени было сложно. Дело в том, что фМРТ может показать только интенсивность кровотока в определенных участках, но не активность самих клеток. Теперь же нейробиологи Массачусетского технологического института, используя высокоточную запись электрической активности мозга, определили ...
...С помощью функциональной магнитно-резонансной...
Правила, сформулированные в 1956 году, требовали уточнения. Журнал «Наука и жизнь» публикует обзор нового академического справочника по орфографии и пунктуации, написанный редактором этого издания Владимиром Владимировичем Лопатиным.
...Правила, сформулированные в 1956 году, требовали уточнения...
...Пособие «Правила русской орфографии и пунктуации...
В июне правительство РФ приняло Концепцию государственной языковой политики. Его разработка была инициирована президентом РФ в 2019 году. Концепция подтверждает особую роль русского языка как государственного и настрой государства на сохранение языкового разнообразия. Грамота напоминает основные вехи российской и советской языковой политики и приводит мнения экспертов о новом документе.
...В июне правительство РФ приняло Концепцию государственной...
...Русификация и коренизация «На протяжении...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Профессиональный жаргон — это особая смесь из необычных слов, нестандартных ударений, странных сокращений и смешных идиом. Это словесные шифры, которые обычно понимают только свои. Угадать, кто такой «бобик» или «ходуля», невозможно. Как устроены птичьи языки разных профессий и чем они отличаются от стандартного литературного языка?
...Профессиональный жаргон — это особая смесь...
...Язык как средство социальной идентификации Язык, как...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
Издательство «Грамота» выпустило новый словарь для 5–9-х классов. Его придумали и подготовили сотрудники Института русского языка им. В. В. Виноградова РАН, которые стремились соединить принципы академической лексикографии с потребностями и интересами современного школьника. Какие идеи заложены в словарь, что в нем особенного, чем он может быть полезен и интересен детям? Мы поговорили об этом с двумя членами авторского коллектива, кандидатами филологических наук Анной Владимировной Занадворовой, ведущим научным сотрудником отдела современного русского языка, и Еленой Андреевной Никишиной, научным сотрудником того же отдела и доцентом Школы лингвистики НИУ ВШЭ.
...Издательство «Грамота» выпустило новый...
...Зачем понадобился новый словарь? Анна Занадворова:...