Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
О жизни и научной работе российского лингвиста, члена-корреспондента АН СССР Дмитрия Ушакова рассказывает статья на портале «Полит.ру».
...О жизни и научной работе российского лингвиста, члена-корреспондента...
...Ушаков получил начальное образование дома, затем учился...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
Научный руководитель Грамоты Владимир Пахомов пишет в Газете.ru о том, почему не надо бояться молодежного сленга.
...Научный руководитель Грамоты Владимир Пахомов пишет...
...Почему нас так раздражает речь подростков? Непонятные...
Команда ученых из Италии, США и Швейцарии проверила, насколько хорошо большим языковым моделям удается убеждать собеседников в своей правоте. Авторы привлекли к участию 900 жителей США. Каждому из них случайным образом выдали собеседника (это мог быть другой участник или чат GPT-4), тему и задачу — защищать или оспаривать предложенный тезис. Также в одном из вариантов участнику (человеку или чат-боту) была заранее доступна информация о
...Команда ученых из Италии, США и Швейцарии проверила...
О происхождении индоевропейских языков нам известно довольно много. В частности, основная на сегодняшний день курганная гипотеза исходит из того, что распространение индоевропейских языков в Европе связано с миграциями из причерноморских степей. Но какой вклад внесли различные группы мигрантов и в какое время, остается предметом споров среди специалистов. Международная группа ученых провела масштабное исследование и сделала вывод, что испанское, французское ...
...О происхождении индоевропейских языков нам известно...
Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.
...Территориальное распространение языков, диалектов и...
...Откуда берутся «всемирные» слова Слова...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Как показывает анализ, речевые клише и фразеологические сочетания, относящиеся к семантическому полю «остроты зрения», являются наиболее активной зоной композиционно-смысловых преобразований Набокова, что связано с его особым вниманием к концепту «взгляда художника». Ведь в конце концов оказывается, что и неудача криминального романа Германа — главного героя «Отчаяния» — кроется как раз в том, что портрет, который рисует с него художник, остается «без глаз», в то время как «палка Феликса» оказывается с «глазком».
...Как показывает анализ, речевые клише и фразеологические...
...В своей книге «Проза Пушкина в поэтическом прочтении...