В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Тематический номер «Северный Кавказ: гора языков и язык гор» посвящен началу Международного десятилетия языков коренных народов, провозглашенного ООН. В нем рассматривается широкий комплекс вопросов, связанных с проблемами сохранения и развития идентичности северокавказских этнических культур.
...Тематический номер «Северный Кавказ: гора языков...
...«Полилингвиальность и транскультурные практики...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова рассказывает об истории и смысле устойчивого сочетания «колумбово яйцо», а также исследует производные от слово «яйцо» и «курица», обращая внимание на правильное образование множественного числа «куры».
...Ведущая рубрики «Русский устный», член редакционного...
На первом саммите Россия — Ассоциация государств Юго-Восточной Азии (АСЕАН), который прошел на полях Всемирного фестиваля молодежи в Сочи, было предложено открыть центры изучения русского языка в столицах азиатских государств. Такую идею высказали Филиппины, ее поддержали Вьетнам, Малайзия, Сингапур и Мьянма. По словам представителя Филиппин, платформы для изучения русского языка могут быть организованы на базе МГИМО или иных лингвистических университетов ...
...На первом саммите Россия — Ассоциация государств...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов углубляются в историю географических названий, которые приходят к нам из других языков и на примере названия американского штата Флорида показывают влияние традиций произношения, которые иногда превосходят по стойкости границы государств.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Пока все ждали, что искусственный интеллект вытеснит гуманитариев, работающих с текстами, произошло обратное: именно они становятся незаменимыми специалистами в обучении нейросетей. Спрос на AI-тренеров — профессионалов, которые учат искусственный интеллект правильно общаться с людьми, — вырос почти вдвое за год, по данным сервиса по поиску работы и сотрудников HeadHunter. Задача ИИ-тренера — готовить обучающие данные, создавать ...
...Пока все ждали, что искусственный интеллект вытеснит...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...