В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Хотите размяться после праздников? Мы подготовили для вас простой пунктуационный тест. Проверьте, сможете ли вы правильно расставить запятые в современной прозе: все примеры взяты из рассказа «Сувенир на память» Майи Кучерской («Случай в маскараде», АСТ, 2024). Помните, тест легкий, никакой авторской пунктуации, только школьные правила.
...Хотите размяться после праздников? Мы подготовили для...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в слове «бутик» и его производных, а также касаются вопроса об изменении значения этого слова при заимствовании из французского языка..
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в слове «дороговизна» и рассказывают, что это слово, а также его антоним — дешевизна — являются исключениями в семействе слов с суффиксом -изн-.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Пока все ждали, что искусственный интеллект вытеснит гуманитариев, работающих с текстами, произошло обратное: именно они становятся незаменимыми специалистами в обучении нейросетей. Спрос на AI-тренеров — профессионалов, которые учат искусственный интеллект правильно общаться с людьми, — вырос почти вдвое за год, по данным сервиса по поиску работы и сотрудников HeadHunter. Задача ИИ-тренера — готовить обучающие данные, создавать ...
...Пока все ждали, что искусственный интеллект вытеснит...
Грамота поздравляет всех своих друзей, подписчиков и партнеров с наступающим Новым годом! Пусть русский язык по-прежнему нас удивляет, радует, вдохновляет, бросает нам вызов и украшает нашу жизнь! А мы постараемся и дальше пополнять словарные запасы, разрешать ваши сомнения, объяснять правила и рассказывать об увлекательной и не всегда предсказуемой жизни языка. С праздником! Пусть будет много хорошего в новом году!
...Грамота поздравляет всех своих друзей, подписчиков...
Сотрудники Центра языковой политики и международного образования Института Пушкина представили индекс положения русского языка в мире. Об этом пишет «Парламентская газета».
...Сотрудники Центра языковой политики и международного...
...Русский язык по числу говорящих находится на девятом...
Какие английские слова и словосочетания стали лидерами по итогам голосования, рассказывает сайт «Годлитературы.рф».
...Какие английские слова и словосочетания стали лидерами...
...Слово года в этот раз впервые определили пользователи...