В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
«Золотая печатная машинка» Карстена Хенна вышла в 2025 году в издательстве «МИФ» в переводе литературоведа Марии Мисник. Эта сказочная история написана для детей и рассказывает о силе слова и о возможности контролировать реальность через текст.
...«Золотая печатная машинка» Карстена Хенна...
...Карстен Себастьян Хенн — немецкий писатель...
«Зашла за сертификатом, а ухожу с чемоданом знаний и умений», — так охарактеризовала участница программу методических мероприятий «Организация курсового обучения русскому языку как иностранному за рубежом», которая завершилась 28 ноября 2024 года. В течение пяти недель более 1500 преподавателей из 110 стран мира проходили обучение по программе, которая была разработана учебным центром «Мир русских учебников» при ...
...«Зашла за сертификатом, а ухожу с чемоданом...
В ноябре впервые в этом году были внесены изменения в орфографический академический ресурс «Академос». Почему составители включили в обновление 2024 года слова, которые уже давно используются в СМИ и документах? Влияет ли включение слова в словарь на его употребление? Мы обратились с этими вопросами к авторам-составителям «Академоса». Вот что они нам ответили.
...В ноябре впервые в этом году были внесены...
...Уважаемая редакция интернет-портала «Грамота.ру...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассуждают об одной из загадок русского языка — образовании названий жителей разных городов, начиная с древнего наименования жителей Курска.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Международная акция «Тотальный диктант» пройдет 20 апреля уже в двадцать первый раз. Ее цель — объединить всех, кто любит русский язык, хочет лучше писать и говорить по-русски. Кроме того, диктант знакомит участников с современной литературой на русском языке: автором текста диктанта каждый год выбирают российского писателя. В 2024 году им стала Анна Матвеева, известная благодаря роману «Перевал Дятлова, или Тайна девяти». Вот ...
...Международная акция «Тотальный диктант»...
Министерство просвещения опубликовало приказ, который регламентирует порядок прохождения тестирования по русскому языку для детей из семей мигрантов из других стран. Ребенка, не прошедшего тестирование, не примут в школу — закон об этом вступит в силу 1 апреля 2025 года. Для успешной сдачи теста нужно будет набрать минимум три балла — аналог школьной «тройки», поясняет ТАСС со ссылкой на пресс-службу Рособрнадзора. Требования будут адаптированы под разные ...
...Министерство просвещения опубликовало приказ,...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...