В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Перед началом нового учебного года Всероссийский центр изучения общественного мнения (ВЦИОМ) представил данные опроса о самых полезных и бесполезных школьных предметах. Русский язык считают «самым полезным» почти половина опрошенных (47%), литературу — каждый четвертый. Лидирует в опросе математика (54%), в первую пятерку вошли также история (30%) и физика (27%). Иностранные языки больше не кажутся полезными большинству россиян: их ценность ...
...Перед началом нового учебного года Всероссийский центр...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...