В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Глагол «трусить» — это на самом деле два глагола-омографа, которые пишутся одинаково, а произносятся по-разному. Более того, у одного из этих глаголов есть два значения, о чем напоминает журнал «Наука и жизнь».
...Глагол «трусить» — это на самом деле...
...Если в глаголе трусить поставить ударение на первый...
2 июля — День уфолога, то есть человека, «специализирующегося» на поиске внеземных цивилизаций. Хотя нет даже подтверждения того, что внеземная жизнь возможна, уже существуют ученые, которые пытаются понять, какой она должна быть. Среди них — ксенолингвисты (от ξένο — чужой). О том, почему серьезные исследователи увлекаются ксенолингвистикой, рассказывает журнал Scientific American.
...2 июля — День уфолога, то есть человека, «...
...В фильме «Прибытие» 2016 года на Земле появляются...
Проблемы специфики существования русского языка в так называемой зоне интернета — это, безусловно, обширное белое даже не пятно, а просто-таки поле в современной русистике. Путешествуя по разным любопытным ссылкам, я узнала, что этот вопрос обсуждается довольно активно.
...Проблемы специфики существования русского языка в так...
...Так, на сайте «Редактор.ру» можно задать...
Чем отличаются диалект, говор и наречие, можно ли считать носителя говора неграмотным, нужно ли избавляться от говора, какой из русских диалектов ближе к древнерусскому языку — об этом рассказал в большом интервью онлайн-изданию «Т—Ж» член-корреспондент РАН, профессор факультета антропологии Европейского университета Николай Вахтин.
...Чем отличаются диалект, говор и наречие, можно...
...Диалект, говор и наречие привязаны к определенной...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Международная команда ученых доказала, что тесное общение между народами — вплоть до смешения их генов — неизбежно меняет не только словарный запас, но и саму структуру их языков. Лингвисты всегда знали, что языки заимствуют слова друг у друга. Но гораздо сложнее понять, как происходит заимствование языкового «скелета»: грамматических правил, порядка слов в предложении или уникальных звуков. Долгое время оставались ...
...Международная команда ученых доказала, что тесное общение...
День русского языка — это повод поговорить о состоянии нашего языка и процессах, происходящих в нем сейчас. Какие вызовы стоят перед русским языком в эпоху цифровых технологий? Какие общественные тенденции отмечают исследователи? Какое влияние оказывают социальные сети на речь молодежи? Как удается сохранять баланс в языковом многообразии России? Насколько устойчива система диалектов и какие факторы влияют на их сохранение? Все эти вопросы специалисты ...
...День русского языка — это повод поговорить...