Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Если не учитывать историю происхождения слов, то даже в тех случаях, когда их родство очевидно носителям русского языка, их формально нельзя назвать однокоренными. Лингвист Борис Иомдин в журнале «Русская речь» предлагает использовать более гибкую методику оценки школьных заданий на сравнение корней.
...Если не учитывать историю происхождения слов, то даже...
...Если в слове воробей мы выделим корень -воробей...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Предлагаем вниманию читателей статью Бориса Николаевича Головина, опубликованную в журнале «Русский язык в школе» (№ 2, 1964). Размышления ученого о проблемах кодификации нормы, отличиях между ее колебаниями и нарушениями, о критериях правильности, чистоты, богатства и разнообразия речи, об опасности засорения литературного языка канцеляризмами и жаргонами актуальны и спустя полвека.
...Предлагаем вниманию читателей статью Бориса Николаевича...
...Предисловие «Грамоты.ру» Борис Николаевич...
Когда взрослые разговаривают друг с другом, они опираются на свои знания и предположения о том, как и о чем будет (скорее всего) говорить другой человек. Это облегчает им задачу по расшифровке звуковой информации, особенно когда голос собеседника приглушен, плохо слышен на фоне шума, речь неразборчива или ее пониманию мешает сильный акцент. В новом исследовании Массачусетского технологического института и Гарвардского университета, опубликованном в журнале Nature Human ...
...Когда взрослые разговаривают друг с другом, они опираются...
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Известного рода фанатам когда-то приходилось гоняться...
Глагол «трусить» — это на самом деле два глагола-омографа, которые пишутся одинаково, а произносятся по-разному. Более того, у одного из этих глаголов есть два значения, о чем напоминает журнал «Наука и жизнь».
...Глагол «трусить» — это на самом деле...
...Если в глаголе трусить поставить ударение на первый...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Чтение как неестественный процесс Многие исследования...
Один из мифов о русском языке гласит, что написание е вместо ё — грубая орфографическая ошибка. На самом деле согласно правилам русского правописания употребление буквы ё в большинстве случаев необязательно.
...Один из мифов о русском языке гласит, что...
...Подлец Карамзин — придумал же такую букву...