Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
В феврале 2024 года Российская академия наук отмечает трехсотлетие. РАН традиционно пользуется уважением, академизм считается синонимом основательности и научной строгости, быть академиком почетно. Но реальную картину академической жизни и смысл работы ученых многие представляют себе смутно. Грамота решила добавить ясности и обратилась к филологам — членам Академии, которые хорошо знают историю науки и могут судить о ее сегодняшнем состоянии изнутри.
...В феврале 2024 года Российская академия наук отмечает...
...Что такое академическая наука...
...Чем академическая наука отличается от других «...
Согласно словарю Ожегова шаль — это тоже платок, только большой. Допустимо ли говорить «платки и шали»? Разобраться поможет публикация в журнале «Наука и жизнь».
...Согласно словарю Ожегова шаль — это тоже платок...
...Шаль, платок и полушалок......
...Слово шаль заимствовано в XVIII веке из польского (...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Национальный словарный фонд даст пользователям больше...
...Что такое Национальный словарный фонд: концепция и...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...Современные онлайн-ресурсы расширяют возможности исследователей...
...1. Новое в русской лексике База данных снабжена...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Разные языки или разные диалекты?...
...Задача с двумя неизвестными Представим, что есть два...
Портал «Грамота.ру» следит за успехами проекта «Тотальный диктант». Ежегодная образовательная акция привлекает все больше участников. В 2014 году диктант писали 64 тысячи человек в 352 городах мира. Ключевые составляющие успешного проекта — оригинальный текст (в этом году автором текста был Алексей Иванов), грамотный менеджмент и лингвистическое обеспечение на академическом уровне. Мы поговорили с председателем экспертной комиссии Тотального диктанта Натальей Борисовной Кошкарёвой — не только о диктанте.
...Портал «Грамота.ру» следит за успехами...
...«На родной язык стараний не жалко»...
...Лингвисты в полях Грамота: Наталья Борисовна, пользуясь...
В народной культуре, придающей большое значение снам, образы, которые человек видит во сне, получают то или иное толкование. Лингвистическая задача, которую придумал ульяновский фольклорист Е. В. Сафронов, строится вокруг тех принципов, по которым мы обычно толкуем сновидения. Задача была опубликована в журнале «Наука и жизнь» .
...В народной культуре, придающей большое значение снам...
...Лингвистическая задача «Логика сна»...
...Толкования сновидений, как правило, не произвольны,...
Подавляющее большинство (96%) женщин, участвовавших в опросе книжного сервиса «Литрес» и платформы для знакомств Mamba, считают привлекательной грамотную речь. Среди участников-мужчин это мнение разделяют 76%. Результаты опроса публикует ТАСС. 63% женщин и 53% мужчин называют уровень грамотности решающим фактором для выбора партнера. Только для 3% женщин этот момент оказался незначимым (среди мужчин таких 23%). Как можно объяснить разницу между мужчинами ...
...Российские женщины придают большое значение грамотности...
...Подавляющее большинство (96%) женщин, участвовавших...