В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Новое исследование, опубликованное в научном журнале Languages, утверждает: объем словарного запаса будущего партнера может быть фактором, определяющим перспективность отношений с ним. Исследователи проанализировали данные 83 двуязычных (английско-турецких) пар, состоящих в браке более 15 лет. Они были отобраны из более широкой выборки, использованной в предыдущем исследовании тех же авторов, посвященном изучению связей между словарным запасом родителей и
...Новое исследование, опубликованное в научном журнале...
Манускрипт, или Рукопись, Войнича — иллюстрированный кодекс XV века, написанный анонимным автором на неизвестном алфавите. Первые попытки расшифровки текста предпринимали еще в XVII веке, но сделать это не удалось до сих пор. Новые научные методы позволили получить интересные данные, пишет научно-популярное издание Naked Science.
...Манускрипт, или Рукопись, Войнича — иллюстрированный...
...Рукопись носит имя антиквара Вильфреда Войнича, который...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
В новом номере журнала «Труды Института русского языка им. В. В. Виноградова» несколько статей посвящены проблемам словарного описания разговорных лексических единиц: компрессивов, региональной и диалектной лексики, слов, сопровождаемых жестами, разговорных феминитивов.
...В новом номере журнала «Труды Института...
...Разговорная фонетика: компрессивы Лингвист Мария Каленчук...
В ноябре впервые в этом году были внесены изменения в орфографический академический ресурс «Академос». Почему составители включили в обновление 2024 года слова, которые уже давно используются в СМИ и документах? Влияет ли включение слова в словарь на его употребление? Мы обратились с этими вопросами к авторам-составителям «Академоса». Вот что они нам ответили.
...В ноябре впервые в этом году были внесены...
...Уважаемая редакция интернет-портала «Грамота.ру...
В Камчатском крае стартует культурно-просветительский «Тотальный фестиваль». Он посвящен русскому языку и культуре и продлится до конца сентября. Организаторы — общественные активисты и представители фонда «Тотальный диктант» при поддержке правительства и бизнеса Камчатского края в сотрудничестве с региональным арт-кластером ИКРА. На фестивале запланированы кинопоказы, лекции, театральные представления и книжная ярмарка с участием писателей из разных регионов ...
...В Камчатском крае стартует культурно-просветительский...
Наше внимание привлекли несколько весенних выпусков передачи Ольги Северской. Педагог, филолог Наталья Кулибина говорила о том, как научить ребенка читать; лингвист Александра Плетнева обратила внимание на сходства и различия языка лубка и церковнославянского; поэт и богослов Ольга Седакова рассказала о поэтике богослужебных песнопений. В специальном выпуске коллеги и друзья вспоминают академика РАН Юрия Апресяна. Все выпуски доступны на канале.
...Наше внимание привлекли несколько весенних выпусков...
...Как заниматься чтением с не умеющими читать?...
Во вкладке «Комментарии», как пишут составители, будут представлены материалы двух видов: ответы на популярные вопросы и заметки об орфографии конкретных слов (например, как авторы пришли к определенной форме слова, выбрав из нескольких вариантов); заметки, разъясняющие принципы, устройство и социальную значимость орфографического словаря, его роль как стабилизатора орфографической системы. Эксперты не всегда дают однозначный ответ (что и понятно, если речь ...
...Во вкладке «Комментарии», как пишут составители...