Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Недавно принятая в России Концепция государственной языковой политики призывает к защите русского языка от иностранных заимствований. До этого, в феврале 2023 года, были приняты поправки в закон «О государственном языке РФ», которые ограничивают использование англицизмов в рекламе. Россия — не единственная страна, чье правительство обеспокоено защитой своего языка от иностранного влияния. Такую же политику проводит и канадская ...
...Недавно принятая в России Концепция государственной...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Благодаря появлению цифровых устройств мы можем читать больше, а доступ к информации у нас есть почти всегда. Но как это влияет на то, насколько хорошо мы понимаем прочитанное? Исследователи из Университета Валенсии (Испания) провели метаанализ (сравнительный обзор) более двух десятков исследований, опубликованных в период с 2000 по 2022 год, в которых приняли участие почти 470 тысяч человек. Во всех работах, вошедших в выборку, их авторы оценивали, насколько хорошо участники понимали ...
...Благодаря появлению цифровых устройств мы можем читать...
Мир ономастики интересен тем, что позволяет через имена и названия многое узнать об истории и культуре. Одних только русских фамилий насчитывается более 200 тысяч! Собранные под одной цифровой обложкой печатные выпуски уникальной газеты будут интересны широкой аудитории, особенно учащимся, школьным учителям и преподавателям вузов.
...Мир ономастики интересен тем, что позволяет через имена...
...Мы живем в мире имен и названий. Практически любое...
Институт лингвистических исследований Российской академии наук (ИЛИ РАН) приглашает принять участие в Международной научной конференции, посвященной столетию со дня рождения специалиста по лексикографии и диалектологии, много лет занимавшего позицию главного научного сотрудника ИЛИ РАН, — Федора Павловича Сороколетова. Ф. П. Сороколетов (08.03.1924 — 20.12.2008) — доктор филологических наук, профессор, автор более двухсот научных трудов по ...
...Институт лингвистических исследований Российской академии...
В ноябре пользователи интересовались, среди прочего, тем, как произносится слово «кафе», как правильно писать названия разных видов сумок и как расставить знаки препинания в сложном предложении, которое стало предметом спора.
...В ноябре пользователи интересовались, среди прочего...
...Произношение Вопрос: Почему в слове кафе ф произносится...
18 февраля в международном мультимедийном пресс-центре МИА «Россия сегодня» прошла онлайн-конференция, приуроченная к Международному дню родного языка, который отмечается 21 февраля. Участниками конференции стали ректор Государственного института русского языка им. А. С. Пушкина М. Н. Русецкая, председатель научно-образовательного союза «Родное слово» К. С. Деревянко, директор Института языкознания РАН А. А. Кибрик и главный редактор портала «Грамота.ру» В. М.
...18 февраля в международном мультимедийном пресс-центре...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...