Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Как бы преподаватель ни относился к заимствованным словам, он должен научить студента правильно и уместно пользоваться этой лексикой. Для этого нужно объяснять не только значения заимствованных слов, но и их сочетаемость, системно-языковые отношения с синонимами, антонимами, родо-видовыми и тематическими включениями в родственные лексические группы.
...Как бы преподаватель ни относился к заимствованным...
...В последние десятилетия русский литературный язык испытывает...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
Восьмого апреля в 43 странах прошла акция «Тотальный диктант». Четыре фрагмента текста Василия Авченко написали онлайн и на очных площадках. «Участники из 43 стран написали двадцатый диктант в очном формате, 103 страны присоединились к акции в рамках онлайн-марафона и онлайн-диктанта. В России диктант фирменной юбилейной ручкой xGold на очных площадках написали более 125 000 человек. Больше всего участников в России традиционно собралось в Москве, куда пришли чуть ...
...Восьмого апреля в 43 странах прошла акция «Тотальный...
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Читаю газеты: Участники саммита пришли к консенсусу...
О реформах русского языка до революции и в советское время и о том, почему необходим общеобязательный свод правил, рассказывает доктор филологических наук Владимир Лопатин.
...О реформах русского языка до революции и в советское...
...Вплоть до конца XIX века никаких систематизированных...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...