Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Мы ожидаем, что скоро найдется наиболее эффективный...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Возможно, глаголу продаксить тоже найдется скромное...
С наличием в языке вариантов связано сразу несколько распространенных заблуждений. Считается, что в литературном языке не должно быть двух правильных вариантов одного и того же слова; наличие вариантов в словарях свидетельствует только о том, что лингвисты не могут договориться между собой; варианты в словарях — примета нашего времени, в изданиях прежних лет варианты не допускались. На самом деле вариантность — непременный атрибут литературного языка, а фиксация вариантов в словарях — неотъемлемая часть работы лингвистов-кодификаторов.
...С наличием в языке вариантов связано сразу несколько...
...В наши дни мало найдется носителей языка, сомневающихся...
В апреле 1992 года, по старой привычке, включаю радио и слышу беседу двух ученых мужей, Владимира Петровича Нерознака и Михаила Викторовича Горбаневского, о проблемах филологической науки, о проблемах языка, о том, что словарь Владимира Ивановича Даля был издан Обществом любителей российской словесности и хорошо было бы это Общество возродить. Не буду ничего говорить о своих переживаниях в тот момент. Дело в том, что я была уверена: я единственная, кого интересует это Общество...
...В апреле 1992 года, по старой привычке, включаю радио...
...одни помехи и препоны, то ничего сделать нельзя; их найдется...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...А много ли найдется готовых провести годы в ...
Это вторая книга лингвиста, профессора НИУ ВШЭ и известного журналиста, вышедшая в издательстве АСТ. Она рассчитана на самый широкий круг читателей, которые хотят поменьше ошибаться, особенно в устной речи.
...Это вторая книга лингвиста, профессора НИУ ВШЭ и ...
...Не то чтобы мы никогда не знали, что апелляция пишется...
Завершился очередной этап совершенствования инструментов, которыми можно пользоваться на Грамоте. Сегодня расскажем о самых заметных изменениях в том, что касается поиска. 1. Теперь на странице поиска есть тумблер, который позволяет переключаться между точным и умным поиском. По умолчанию ищется точное совпадение с тем запросом, который ввел пользователь в строке поиска: ровно те же знаки в том же порядке, без учета словоформ и похожих вариантов (тумблер ...
...Завершился очередной этап совершенствования инструментов...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Английский писатель-фантаст, автор романа «Россия во мгле», имел собственное мнение о том, как лучше преподавать русский язык иностранцам. Его точка зрения изложена в журнале «Наука и жизнь».
...Английский писатель-фантаст, автор романа «Россия...
...Герберт Уэллс считал, что Западу необходимо налаживать...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...