Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты обнаружили в данных переписи населения пять...
...Лингвисты из Института языкознания РАН выявили в ...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Об освоении заимствованной лексики...
...Так, например, слово офис, заимствованное русским языком...
Что нужно знать родителям школьника, у которого проснулся интерес к устройству языка? Какие есть возможности проверить себя и узнать больше о лингвистической науке? Анастасия Пучкова и Алексей Старченко — тренеры и руководители команды, которая представляет Россию на Международной олимпиаде по лингвистике. Они рассказали Грамоте о том, как выбрать олимпиаду, увеличить шансы на победу и получить дополнительные баллы при поступлении.
...Что нужно знать родителям школьника, у которого...
...Как победить на олимпиаде по лингвистике...
...Мама, я хочу стать лингвистом! Интерес к лингвистике...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...Как отличить текст, написанный нейросетью? Ряд критериев...
...В последнее время искусственный интеллект далеко...
По случаю Европейского дня языков, который отмечается 26 сентября, социологическая служба Евростат представила последние данные о предпочтениях школьников Евросоюза при выборе второго языка (помимо местного) в качестве обязательного для изучения. Самым популярным оказался английский — это касается и среднего общего, и среднего технического образования. Его выбрали 96,8% и 78,6% соответственно. Второе место в общеобразовательных школах занял испанский язык (26,8%), за ним следуют ...
...Евростат опубликовал данные о месте русского языка...
...По случаю Европейского дня языков, который отмечается...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...Современные онлайн-ресурсы расширяют возможности исследователей...
...1. Новое в русской лексике База данных снабжена...
Новый перевод классической книги сделан с издания 2007 года и поэтому отражает более актуальные научные данные по сравнению с изданием 1994 года. Научный соредактор книги Валерий Шульгинов, социолингвист, автор телеграм-канала «Лингвоед», рассказал по просьбе Грамоты о том, чем взгляд Пинкера на язык может быть интересен сегодняшним читателям.
...Новый перевод классической книги сделан с ...
...Вышло новое издание научно-популярной книги Стивена...
...«Язык как инстинкт» Стивена Пинкера, одна...
Авторская, или писательская, лексикография может быть определена в целом как теория и практика создания словарей языка отдельных авторов. Теория авторской лексикографии охватывает широкий круг проблем: это определение статуса, объема, содержания данного научного направления, прагматической специфики авторских словарей, выявление макро- и микроструктуры таких справочников, их объяснительного аппарата, системно-типологической организации. Сюда же относятся и вопросы истории авторской лексикографии.
...Авторская, или писательская, лексикография может быть...
...Авторская лексикография в отечественном языкознании...
...Важнейшие характеристики авторской лексикографии В...