Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В жизни нам приходится запоминать огромное количество информации, особенно в связи с учебой. Простая зубрежка не просто отнимает много сил и времени, но и зачастую неэффективна. На помощь приходят мнемонические приемы, которые значительно упрощают процесс запоминания. В русском языке немало непростых правил, которые хорошо иллюстрируют мнемонические фразы. Мы постарались собрать самые известные приемы, чтобы «разложить по полочкам» спряжения, падежи, ударения и многое другое.
...В жизни нам приходится запоминать огромное количество...
...Как работает мнемоника Мнемоника (от др.-греч. &mu...
Русский язык существует не одно столетие и, как и любой другой язык, меняется с течением времени — это касается как живого разговорного языка, так и литературного стандарта. Каким был русский язык в разные периоды, какой путь он прошел от времен Руси до наших дней? Попробуем выделить ключевые моменты.
...Русский язык существует не одно столетие и, как...
...Древнерусский язык (IX–XIV века) Когда...
Открывая словарь в поисках нужного слова, мы часто видим не только толкование или, например, сведения об ударении, но и помету, одну или несколько: разг., книж., сниж., спец., неодобрит., шутл. Какие бывают пометы, насколько они универсальны и как на них влияют языковая политика, общественные настроения и личные убеждения составителей словарей?
...Открывая словарь в поисках нужного слова, мы часто...
...Что такое помета Согласно одному из определений...
Оценивая состояние языка, необходимо разграничивать три вида процессов: 1) в условиях функционирования языка; 2) в построении текста; 3) в системе языка. Раскрепощение, возможность свободно выражать свои мысли и чувства, игры с языком и при помощи языка — вот что характерно для русского языка нашего времени.
...Оценивая состояние языка, необходимо разграничивать...
...В последние десятилетия особенно резко изменились...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Врожденная грамотность существует или это миф? Как она проявляется и чем ее можно объяснить? Грамота опросила в соцсетях около 40 человек, которые с детства писали без ошибок. Результаты этого мини-исследования мы обсудили со Светланой Викторовной Друговейко-Должанской — старшим научным сотрудником Института русского языка им. В. В. Виноградова РАН, членом Филологического совета Тотального диктанта и Орфографической комиссии РАН.
...Врожденная грамотность существует или это миф? Как...
...Почему грамотность не может быть врожденной Врожденная...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...