Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Словарь, построенный на устных и письменных данных...
Как показывает анализ, речевые клише и фразеологические сочетания, относящиеся к семантическому полю «остроты зрения», являются наиболее активной зоной композиционно-смысловых преобразований Набокова, что связано с его особым вниманием к концепту «взгляда художника». Ведь в конце концов оказывается, что и неудача криминального романа Германа — главного героя «Отчаяния» — кроется как раз в том, что портрет, который рисует с него художник, остается «без глаз», в то время как «палка Феликса» оказывается с «глазком».
...Как показывает анализ, речевые клише и фразеологические...
...В своей книге «Проза Пушкина в поэтическом прочтении...
Предлагаем вниманию читателей портала статью Павла Яковлевича Черных, опубликованную в журнале «Русский язык в школе» (№ 3, 1949). Правильно ли мы читаем и, главное, понимаем программное стихотворение А. С. Пушкина? Как в черновиках поэта выглядели знакомые нам со школьной скамьи строки? Об этом идет речь в статье.
...Предлагаем вниманию читателей портала статью Павла...
...Предисловие «Грамоты.ру» Павел Яковлевич...
О первых итогах прошедшей акции рассказал на пресс-конференции в ТАСС руководитель проекта «Тотальный диктант» Вячеслав Беляков. По его данным, по всему миру в акции участвовал 1 294 401 человек. 132 164 человека написали Тотальный диктант очно на площадках в России, 4086 человек — на площадках за рубежом, 26 тысяч человек написали Тотальный диктант в режиме онлайн в системе автоматической проверки, 3514 человек в
...О первых итогах прошедшей акции рассказал на пресс-конференции...
Статьи номера посвящены вводному слову «кстати», проблемам перевода с английского, формам личных имен в первом и третьем лице, концепту «документ» в речи крестьян и другим темам. Обратим внимание на три статьи.
...Статьи номера посвящены вводному слову «кстати...
...Способы сохранения гендерной неопределенности персонажей...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...