НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Мария Леонидовна Каленчук — главный научный сотрудник и заведующая отделом фонетики Института русского языка им. В. В. Виноградова РАН, член Совета по русскому языку при Президенте РФ, член Орфографической комиссии и председатель Орфоэпической комиссии РАН, эксперт Грамоты. Ее монолог на «Арзамасе» начинается с детства, учебы в школе и в институте и заканчивается признанием в любви к фонетике и описанием процесса создания словарей. Мы выбрали пять цитат из этого монолога.
...Мария Леонидовна Каленчук — главный научный...
...Есть такой предмет «введение в языкознание...
Московский педагогический государственный университет, Российский государственный педагогический университет им. А. И. Герцена и московская школа № 1541 приглашают школьников и студентов к участию в XXVIII международной научно-практической конференции «Языкознание для всех». Заявленная тема конференции — пространство и время в языке. Доклады могут касаться таких вопросов, как языковые средства выражения времени и
...Московский педагогический государственный университет...
Выпуск посвящен семантике русских слов и отражает результаты работы Лаборатории машинного перевода МГПИИЯ в первой половине 1960-х годов. В нем опубликованы работы Александра Жолковского, Нины Леонтьевой, Виктора Розенцвейга, Юрия Щеглова и других исследователей. Сборник на момент написания был ценным вкладом в исследование семантики русского языка и предложил основу для разработки семантических алгоритмов и формальных методов описания значений слов.
...Выпуск посвящен семантике русских слов и отражает результаты...
...Владение смыслом слов проявляется у говорящего в способности...
Госдума приняла поправки в Федеральный закон о государственном языке. Как это повлияет на использование русского языка в разных сферах, изданию «Аргументы и факты» рассказал главный редактор портала «Грамота.ру» Владимир Пахомов.
...Госдума приняла поправки в Федеральный закон о государственном...
...Поправки призваны стимулировать чиновников и граждан...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...