Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Тема театра в поэзии конца ХХ века возникает в соответствии с провозглашением установки на игру как творческого метода. Так или иначе она звучит в текстах-манифестах поэтов-метареалистов Ивана Жданова («До слова»), Сергея Соловьева («Амфитеатр печатной машинки...») и Алексея Парщикова («Вступление»).
...Тема театра в поэзии конца ХХ века возникает...
...Все эти тексты обнаруживают как схождения между собой...
За последние несколько недель прошла волна мероприятий и публикаций по поводу русского языка, словно давняя озабоченность наконец-то оформилась в конкретные мысли и отчетливые намерения. Это прежде всего акция «Народный диктант», инициаторы которой — журналисты «Российской газеты» — поставили эксперимент на себе и тем самым заслужили право предложить проверить свои знания по русскому языку отечественным чиновникам и политикам всех уровней и ветвей власти. За диктантом «по Льву Толстому» последовали выступления известных языковедов и деятелей культуры о русском языке как родном, как языке межнационального общения и как одном из мировых языков.
...За последние несколько недель прошла волна мероприятий...
...Однако на самом деле широкую общественность и филологическое...
Обладает ли мозг гиперполиглотов какими-то особенностями или дело только в желании и настойчивости? Исследователи по-разному отвечают на этот вопрос. Достоверно известно одно: не так уж мало людей говорят на десятках языков. Таким людям посвящена статья в журнале «Наука и жизнь».
...Обладает ли мозг гиперполиглотов какими-то особенностями...
...Дик Хадсон, британский профессор лингвистики, назвал...
В древнерусском и церковнославянском языках не было буквы «ё». Среди кириллических алфавитов эта буква используется нечасто, прежде всего в русском, однако в нем она остается необязательной. К истории буквы «ё» дважды обращается журнал «Наука и жизнь».
...В древнерусском и церковнославянском языках не было...
...Почему букве ё отказывают в праве на существование?...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...