Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Все мы при решении рабочих вопросов, чтении новостей...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...Метасловарь как агрегатор Задать вопрос справочной...
Есть ситуации, в которых отношения между словами можно выразить разными способами. Например, можно сказать «учебник истории», а можно «учебник по истории». В последнее время способ, при котором используется предлог, становится основным — это явление иногда называют экспансией предлогов. При этом значение многих предлогов размывается, а сами они все чаще выражают не лексические отношения, а более абстрактные грамматические. Мы решили повнимательнее присмотреться к конструкциям с «по» и «для», а потом обсудить наши наблюдения со специалистом.
...Есть ситуации, в которых отношения между словами...
...Расширение зоны ответственности предлогов В публицистических...
Далеко не каждый сможет читать серьезную научную литературу, ведь тексты, написанные в научном стиле, ориентированы на специалистов в конкретной области знания. При этом многие люди интересуются науками как любители, увлекаются биологией, астрономией, физикой, историей, лингвистикой, математикой. Для них существуют научно-популярные тексты, в которых научное содержание представлено в яркой и легкой для восприятия форме.
...Далеко не каждый сможет читать серьезную научную литературу...
...Стилистические разногласия Научно-популярный стиль...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Словесные игры — это развлечение для ума и души. Массовый успех простой онлайн-игры «Вордли», в которую играли миллионы людей по всему миру во время пандемии, доказал, что составлять слова интересно всем. Но играть всегда лучше в компании, а словесные игры идеально подходят для того, чтобы развлечься в пути, провести вечер с друзьями на даче или сблизить незнакомых людей на вечеринке. Мы собрали игры разного типа, чтобы вы могли выбрать свой набор в зависимости от ваших склонностей и обстоятельств.
...Словесные игры — это развлечение для ума...
...Устные игры Ассоциации Количество участников...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...