В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...Прогноз: текстовые данные для обучения нейросетей могут...
...В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT....
Что такое речевой этикет? Расхожие определения, которые можно нагуглить в интернете, несколько дезориентируют: они сводят речевой этикет к употреблению формул вежливости, типа «спасибо» и «пожалуйста», то есть к знанию определенной, не слишком сложной лексики. Увы, если бы все было так просто! Неочевидные особенности этикетных требований разных культур показывает филолог и переводчик Мария Елифёрова.
...Что такое речевой этикет? Расхожие определения, которые...
...Чем отличаются правила речевого этикета в русских и...
...Например, в научной статье запросто можно встретить фразу вроде Most Vikings were Scandinavians (‘Большинство викингов были скандинавами’), хотя вроде бы лиц нескандинавских национальностей викингами называть вообще не принято!...
...Обычно же утвердительные высказывания принято смягчать различными модификаторами вроде probably ‘вероятно’, possibly ‘возможно’ и даже not unlikely — буквально ‘не невероятно’....
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Искусственный интеллект помог создать фонетический...
...По мнению Тэйлора Херша, специалиста в области биоакустики из Орегонского университета, орнаменты и прочие элементы вокализаций китов могут не нести особого смысла и быть чем-то вроде музыки....
...Ранее было известно, что кашалоты (Physeter macrocephalus) обмениваются сообщениями в виде щелчков, а разные последовательности щелчков образуют так называемые коды (codas) — нечто вроде фонем в человеческом языке....
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Исследователи выяснили, как мозг воспринимает частицу...
...Например, нужно довольно тонкое понимание сразу многих аспектов языка, чтобы приписать одинаковое значение предложениям вроде чайник долго закипает и чайник долго не закипает....
...«Отрицание — вроде бы простой механизм: можно к чему-нибудь приставить показатель отрицания и получить противоположное значение, — комментирует выводы исследования Елизавета Былинина, лингвист, PhD, доцент Гронингенского университета (Нидерланды)....
Иногда создается впечатление, что корректоры больше никому не нужны. С одной стороны, есть спелл-чекеры, которые неплохо справляются с основными проблемами. С другой, привычка читать мессенджеры и соцсети размывает уважение к правилам: побеждает подход «понятно, и ладно», указывать на чужие ошибки неприлично… Но представить себе качественный текст без корректуры по-прежнему невозможно. О незаметной работе, в которой есть свои вызовы и удовольствия, рассказывает корректор Грамоты Марк Кантуров.
...Иногда создается впечатление, что корректоры больше...
...Как работает корректор? Приводит текст в порядок, спасая...
...И, с одной стороны, благодаря этому знанию я могу отследить в тексте довольно тонкие вещи, вроде авторского использования пунктуации, и обосновать то или иное свое решение в правке....
...Помимо простых и однозначных правил вроде «жи-ши» и «-тся/-ться» в языке — особенно в пунктуации — существует много темных мест, по поводу которых в научных школах согласья нет....
...Начинал я еще по правилам «старой школы» — с обязательной вычиткой на бумаге, с использованием корректорских знаков, со множеством тонкостей вроде отбивки знака процента от цифры на полукегельную, о чем сейчас почти никто не помнит....
...Случаи У каждого корректора, конечно, есть свой список забавных опечаток вроде социальное и семенное положение, калан сети центров обслуживания или платил заплату. Но больше меня интересуют не смешные опечатки, а задачки, которые ставит передо мной текст....
О том, какие пунктуационные и орфографические «вызовы» требуют решения, ведущая программы Ольга Северская поговорила с членом Орфографической комиссии РАН, доцентом кафедры русского языка МАрхИ и преподавателем НИУ ВШЭ Марией Ровинской.
...О том, какие пунктуационные и орфографические...
...«Говорим по-русски!»: в правилах русской пунктуации...
...Еще не устоялась орфография слов вроде ютуб / ютьюб, рутуб / рутьюб. Все эти случаи рано или поздно должны найти отражение в нормативных словарях и справочниках. ...
... Спелл-чекеры хоть и помогают писать правильно, но иногда сами предлагают ошибочные варианты вроде на обум. Гаджет не подскажет, в каких случаях надо писать так же и то же, а в каких — также и тоже, когда вследствие, а когда в следствии....
Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском. В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке ...
...Большие языковые модели оказались чувствительны к вежливости...
...Например, в английском это использование формальных маркеров вежливой речи вроде please или could you. Оценка влияния производилась через сравнение точности выполнения задач моделей на запросы разных тональностей....
...Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском....
Для нескольких поколений наших соотечественников Ушаков — что-то вроде названия словаря (есть еще Даль и Ожегов). Образованные люди знают, что «посмотреть в Ушакове» означает получить точную, надежную, подробную информацию о значениях слов и их стилистических оттенках. А ведь этого словаря могло и не быть. Профессору Московского университета Дмитрию Николаевичу Ушакову пришлось преодолеть множество препятствий в борьбе за дело своей жизни. Лекция заведующей кафедрой медиаречи ...
...«Посмотреть в Ушакове», или Как человек становится...
...Для нескольких поколений наших соотечественников Ушаков — что-то вроде названия словаря (есть еще Даль и Ожегов). Образованные люди знают, что «посмотреть в Ушакове» означает получить точную, надежную, подробную информацию о значениях слов и их стилистических оттенках....
«Заметки на полях» — совместный проект Тотального диктанта и сервиса МТС «Строки». Научный руководитель Грамоты Владимир Пахомов ведет его вместе с писательницей Ириной Лейк. В первом выпуске ведущие обсудили интересные слова и выражения — как модные и современные, так и из лексикона Льва Толстого.
...«Заметки на полях» — совместный проект...
...Появился новый подкаст о русском языке «Заметки на...
... Далее ведущие обсудили избыток англицизмов вроде лук и аутфит в современных текстах и объяснили разницу в значении модных выражений быть на чилле и быть на расслабоне. Кроме того, слушатель узнает, какие есть смысловые нюансы у других модных выражений: в моменте, в ресурсе и в потоке....
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Создать себе подобных: как люди придумали чат-ботов...
...Это важно, например, чтобы отделять похожие слова вроде сардина и Сардиния (ведь программа ничего не знает про реальный мир и вынуждена опираться лишь на данные, которые ей предоставили)....
...Если программа не находила ключевых слов, она могла ответить общими фразами вроде «Я понимаю. Хотите еще что-то добавить?». Любопытно, что модель PARRY, разработанная в 1972 году, тоже имела прямое отношение к психическим проблемам....
...Чат-бот находил в тех данных, которые поступали к нему, типичные слова, которые встречаются в таких разговорах, вроде отец, мать, парень, подруга, злой, грустный, счастливый и т. д. Диалог мог выглядеть так: Пользователь: Я ненавижу своего отца....