Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.
...21 февраля в мире отмечается Международный день родного...
...Родные языки в опасности Языки выходят из употребления...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Ной Вебстер родился 16 октября 1758 года и прожил 84 года. За это время он успел организовать несколько школ и реформировать систему образования, затронуть в своей публицистике множество актуальных социальных и научных вопросов, внести заметный вклад в политическую жизнь Америки и остаться в истории двумя уникальными печатными трудами: «Пособием по американскому правописанию» и «Американским словарем английского языка».
...Ной Вебстер родился 16 октября 1758 года и прожил 84...
...Не только словарь За свою долгую жизнь Ной Вебстер...
В новом выпуске программы «Говорим по-русски!» Федор Борисович Успенский, член-корреспондент Российской академии наук, директор Института русского языка им. В. В. Виноградова РАН, рассказывает о лингвистическом расследовании, касающемся Бориса Годунова и его семьи, и о средневековой традиции многоименности, актуальной и для царя Бориса, и для современности. Видео опубликовано на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...В новом выпуске программы «Говорим по-русски!...
...Ведет программу Ольга Северская, кандидат филологических...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...
Иностранные топонимы, попадая в русский язык, начинают вести себя по его правилам. Но не всегда понятно, какое правило работает в каждом отдельном случае. Попробуем разобраться в том, как ведут себя однословные иностранные географические названия.
...Иностранные топонимы, попадая в русский язык, начинают...
...Внешние признаки Для начала стоит обратить внимание...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Создатель и руководитель Саратовской лингвистической школы Ольга Борисовна Сиротинина в этом году отметила столетний юбилей. 75 лет она изучает русский разговорный язык. «Жизнь вопреки, или Я счастливый человек» — так называется книга мемуаров, которую ученики составили на основе ее устных рассказов.
...Создатель и руководитель Саратовской лингвистической...
...Ольга Борисовна Сиротинина родилась в Саратове в 1923...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...