В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Даже грамотные носители русского языка сталкиваются с трудностями, когда им нужно написать редкое, длинное, заимствованное или просто незнакомое слово. Да, в современные устройства встроена автоматическая проверка орфографии, но она не всегда работает корректно и не помогает, когда мы (такое тоже бывает!) пишем важный текст от руки. В случае сомнений всегда лучше свериться со словарем — желательно с самым новым.
...Даже грамотные носители русского языка сталкиваются...
...Что такое орфография Термин орфография восходит к&...
Новогодние праздники — удачное время, чтобы отвлечь ум от насущных дел и предложить ему что-то новое и увлекательное. А книги о языке подходят для этого как нельзя лучше: тут и история слов, чтобы блеснуть эрудицией в разговоре, и волнующие загадки древности, и игры для взрослой и детской компании. Мы собрали для вас разнообразную предпраздничную подборку — семь книг, которые приятно дарить, но всегда можно оставить себе!
...Новогодние праздники — удачное время, чтобы...
...1. Синклер Маккей. Шифры цивилизации: коды, секретные...
Термин «государственный язык» используется в законодательстве, но не имеет однозначного толкования. Что это такое и в чем его функция, каждый понимает по-своему. Ясно одно: «государственный» в этом случае — категория не лингвистическая, а правовая.
...Термин «государственный язык» используется...
...Юридическая история Под языковым законодательством...
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Читаю газеты: Участники саммита пришли к консенсусу...
Если ребенку в младших классах трудно дается чтение, это может быть признаком дислексии. При этом ребенок вполне сможет научиться читать на уровне других детей, если родители рано обратят внимание на его затруднения и обратятся к специалистам. О том, как проявляется дислексия и какого прогресса удается достичь с помощью специальных упражнений, рассказывает лингвист, основатель детской онлайн-школы «Лаборатория чтения „Верные слова“» Анна Иосифовна Левинзон.
...Если ребенку в младших классах трудно дается чтение...
...Грамота: Что такое дислексия? Насколько она вообще...
Все мы слышали эти слова, но понимаем ли, что они в точности значат? Или каждый раз забываем, как их использовать? Длинные слова с туманным, абстрактным смыслом звучат умно и солидно. Но именно их лучше не писать и не говорить, если не уверены на все сто: вместо того, чтобы блеснуть эрудицией, можно попасть впросак. Рассказываем, как правильно их использовать и какие ошибочные употребления встречаются чаще всего.
...Все мы слышали эти слова, но понимаем ли, что они в...
...1. Амбивалентный Значение: двойственный, противоречивый...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...