В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Есть ситуации, в которых отношения между словами можно выразить разными способами. Например, можно сказать «учебник истории», а можно «учебник по истории». В последнее время способ, при котором используется предлог, становится основным — это явление иногда называют экспансией предлогов. При этом значение многих предлогов размывается, а сами они все чаще выражают не лексические отношения, а более абстрактные грамматические. Мы решили повнимательнее присмотреться к конструкциям с «по» и «для», а потом обсудить наши наблюдения со специалистом.
...Есть ситуации, в которых отношения между словами...
...Расширение зоны ответственности предлогов В публицистических...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Авторская, или писательская, лексикография может быть определена в целом как теория и практика создания словарей языка отдельных авторов. Теория авторской лексикографии охватывает широкий круг проблем: это определение статуса, объема, содержания данного научного направления, прагматической специфики авторских словарей, выявление макро- и микроструктуры таких справочников, их объяснительного аппарата, системно-типологической организации. Сюда же относятся и вопросы истории авторской лексикографии.
...Авторская, или писательская, лексикография может быть...
...Важнейшие характеристики авторской лексикографии В...
Известный факт: количество названий цветов и оттенков цвета в разных языках отличается. Эти различия в языке, как выясняется, влияют и на наше зрительное восприятие цвета. Совместное исследование Норвежского университета естественных и технических наук и Университета Осло показало, что люди, говорящие на языках с несколькими словами для обозначения оттенков, воспринимают их быстрее. Например, носители русского языка, в котором есть слова голубой и
...Известный факт: количество названий цветов и оттенков...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...
Публицистика как вид литературы сохраняет свои основные черты на протяжении столетий. Однако время вносит серьезные изменения в характер функционирования публицистических произведений. Нестабильность социальной ситуации переживаемого нами периода оказывает немаловажное влияние на публицистику, на ее речевой облик, стилевые устремления, язык.
...Публицистика как вид литературы сохраняет свои основные...
...Общеизвестно, что язык создается по мерке человека....