Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
На YouTube-канале «Основа», который ведет режиссер и блогер Борис Веденский, уже год регулярно появляются интервью со специалистами в разных областях и представителями разных наук, которые умеют популяризировать научные знания, заинтересовывать своей областью самую широкую аудиторию. Гостями канала уже побывали лингвисты Владимир Пахомов, Федор Успенский, Игорь Исаев, Георгий Старостин.
...На YouTube-канале «Основа», который ведет...
...Александр Пиперски в разговоре с ведущим...
В секции «Лингвистика: язык в современном мире» премию и специальный приз журнала «Наука и жизнь» получил ученик Вятской гимназии Лев Чебунин за исследование «Клички кошек: традиция и современность».
...В секции «Лингвистика: язык в современном мире...
...Клички кошек относятся к тому разделу лексикологии,...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Это вторая книга лингвиста, профессора НИУ ВШЭ и известного журналиста, вышедшая в издательстве АСТ. Она рассчитана на самый широкий круг читателей, которые хотят поменьше ошибаться, особенно в устной речи.
...Это вторая книга лингвиста, профессора НИУ ВШЭ и ...
...Не то чтобы мы никогда не знали, что апелляция пишется...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Новую разработку представили выпускники Института прикладных информационных технологий и коммуникаций Саратовского государственного технического университета им. Ю. А. Гагарина (ИнПИТ СГТУ). Приложение позволяет изучать теоретические основы РЖЯ, просматривать словарь и овладевать отдельными жестами, проверять свои знания и проходить интерактивное тестирование. Уникальность приложения в том, что в него встроена нейросеть, которая ...
...Новую разработку представили выпускники Института...