Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Ранее в моделях вроде LangID преобладал универсальный...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
..., который характерен для больших языковых моделей вроде...
Известно, что обсуждение с детьми книг с картинками без слов очень полезно для развития речи. Однако не всем детям нравится это занятие, а некоторым родителям оно может показаться скучным или вызывать стресс. Новое исследование, проведенное Флоридским Атлантическим университетом в сотрудничестве с Орхусским университетом в Дании, выявило альтернативный (и в чем-то более эффективный) способ развития речи ребенка. Это беседы о прошедших ...
...требования, односторонние указания), чаще звучали вопросы вроде...
Подростки активно используют продукты с генеративным искусственным интеллектом (генИИ) для решения учебных задач, борьбы со скукой и перевода текстов с других языков. При этом родители и учителя отстают от них в понимании этих технологий. Об этом говорят данные опроса Common Sense Media — независимой НКО, которая предоставляет обзоры и рейтинги медиа и технологий с целью информирования общества об их влиянии на детей и подростков1.
...В первую десятку также попали варианты вроде &...
Говоря о выборе системы письма, мы не будем затрагивать вопросы исконного, если можно так выразиться, выбора: происхождения систем письма и формирования письменных ареалов. Далее будет говориться лишь о ситуации последних веков, включая современность.
...Говоря о выборе системы письма, мы не будем затрагивать...
...системы письма (не путать с более частными мерами вроде...
...Даже более частные меры вроде орфографической реформы...
Понимание текста зависит не только от того, какие слова в нем используются, но и от его синтаксической структуры предложений, из которых он состоит. Российские психолингвисты провели исследование, чтобы понять, с какого возраста дети могут правильно интерпретировать сложные предложения. В исследовании Центра языка и мозга НИУ ВШЭ приняли участие 145 русскоязычных учащихся 1–4 классов и столько же взрослых. Всем им предложили прослушать набор сложных предложений разных типов и
...где требовалось осмыслить соотношение признаков, вроде...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
... Формы вроде выпить чаю или добавить сахару...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...веб-скрейпинга стало сложнее добывать, так как платформы вроде...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...Кроме того, оказалось, что словесные пометы вроде син...
В 2023 году были внесены изменения в Федеральный закон «О государственном языке Российской Федерации». Новая редакция предписывает использовать заимствованные слова только в случае отсутствия русских аналогов. О том, как создавался новый нормативный словарь иностранных слов, а также о том, как меняется русский язык, газете «Санкт-Петербургские ведомости» рассказала доктор филологических наук, заместитель директора по научной работе Института лингвистических исследований РАН Марина Приемышева.
...В 2023 году были внесены изменения в Федеральный...
...включили в него историзмы и устаревшие слова вроде...