НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
В рамках научных мероприятий, посвященных трехсотлетию Российской академии наук, 25 октября 2024 года в новосибирском Академгородке пройдет круглый стол «Русская языковая личность в межнациональном общении». Среди ключевых тем круглого стола: вклад отечественной междисциплинарной науки в изучение вербальной культуры; разработка теоретических подходов и методов для изучения языка и типологии русской языковой личности в контексте ...
...В рамках научных мероприятий, посвященных трехсотлетию...
До недавнего времени в наших заграничных паспортах фамилии писались по нормам французского языка. В новых заграничных паспортах французское написание фамилий заменено на английское. Многих интересует, к каким последствиям это может привести.
...До недавнего времени в наших заграничных паспортах...
...Попав в какую-нибудь страну, где все говорят «...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
21 марта — Международный день людей с синдромом Дауна. Тем, кто родился с этим синдромом, труднее реализовать потребность в общении и понимании информации, чем другим людям. Помогающие специалисты вместе с программистами и лингвистами создают для них специальные адаптированные тексты, инструкции и сервисы, которые облегчают коммуникацию. В последние годы в России было реализовано несколько инициатив в этом направлении. С 2021
...21 марта — Международный день людей с ...
Известно, что владение двумя языками на одном уровне нагружает мозг дополнительной работой. Однако это может быть полезно для развития памяти. Ученые проверили эту гипотезу в играх на угадывание слов. В исследовании участвовали испано-англоязычные билингвы и англоязычные монолингвы. Услышав слово, участники должны были найти соответствующую картинку среди множества изображений на экране. При этом у них регистрировались движения глаз с помощью айтрекеров. Авторы выбирали изображения для ...
...Известно, что владение двумя языками на одном уровне...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Чтобы правильно диагностировать у ребенка затруднения при чтении, необходима консультация специалиста. Но тревога родителей по этому поводу тоже может быть довольно точным индикатором наличия проблем, выяснили исследователи Университета Западного Онтарио (Канада). В исследовании принимали участие 34 школы Онтарио. Авторы работы обратились к родителям учащихся и попросили заполнить анкету об академическом развитии их детей. Параллельно дети проходили стандартизированные тесты на чтение и ...
...Чтобы правильно диагностировать у ребенка затруднения...