Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Мероприятие предполагает обмен опытом разработки цифровых словарей, презентацию методов цифровой лексикографии и обсуждение практических аспектов их применения. Организаторы — Сектор типологии Института языкознания РАН и Отдел корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН. В круг тем, которые будут затрагиваться на воркшопе, входят: цифровые платформы для публикации и подготовки словарей; опыт использования лексикографических ...
...Мероприятие предполагает обмен опытом разработки цифровых...
Считается, что языки, на которых говорят большие группы населения, становятся проще. Одна из гипотез объясняет этот процесс большой долей людей, для которых этот язык не является родным: они упрощают чужой язык по мере овладения им. Однако новое исследование ставит под сомнение эту связь. Лингвисты из Института Макса Планка оценили грамматическую сложность 1314 языков и пришли к выводу, что она не снижается даже в тех сообществах, где многие члены сообщества говорят на неродном языке.
...Считается, что языки, на которых говорят большие группы...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Онлайн-словарь диалектизмов «Русским языком говорю» должен объединить сотни слов, бытующих в разных регионах России. Это совместная инициатива портала «Культура.РФ» и социальной сети «Одноклассники». Например, словом сморщ в Брянской области называют борщ, а словом гостинка в Приморском крае — маленькую квартиру. Поиск по сайту позволяет найти диалектные слова по первой букве, по региону или по значению. Любой ...
...Онлайн-словарь диалектизмов «Русским языком говорю...
Работу над Концепцией государственной языковой политики с 2022 года вело Министерство просвещения РФ по поручению президента. В пятницу, 14 июня, пресс-служба ведомства сообщила об утверждении документа правительством, после чего он был опубликован. Концепция закрепляет особый статус русского языка как государственного, подчеркивая важность сохранения языкового многообразия. В ней даны определения таких понятий, как государственный язык РФ, государственные ...
...Работу над Концепцией государственной языковой политики...
Организаторами международной научно-практической конференции выступают Российский университет дружбы народов им. Патриса Лумумбы, а также Московский исследовательский центр при поддержке департамента региональной безопасности и противодействия коррупции города Москвы. В программе конференции — вопросы лингвистической семантики и дискурс-анализа медиатекстов в приложении к задачам лингвистической экспертизы; применение достижений когнитивной ...
...Организаторами международной научно-практической конференции...
Рукопись была случайно обнаружена в 2019 году в библиотеке Кембриджского университета — из нее сделали обложку хозяйственного реестра. Страницы были сложены, порваны и вшиты в переплет, так что традиционные методы реставрации могли бы нанести документу непоправимый ущерб. Команда исследователей из университетской Лаборатории визуализации культурного наследия (CHIL) использовала комплексную технику цифровой реставрации, чтобы не только восстановить текст, но и пролить свет на историю ...
...Рукопись была случайно обнаружена в 2019 году...
Ориентация говорящего в мире устроена по-разному в разных культурах. В языках среднеевропейского типа человек находится в центре, а окружающее пространство описывается по отношению к нему через категории «слева» и «справа», «сзади» и «спереди». Но это далеко не единственный способ говорить о том, что нас окружает, засвидетельствованный в языках мира. О некоторых других ориентирах рассказывает лингвист Валерий Шульгинов.
...Ориентация говорящего в мире устроена по-разному в...
...К востоку от входа Носители русского языка воспринимают...