Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...
Гипотеза лингвистической относительности Сепира и Уорфа говорит о том, что язык не только отражает картину мира говорящих, но и в значительной степени формирует ее, влияя на мышление и поведение людей. Исследователи из Университета Цепеллина (Германия) обнаружили, что конструирование новых слов, связанных с определенными занятиями или образом жизни в целом, побуждает людей больше интересоваться этими явлениями и перенимать их. Например, неологизм ...
...Гипотеза лингвистической относительности Сепира и ...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Словарь, построенный на устных и письменных данных...
Владимир Владимирович был активным участником всех самых главных лингвистических проектов последней трети XX и начала XXI века. Все годы работы нашего портала он был его научным консультантом. Он один из авторов академической «Русской грамматики» 1980 года, обобщившей все достижения отечественного языковедения (авторы «Русской грамматики» были удостоены Государственной премии СССР 1982 года), лингвистического энциклопедического словаря ...
... Владимир Владимирович был активным участником...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
За последние 30 лет эмодзи (смайлы) стали универсальным феноменом. К 2015 году, согласно исследованиям, 92% людей использовали их в онлайн-общении. Одна из причин популярности эмодзи в том, что они могут быть понятны каждому — по крайней мере базовые символы, обозначающие радость, грусть или гнев. Но даже их люди могут интепретировать по-разному, как выяснили авторы статьи в журнале PLOS ONE. К исследованию привлекли 253 добровольцев из ...
...За последние 30 лет эмодзи (смайлы) стали универсальным...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...