Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Гипотеза лингвистической относительности Сепира и Уорфа говорит о том, что язык не только отражает картину мира говорящих, но и в значительной степени формирует ее, влияя на мышление и поведение людей. Исследователи из Университета Цепеллина (Германия) обнаружили, что конструирование новых слов, связанных с определенными занятиями или образом жизни в целом, побуждает людей больше интересоваться этими явлениями и перенимать их. Например, неологизм ...
...Гипотеза лингвистической относительности Сепира и ...
Журнал «Наука и жизнь» проводит конкурс «Игры со словами». Перед вами третье задание конкурса, автор которого — кандидат филологических наук Илья Иткин. Итоги конкурса будут подведены в конце года. Победителей ждут призы от редакции журнала и ведущего игры Сергея Федина.
...Журнал «Наука и жизнь» проводит конкурс...
...На олимпиаде по лингвистике и математике, состоявшейся...
В СССР активно боролись за права женщин, но при этом названия многих профессий в русском языке чаще всего употребляются в мужском роде. Как передовые идеи равенства полов вписались в российский патриархальный контекст? И почему женщины обычно предпочитают, чтобы их называли врачами и медиками, а не врачихами и медичками?
...В СССР активно боролись за права женщин, но при этом...
...Тема русских феминитивов обширна и остроактуальна;...
Российская Федерация — многонациональное государство. На ее территории функционируют более 150 языков, из которых около ста — языки коренных народов России, остальные — это языки компактно или диаспорно проживающих некоренных этносов. Полиэтничность Российского государства выражена в начальных строках Конституции: «Мы — многонациональный народ России».
...Российская Федерация — многонациональное...
...Государственно-политические аспекты лингвокультурной...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
Даже тот, кто не посвятил жизнь науке, сталкивается с текстами, написанными в научном стиле. Любой реферат или доклад, учебник или научно-популярный блог использует особые языковые средства, которые отвечают его задачам. Текст в этом функциональном стиле не просто передает информацию, но стремится доказать ее истинность, ценность, а во многих случаях и новизну.
...Даже тот, кто не посвятил жизнь науке, сталкивается...
...Три подстиля для разных задач Традиционно выделяют...
23 января отмечается День ручного письма. Эта памятная дата была учреждена в 1977 году для повышения интереса к искусству калиграфии в эпоху, когда все меньше людей пишут от руки. Пожалуй, единственное место, где еще приходится постоянно пользоваться ручкой, — это школа. Большинство образовательных систем знакомят детей с письмом, предлагая им выводить буквы от руки. При этом школьное обучение активно цифровизируется, а использование ...
...23 января отмечается День ручного письма. Эта...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...