Разработка стартапа Cybernet AI стала первым масштабным решением в области автоматического распознавания речи (ASR), созданным с нуля специально для тюркской языковой группы, а не адаптированным из англоязычных моделей. Большинство систем, используемых в регионе, до недавнего времени базировались на архитектурах, изначально обученных на английском языке. Такие универсальные модели плохо справлялись с фонетикой, особенностями интонации и
...Разработка стартапа Cybernet AI стала первым масштабным...
В школе мы выучили, что в русском языке шесть падежей. Но в лингвистике существуют и другие классификации: некоторые исследователи выделяют до восьми и даже до десяти падежей. Один из таких нестандартных падежей — местный, или локатив (от латинского locus ‘место’). Насколько корректно отождествлять местный падеж с предложным и какой из них первичен?
...В школе мы выучили, что в русском языке шесть...
...Значение и формы Принято различать прямые и косвенные...
Считается, что языки, на которых говорят большие группы населения, становятся проще. Одна из гипотез объясняет этот процесс большой долей людей, для которых этот язык не является родным: они упрощают чужой язык по мере овладения им. Однако новое исследование ставит под сомнение эту связь. Лингвисты из Института Макса Планка оценили грамматическую сложность 1314 языков и пришли к выводу, что она не снижается даже в тех сообществах, где многие члены сообщества говорят на неродном языке.
...Считается, что языки, на которых говорят большие группы...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В русском языке мы можем по-разному выразить сравнение: используя родительный падеж (золото дороже серебра) или с помощью союза (золото дороже, чем серебро). Портал «Элементы» приводит шесть предложений, в которых сравнение выражено родительным падежом, и предлагает читателю распределить их на две группы, объяснив разницу.
...В русском языке мы можем по-разному выразить сравнение...
...Лингвистические задачи на «Элементах» редко...
11 февраля Госдума приняла в первом чтении законопроект «О внесении изменений в Федеральный закон “О государственном языке Российской Федерации” и отдельные законодательные акты Российской Федерации». Он вносит в законодательные акты поправки, касающиеся использования русского языка как государственного. Содержательно эти поправки можно обобщить следующим образом. Во-первых, постулируется, что «объединяющая роль в историческом сознании ...
...11 февраля Госдума приняла в первом чтении законопроект...
С 1 апреля вступил в силу закон, обязывающий детей иностранных граждан и лиц без гражданства подтверждать знание русского языка для поступления в российские школы. Одновременно была запущена процедура тестирования детей. Диагностические материалы разработал Федеральный институт педагогических измерений (ФИПИ). Для детей, поступающих в первый класс, предусмотрена только устная часть, начиная со второго класса добавляется письменная. Потенциальному первокласснику предложат ответить на ...
...С 1 апреля вступил в силу закон, обязывающий детей...
«Русский диктант» — это просветительская акция, задача которой — популяризация русского языка среди иностранных граждан и соотечественников за рубежом. Акция проходит уже не первый год; любой желающий может бесплатно принять в ней участие онлайн. Инициатива проведения принадлежит Балтийскому федеральному университету им. И. Канта. Диктант будет транслироваться 25 января в 14:00 по Калининграду (UTC+2). Чтобы стать ...
...«Русский диктант» — это просветительская...
Баскский язык (эускара) десятилетиями считался белым пятном на лингвистической карте Европы. Окруженный романскими языками, он не имел известных родственников. Однако заполнить этот пробел могут находки, связанные с исчезнувшими народами Пиренейского полуострова. Группа исследователей под руководством палеолингвиста Эдуардо Ордуньи Аснара представила доказательства того, что у баскского был «родной брат» — древнеиберский язык. Иберы населяли восток и юг ...
...Баскский язык (эускара) десятилетиями считался белым...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...