В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
О разработке учебников телеутского языка для 1–4-х классов сообщила исполняющая обязанности директора якутского филиала Федерального института родных языков народов РФ Наталья Ситникова. По ее словам, учебники будут также выпущены в электронном виде и снабжены методическими рекомендациями. Учебники необходимы для того, чтобы реанимировать уходящий язык, объяснил член Кемеровской областной ассоциации телеутского народа «Эне-Байат», магистр алтаистики и востоковедения Александр ...
...О разработке учебников телеутского языка для 1&ndash...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов углубляются в историю географических названий, которые приходят к нам из других языков и на примере названия американского штата Флорида показывают влияние традиций произношения, которые иногда превосходят по стойкости границы государств.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в слове «бутик» и его производных, а также касаются вопроса об изменении значения этого слова при заимствовании из французского языка..
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассказывают о правильной постановке ударения в слове «фетиш» и его формах, а также касаются истории этого слова, которое пришло в русский язык из французского, где ударение всегда падает на последний слог
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова продолжает рассказ об этимологическом словаре М. Фасмера и о его переводчике на русский язык лингвисте О. Н. Трубачёве, внесшем существенные дополнения в труд М. Фасмера.
...Ведущая рубрики «Русский устный», член редакционного...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассуждают о возможности расхождения норм произношения в разных словарях и о причинах такого явления, при этом, по мнению собеседников, предпочтение должно отдаваться словарям с разными вариантами ударений.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...