Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...
Даже носителей языка могут ставить в тупик некоторые фразы. Например, как правильно сказать — те, кто пришел или те, кто пришли? А может, оба варианта допустимы? А как объяснить неносителю, почему мы говорим Петя и я придем, а не Петя и я придут? Почему в синтаксисе возникают разные варианты и всегда ли один из них хуже другого? Это и другие вопросы, связанные со строением предложения в русском ...
...Даже носителей языка могут ставить в тупик некоторые...
Исследователи из США и Испании изучили, как собаки используют для коммуникации с людьми звуковые панели, популярные у владельцев домашних питомцев. Они пришли к выводу, что собаки осознанно использовали кнопки (такие как «играть», «гулять» или «помоги») и даже составляли неслучайные комбинации из разных слов. В работе использовались данные, полученные от владельцев 152 собак. Все случаи, когда собаки или их хозяева нажимали ...
...Исследователи из США и Испании изучили, как собаки...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В ХМАО — Югре ведется работа по созданию...
Аналитический центр ВЦИОМ изучил, как россияне относятся к обсценной лексике. Оказалось, что семь из десяти опрошенных хотя бы иногда используют нецензурные ругательства. Доля тех, кто матерится ежедневно, за последние 17 лет выросла значительно — с 20% до 34%. Мужчины и молодежь (зумеры и младшие миллениалы) являются основными «источниками» мата: почти половина мужчин и две трети зумеров используют нецензурную лексику ежедневно. А вот географических различий в ...
...Аналитический центр ВЦИОМ изучил, как россияне относятся...
Разработка стартапа Cybernet AI стала первым масштабным решением в области автоматического распознавания речи (ASR), созданным с нуля специально для тюркской языковой группы, а не адаптированным из англоязычных моделей. Большинство систем, используемых в регионе, до недавнего времени базировались на архитектурах, изначально обученных на английском языке. Такие универсальные модели плохо справлялись с фонетикой, особенностями интонации и
...Разработка стартапа Cybernet AI стала первым масштабным...
До сих пор не теряют популярности псевдолингвистические теории искателей «славянских рун» и тайных смыслов в русских буквах. Филолог и преподаватель Светлана Гурьянова, автор книги «В начале было кофе» и блога «Восстание редуцированных», прочитала лекцию о том, как на самом деле славяне получили письменность, и показала на примерах, в чем ошибались лингвисты-любители.
...До сих пор не теряют популярности псевдолингвистические...
...Если ввести в интернете запрос «древняя...
Поздравляем наших друзей, подписчиков и партнеров с наступающим Новым годом! Мы благодарны всем, кто был с Грамотой в уходящем году: искал на портале слова, задавал вопросы, читал статьи и книги, пользовался справочниками, учил с нами русский язык, писал об ошибках и критиковал, помогал и поддерживал. Мы рады работать для вас и делиться с вами всем, что знаем сами и что узнаём каждый день благодаря нашим экспертам. Желаем вам ...
...Поздравляем наших друзей, подписчиков и партнеров...
Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.
...Территориальное распространение языков, диалектов и...
...Откуда берутся «всемирные» слова Слова...