Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Каждый десятый участник «Тотального диктанта» справился с ним на высшем уровне. Об этом сообщил председатель Филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН Владимир Пахомов. Количество отличников незначительно изменялось в зависимости от того, какую часть диктанта писали участники, — самой легкой оказалась четвертая часть. При этом в тексте, который предложила автор ...
...Каждый десятый участник «Тотального диктанта&...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...В 1780-х годах императрица Екатерина ...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
Школьники не могут освоить правописание из-за скудного словарного запаса, а сами учителя иногда перенимают сленг учеников. Таковы результаты опроса участников олимпиады «Хранители русского языка». Правописание считают самым сложным разделом для изучения в школе 40% опрошенных учителей русского языка. На втором месте пунктуация (24%), а на третьем — культура речи и стилистика (23%). Распространенные причины проблем с русским языком — бедный словарный запас и ...
...Школьники не могут освоить правописание из-за скудного...
В пятницу 8 декабря состоялось награждение победителя и призеров Всероссийской профессиональной олимпиады «Хранители русского языка». Победителем была признана учитель русского языка из Лицея народной дипломатии Сыктывкара (Республика Коми) Татьяна Политова. Всего в этом году было подано более 11 тысяч заявок от учителей русского языка со всей страны. Олимпиада проходила в три этапа. На финальном этапе участники написали диктант, посвященный педагогическому наследию Льва Николаевича ...
...В пятницу 8 декабря состоялось награждение победителя...
Конференция «Дети: в языке и культуре» пройдет в Институте языкознания РАН. На ней будут обсуждаться лингвистические вопросы, связанные с детьми и детством, в русском и других языках, в том числе балканских, уральских, дравидийских, иранских. В конференции участвуют сотрудники Института языкознания РАН, Института славяноведения РАН, НИУ ВШЭ, МГУ им. М. В. Ломоносова и ряда других научных центров. Среди тем, которые будут рассмотрены в докладах: «Ребенок: стратегия ...
...Конференция «Дети: в языке и культуре»...