В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Манускрипт, или Рукопись, Войнича — иллюстрированный кодекс XV века, написанный анонимным автором на неизвестном алфавите. Первые попытки расшифровки текста предпринимали еще в XVII веке, но сделать это не удалось до сих пор. Новые научные методы позволили получить интересные данные, пишет научно-популярное издание Naked Science.
...Манускрипт, или Рукопись, Войнича — иллюстрированный...
...Рукопись носит имя антиквара Вильфреда Войнича, который...
Ведущие программы «Физики и лирики» на «Маяке» Александр Пушной и Маргарита Митрофанова по понедельникам задают кандидату филологических наук, заместителю директора Института языкознания РАН Игорю Исаеву вопросы о жизни и приключениях современного русского языка.
...Ведущие программы «Физики и лирики»...
...Темы выпусков разнообразны, так что описать их все...
Вопрос, когда и где зародилась письменность, уже долгие годы является предметом научных дискуссий. Предшественниками письма считаются, например, глиняные таблички, которые древние шумеры оставляли в залог товаров. Их возраст — около десяти тысяч лет. Однако протописьмо, возможно, возникло раньше. На это могут указывать записи в храмовом комплексе Гёбекли-Тепе, изученные археологами из Эдинбургского университета (Великобритания). Постройки Гёбекли-Тепе находятся на ...
...Вопрос, когда и где зародилась письменность, уже...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
Как отличается язык Москвы и Санкт-Петербурга? Может ли русский язык разделиться? Как заимствованные слова влияют на язык — обогащают или «засоряют»? Почему некоторые слова не могут прижиться в языке? Все это и многое другое кандидат филологических наук Борис Иомдин, автор телеграм-канала «Узнал новое слово», обсудил с ведущим канала «Основа» Борисом Веденским.
...Как отличается язык Москвы и Санкт-Петербурга?...
...Язык — это не только слова, но и грамматика...
Инициатива Crowdsourcing Romeyka, возглавляемая профессором Кембриджского университета Иоанной Ситариду, приурочена к Международному десятилетию языков коренных народов (2022–2032), объявленному ООН. Его цель — «привлечение внимания мировой общественности к критическому положению многих языков коренных народов и мобилизация заинтересованных сторон и ресурсов для их сохранения, возрождения и продвижения». Ромейка считается исчезающим ...
...Инициатива Crowdsourcing Romeyka, возглавляемая ...
В 2004 году во время раскопок в Умм-эль-Марре около Алеппо была найдена гробница с человеческими останками и другими предметами раннего бронзового века (2600–2150 годы до н. э.). Среди предметов оказались четыре глиняных цилиндра, каждый размером с палец, с выгравированными на них восемью различными символами. Археолог Гленн Шварц из Университета Джонса Хопкинса в Балтиморе (США), который был одним из руководителей раскопок, проанализировал ...
...В 2004 году во время раскопок в Умм-эль-Марре...