Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
В Северной и Южной Америках сосредоточена примерно половина всех известных лингвистам языковых семей. При этом происхождение этих языков по-прежнему остается не до конца изученным. Чтобы продвинуться на этом пути, американский типолог, иностранный член Российской академии наук и почетный профессор Калифорнийского университета в Беркли Джоанна Николс в недавно опубликованной работе проследила исторические корни языков, на которых говорили самые ранние жители Северной ...
...В Северной и Южной Америках сосредоточена примерно...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Чтение — одно из самых популярных хобби. Однако доля людей, читающих для удовольствия, неуклонно снижается — об этом говорят данные из США. Исследователи из Университетского колледжа Лондона и Университета штата Флориды (США) решили оценить, насколько серьезен этот спад. Они взяли данные из Американского обзора использования времени (American Time Use Survey), который ежегодно проводится Бюро переписи населения США и Бюро статистики труда.
...Чтение — одно из самых популярных хобби...
Нейросети часто называют «черным ящиком»: их внутренние механизмы остаются загадкой даже для их создателей. Однако недавнее исследование, опубликованное в журнале Nature Communications, позволяет заглянуть в этот «ящик»: между большими языковыми моделями и человеческим мозгом обнаружилось поразительное сходство. Выяснилось, что архитектура больших языковых моделей, таких как GPT или Llama, в определенном смысле повторяет работу нейробиологических ...
...Нейросети часто называют «черным ящиком»...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Обзор исследований, опубликованный в журнале Trends in Cognitive Sciences, пересматривает классические представления о том, что именно делает человеческий язык уникальным; в основе новой концепции лежат данные когнитивистики, лингвистики и исследований интеллекта животных. Традиционный взгляд на язык исходит из того, что это прежде всего звуковая речь (код), состоящая из абстрактных знаков, уникальных только для человека. В 1960 году лингвист Чарльз Хокетт ...
...Обзор исследований, опубликованный в журнале Trends...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
6 июня в России и за ее пределами отмечается День русского языка. Он приурочен ко дню рождения Александра Сергеевича Пушкина — именно его произведения, по общему признанию, заложили основу современного русского литературного языка. В этот день мы поздравляем пользователей, экспертов, друзей и партнеров Грамоты с нашим общим праздником! Русскому языку можно пожелать только активного и творческого долголетия. А всем, кто говорит по-русски ...
...6 июня в России и за ее пределами отмечается...