Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
К шестидесятилетию «Орфографического словаря русского языка» предлагаем вашему вниманию публикацию, рассказывающую об истории одного написания, которое кажется нам сейчас привычным и единственно возможным, а 80 лет назад считалось ошибочным. Это написание «плавучий».
...К шестидесятилетию «Орфографического словаря...
...Предисловие «Грамоты.ру» 25...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
В последние годы благодаря развитию технологий нам удается узнать больше о коммуникации живых существ — от обезьян до птиц. В новом исследовании специалисты разобрались в том, как общаются между собой рыбы — красные груперы из семейства каменных окуней. Многие виды рыб используют звуки, но связать конкретный сигнал с определенным социальным поведением раньше было трудно. В новой работе научная группа из США и Пуэрто-Рико ...
...В последние годы благодаря развитию технологий...
Специалисты из Нью-Йоркского университета (NYU) предложили инновационный подход к пониманию многоязычия. Они разработали математическую формулу, которая позволяет оценить «интенсивность» и сбалансированность языкового опыта. Долгое время в лингвистике термин «билингв» использовался как бинарный показатель: человек либо владеет несколькими языками, либо нет. Однако такой подход не учитывает реальность, в которой один человек может свободно говорить ...
...Специалисты из Нью-Йоркского университета (NYU...
Акцент — это особенность произношения, связанная с региональными, национальными и культурными различиями. Он придает речи своеобразие, но может привести к искаженному восприятию качеств и способностей человека. Нужно ли обязательно говорить «чисто»? Грамота постаралась понять, как акцент может повлиять на социальную успешность человека и его профессиональные перспективы.
...Акцент — это особенность произношения, связанная...
...Какие бывают акценты Хорошо знакомый нам случай, когда...
В рамках исследования авторы работы (сотрудники двух факультетов МГУ — иностранных языков и регионоведения, вычислительной математики и кибернетики) протестировали способность пяти ведущих больших языковых моделей — ChatGPT-4, Gemini-pro-1.5, Claude 3 Opus, Llama3-70b и Microsoft Phi-3 — выполнять письменные задания из популярных учебников, выпущенных издательствами Oxford University Press и Pearson Education. Моделям требовалось выполнить следующие ...
...В рамках исследования авторы работы (сотрудники...