Чем общение людей отличается от общения обезьян, которых обучили основам жестового языка? А еще есть всем известные осмысленные танцы пчел и знаковые системы других живых существ — это язык или нет? С этих вопросов начинается книга переводчика, журналиста, преподавателя иностранных языков Яны Хлюстовой, которая владеет в той или иной степени шестью языками.
...Чем общение людей отличается от общения обезьян, которых...
...Будет ли у нас вавилонская рыбка?...
...Первая часть книги посвящена глобальным вопросам языкознания...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Российские исследователи предложили новую модель генерации...
...Ключевые слова в научных статьях, монографиях...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Языковые модели оказались хорошими помощниками в написании...
...Любимые всеми книги и фильмы часто рассказывают...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Чат-боты GPT и другие: что думают лингвисты о больших...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Приличное поведение больших языковых моделей может...
...Как и люди, системы искусственного интеллекта...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
При раскопках Хаттусы — столицы древнего Хеттского царства — была найдена клинописная табличка с надписью на неизвестном языке. Об этом сообщается в пресс-релизе Вюрцбургского университета им. Юлиуса и Максимилиана (Германия). Раскопки в районе турецкой деревни Богазкале (Богазкёй), где находилась древняя хеттская столица, ведутся уже более ста лет. За это время исследователи обнаружили почти 30 тысяч клинописных табличек. Большинство текстов написано на хеттском языке —
...В Турции обнаружили фрагмент текста на ранее неизвестном...
...При раскопках Хаттусы — столицы древнего Хеттского...