Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Не все в языке подчиняется правилам. Иногда мы руководствуемся обычаем, из-за чего возникают конкурирующие традиции. Например, кто-то ставит запятую в подписи, а кто-то — нет. Языковеды Дмитрий Ермолович и Павел Палажченко разбирают эту коллизию и предлагают свое обоснование правильного (с их точки зрения) варианта.
...Не все в языке подчиняется правилам. Иногда мы руководствуемся...
...«О том, чего нет и что не так в словарях...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
На 43-м заседании Дискуссионно-аналитического клуба по вопросам языковой политики в Институте языкознания РАН выступили лингвисты Максим Кронгауз, Валерий Шульгинов и Елизавета Громенко. Они представили доклад о лингвистической конфликтологии как научной области и о результатах исследования восприятия слов, обозначающих этнические группы.
...На 43-м заседании Дискуссионно-аналитического клуба...
...Лингвистическая конфликтология сформировалась в ...
Элисон Вуд Брукс преподает в Гарвардской школе бизнеса и специализируется в области психологии общения. Она более десяти лет занимается исследованием коммуникации и ведет собственный курс под названием TALK. Книга «Простой сложный разговор. Модель легкого и эффективного общения» посвящена важным принципам и тонкостям общения, которые помогут избежать ошибок в разговоре. На русском языке она вышла в издательстве МИФ.
...Элисон Вуд Брукс преподает в Гарвардской школе бизнеса...
...Разговор — не такая легкая вещь, как...
В Российской академии наук подготовлена новая, переработанная и значительно дополненная, редакция «Правил русской орфографии и пунктуации». Работа над ней велась давно, с начала 1990-х годов. Текст правил готовился коллективом специалистов сектора орфографии и орфоэпии Института русского языка им. В. В. Виноградова, а затем — на всех этапах работы — подробно рассматривался, обсуждался на заседаниях Орфографической комиссии при Отделении литературы и языка РАН.
...В Российской академии наук подготовлена новая, переработанная...
...В составе комиссии — не только работники Академии...
Омский государственный университет им. Ф. М. Достоевского приглашает принять участие в конференции «Новейшая филология: междисциплинарная парадигма исследований», посвященной памяти профессора Галины Георгиевны Галич. Среди тем, которые предлагаются к обсуждению: жанры письменной речи: историко-культурный и структурно-функциональный аспекты; актуальные направления лингвоантропологии: новое о человеке в языке, речи, тексте; актуальные проблемы ...
...Омский государственный университет им. Ф. ...
Нас с детства приучают, что грамотный человек не должен употреблять слова-паразиты. Они не несут смысловой нагрузки, раздражают слушающих и отвлекают внимание от сути высказывания. Тогда откуда они берутся, почему мы их произносим и какие слова рискуют стать паразитами? Лингвисты тут могут нас удивить.
...Нас с детства приучают, что грамотный человек не должен...
...Почему «паразиты»? Можно представить себе...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...