Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Слова, у которых изменилось написание, выбор между «слитно» и «раздельно», новые или разговорные слова, которых еще нет в словарях, — все это сложные случаи, которые могут вызвать затруднения даже у очень грамотных кандидатов филологических наук. Давайте познакомимся поближе с этими опасными экземплярами.
...Слова, у которых изменилось написание, выбор между...
...Старая новая норма «Почему в книге 1952&...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Известного рода фанатам когда-то приходилось гоняться...
Овладеть каким-либо языком — значит приобрести определенный, максимально возможный словарный запас, усвоить грамматический строй изучаемого языка и научиться ими пользоваться в речевой практике. Все эти стороны в овладении языком одинаково важны, взаимосвязаны и взаимообусловлены.
...Овладеть каким-либо языком — значит приобрести...
...Одна из главных задач курса русского языка в нашей...
Врожденная грамотность существует или это миф? Как она проявляется и чем ее можно объяснить? Грамота опросила в соцсетях около 40 человек, которые с детства писали без ошибок. Результаты этого мини-исследования мы обсудили со Светланой Викторовной Друговейко-Должанской — старшим научным сотрудником Института русского языка им. В. В. Виноградова РАН, членом Филологического совета Тотального диктанта и Орфографической комиссии РАН.
...Врожденная грамотность существует или это миф? Как...
...Почему грамотность не может быть врожденной Врожденная...
Ведущий подкаста «Сложное предложение» лингвист Игорь Исаев пригласил авторов книги «Запретные слова», докторов филологических наук Анатолия Баранова и Дмитрия Добровольского поговорить о русском мате: его изучении, его уместности и его табуированности. Грамота изложила близко к тексту фрагменты этого разговора.
...Ведущий подкаста «Сложное предложение»...
...Игорь Исаев: Зачем было писать эту книгу? Дмитрий...
Орфоэпия — это система норм литературного произношения. Владение этими нормами облегчает общение, позволяет производить хорошее впечатление и иметь репутацию образованного человека. Но иногда мы не знаем, как правильно произнести слово, или не уверены, что слышали его от грамотных людей. В этом случае понадобится актуальный и авторитетный орфоэпический словарь.
...Орфоэпия — это система норм литературного...
...Орфоэпическая норма Было бы ошибкой думать, что...