Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
31 июля завершилась XXI Международная олимпиада по лингвистике. Представлявшая Россию команда «Белка», в состав которой вошли ученики московских школ, завоевала четыре награды (два «серебра» и две «бронзы») и вышла на второе место по среднему баллу участников. Соревнование для школьников из 36 стран проходило в Бразилии. Во время первого (индивидуального) тура участникам нужно было выполнить пять лингвистических ...
...31 июля завершилась XXI Международная...
В новом номере наше внимание привлекли две статьи: о фразеологических неологизмах в русском языке, которые репрезентуют понятие «деньги», и о разговорной сравнительно-оценочной конструкции <куда Х-у до У-а> (например, куда ему до меня).
...В новом номере наше внимание привлекли две статьи...
...Новые фразеологизмы для разговора о деньгах &...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
В рамках исследования авторы работы (сотрудники двух факультетов МГУ — иностранных языков и регионоведения, вычислительной математики и кибернетики) протестировали способность пяти ведущих больших языковых моделей — ChatGPT-4, Gemini-pro-1.5, Claude 3 Opus, Llama3-70b и Microsoft Phi-3 — выполнять письменные задания из популярных учебников, выпущенных издательствами Oxford University Press и Pearson Education. Моделям требовалось выполнить следующие ...
...В рамках исследования авторы работы (сотрудники...
Распространенная сегодня негодующая точка зрения, которую метафорически можно обозначить как «Русский язык мы портим...», не разделяется авторами настоящей публикации. На наш взгляд, сегодня актуален не вопрос о состоянии русского языка, а вопрос о носителе русского языка. Для нас именно носитель, его культура, в том числе и языковая, — проблема (как для изучения, так и для формирования или, если угодно, коррекции).
...Распространенная сегодня негодующая точка зрения, которую...
...Совершенно очевидно, что проблема носителя —...
Журнал «Наука и жизнь» помогает разобраться со словами «число», «цифра» и «количество». Доктор филологических наук Наталия Черникова рассказывает об этимологии каждой лексемы и о том, как с течением времени менялось их значение.
...Журнал «Наука и жизнь» помогает разобраться...
...Понятия «число» и «цифра» в...
IX Международная научная конференция «Фонетика сегодня» пройдет в Институте русского языка им. В. В. Виноградова РАН в очно-дистанционном формате (возможно участие онлайн). На конференции предлагается к обсуждению широкий круг тем: актуальные проблемы сегментной фонетики; актуальные проблемы суперсегментной фонетики: ударение, интонация; актуальные проблемы фонологии; история звуковой системы; орфоэпия: дескриптивные описания и проблемы ...
...IX Международная научная конференция «Фонетика...
Участники смогут встретиться с лингвистами, оценить свои знания в квизе «35 вопросов о русском языке» и написать демодиктант, который разберет Владимир Пахомов — ведущий подкаста «Розенталь и Гильденстерн» и научный руководитель Грамоты. Одним из главных событий станет творческая встреча с писательницей Анной Матвеевой, многократной финалисткой премий «Большая книга» и автором текстов для Тотального диктанта 2024 года (каждый год современный ...
...Участники смогут встретиться с лингвистами, оценить...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...