Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
В июне правительство РФ приняло Концепцию государственной языковой политики. Его разработка была инициирована президентом РФ в 2019 году. Концепция подтверждает особую роль русского языка как государственного и настрой государства на сохранение языкового разнообразия. Грамота напоминает основные вехи российской и советской языковой политики и приводит мнения экспертов о новом документе.
...В июне правительство РФ приняло Концепцию государственной...
...Русификация и коренизация «На протяжении...
Грамотные люди вызывают у окружающих сложные чувства. С одной стороны, они пользуются авторитетом, к ним испытывают уважение. С другой, грамотная устная и письменная речь некоторым кажется излишеством: раз меня все равно понимают, зачем мучиться и учить правила? Кроме того, одни, как принято думать, обладают врожденной грамотностью, а другие не могут справиться с буквами из-за дислексии и дисграфии. И все-таки грамотность сегодня становится таким же полезным навыком, как умение строить отношения с коллегами или говорить на иностранном языке. Какая грамотность нам нужна в эпоху спелл-чекеров и чатботов? Попробуем подступиться к этой важной теме.
...Грамотные люди вызывают у окружающих сложные чувства...
...Правильно писать, читать и говорить Слова грамотность...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...Изначально словари были рукописными, малого объема...
Этнонимы, или имена народов, порой имеют загадочную и даже причудливую историю. Но тем они и интересны. Описать все возможные варианты появления этнонимов едва ли под силу даже специалистам. Мы ограничимся самыми распространенными.
...Этнонимы, или имена народов, порой имеют загадочную...
...Свои, чужие и просто люди Как вообще у народа...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...