Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Нас с детства приучают, что грамотный человек не должен употреблять слова-паразиты. Они не несут смысловой нагрузки, раздражают слушающих и отвлекают внимание от сути высказывания. Тогда откуда они берутся, почему мы их произносим и какие слова рискуют стать паразитами? Лингвисты тут могут нас удивить.
...Нас с детства приучают, что грамотный человек не должен...
...Почему «паразиты»? Можно представить себе...
Одно из главных изменений в произносительной системе русского языка за последние 25 лет — это отказ от высокого стиля. Лев Владимирович Щерба называл такой стиль полным — мы отчетливо произносим все слова, делаем в речи значительные паузы, используем высокую лексику. На смену ему идет нейтральный произносительный стиль с элементами разговорного.
...Одно из главных изменений в произносительной системе...
...Грамота уже 25 лет наблюдает за жизнью русского языка...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
На первый взгляд теоретические вызовы, стоящие перед современной лингвистической наукой, бесконечно далеки от проблем школьного русского. Но если предложить школьникам задуматься над почему-вопросами об устройстве языка, это расширит их научную картину мира и сделает освоение родного языка более увлекательным, считает доктор филологических наук, заведующий кафедрой теоретической и прикладной лингвистики филологического факультета МГУ Сергей Георгиевич Татевосов.
...На первый взгляд теоретические вызовы, стоящие перед...
...Школьные предметы и научное знание Любая школьная...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
О том, как глагол «слямзить» связан с лямкой и что значат слова «лямза», «лямить» и «лямзить», можно прочитать в рубрике «Беседы о языке» журнала «Наука и жизнь».
...О том, как глагол «слямзить» связан с лямкой...
...В рассказе «Столичная штучка» Михаил Зощенко...
Термин «государственный язык» используется в законодательстве, но не имеет однозначного толкования. Что это такое и в чем его функция, каждый понимает по-своему. Ясно одно: «государственный» в этом случае — категория не лингвистическая, а правовая.
...Термин «государственный язык» используется...
...Юридическая история Под языковым законодательством...