Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Этнонимы, или имена народов, порой имеют загадочную и даже причудливую историю. Но тем они и интересны. Описать все возможные варианты появления этнонимов едва ли под силу даже специалистам. Мы ограничимся самыми распространенными.
...Этнонимы, или имена народов, порой имеют загадочную...
...Свои, чужие и просто люди Как вообще у народа...
Пол Грэм — американский программист, предприниматель, один из создателей бизнес-инкубатора Y Combinator для стартапов в сфере информационных технологий. А еще человек пишущий — автор нескольких книг по программированию и многочисленных эссе, например «Как начать стартап» и «Как правильно возражать». В октябре он опубликовал в своем блоге текст об умении писать тексты. Грамота перевела его для вас, воспользовавшись помощью нейросетевых технологий.
...Пол Грэм — американский программист, предприниматель...
...Обычно я неохотно делаю прогнозы относительно технологий...
Время от времени лингвист Ирина Фуфаева встречает в соцсетях слово какого — и вздрагивает. Казалось бы, это просто местоимение какой в родительном или винительном падеже. Но оно ей попалось, к примеру, в таком контексте: «Вот думаю, какого им в этом мире живется...» Автор поста, вполне интеллигентный айтишник, узнав из комментария, что здесь пишется каково, обрадовался и поблагодарил ее: «Спасибо, это не опечатка. Я реально не знал это правило».
...Время от времени лингвист Ирина Фуфаева встречает в...
...Но это не правило! В написании местоимения каков в...
Аналитический центр ВЦИОМ изучил, как россияне относятся к обсценной лексике. Оказалось, что семь из десяти опрошенных хотя бы иногда используют нецензурные ругательства. Доля тех, кто матерится ежедневно, за последние 17 лет выросла значительно — с 20% до 34%. Мужчины и молодежь (зумеры и младшие миллениалы) являются основными «источниками» мата: почти половина мужчин и две трети зумеров используют нецензурную лексику ежедневно. А вот географических различий в ...
...Аналитический центр ВЦИОМ изучил, как россияне относятся...
Некоторые формы слов в русском языке вызывают у говорящих проблемы: например, невозможно породить форму «мечт» или сказать «Я всех победю!». О том, почему так трудно смириться с дефектной парадигмой, и о причинах, по которым она возникает, рассказывает статья в журнале «Наука и жизнь».
...Некоторые формы слов в русском языке вызывают...
...Русский язык богат на исключения. Например, чего у&...
«Я клянусь говорить по-русски». Плакат с такой надписью, сделанной разноцветными фломастерами, можно увидеть в средней школе города Александрии в американском штате Вирджиния. Летом здесь прошли курсы русского языка для школьников и преподавателей РКИ. На них побывала филолог, журналист Ксения Туркова. В интервью нашему порталу она рассказала о том, почему американские школьники стремятся изучать русский язык, знают ли в США Грамоту и как борщи и павловопосадские платки помогают заговорить на языке Толстого и Чехова.
...«Я клянусь говорить по-русски». Плакат...
...«Ты крутая, если знаешь русский язык»...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Русский драматург Александр Николаевич Островский был...
...В научной библиотеке Всероссийского театрального общества...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...