Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Это не очень удобно, потому что количество слов превышает человеческие возможности их обработки, ни один словарь не фиксирует все, и, кроме того, словари не обновляются с такой скоростью, с какой появляется лексика....
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Откуда берутся и какую функцию выполняют бранные слова...
... Обычно это сильно эмоционально окрашенные слова, которые во многих случаях заменяются на выражения с отрицанием вроде ‘не очень хороший’. Интересно, как один топоним стал жертвой народной этимологии. Итальянский город Беневенто восходит к лат....
Мария Лебедева заведует лабораторией в Институте Пушкина и руководит образовательным направлением Грамоты. Она считает русский язык самым важным школьным предметом. Почему? И как сделать его живым, интересным и практически ценным для каждого школьника? Об этом она рассказала в лекции для преподавателей русского языка, прочитанной в рамках проекта «Тотальный диктант». Грамота предлагает краткий конспект этой лекции.
...Мария Лебедева заведует лабораторией в Институте...
...Самый важный предмет. Функциональный подход к обучению...
... Мы видим, что тот язык, которому мы обучаем на уроках русского языка, не очень пригодится ребенку в обычной жизни, он недостаточно функционален....
Лаконичный и логичный универсальный шрифт для незрячих, который используют во всем мире, — главная заслуга Луи Брайля. Этот человек отличался оригинальным умом, цельностью натуры и редкой настойчивостью. Вопреки представлениям своего времени он сумел доказать, что удобный для пальцев шрифт не обязан повторять шрифт, удобный для глаз. Исследователи предполагают, что если бы он не потерял зрение, то, скорее всего, стал бы математиком.
...Лаконичный и логичный универсальный шрифт для...
...Луи Брайль, человек-шрифт...
...Брайль с детства был не очень здоровым человеком, а в юности заболел туберкулезом. В 1840-х годах болезнь обострилась, и он был вынужден оставить преподавание....
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Заимствования из русского в языках народов России...
... Якутский, татарский и чеченский мы выбрали в качестве примеров потому, что они относятся к числу тех не очень многочисленных автохтонных языков России, которым не грозит исчезновение....
К языку средств массовой информации в последние годы читающей либо слушающей публикой и изучающими его специалистами-филологами предъявляются многочисленные и, увы, чаще всего вполне обоснованные претензии. Публику раздражает или шокирует, а специалистам кажется неоправданным или даже неприемлемым многое: и перенасыщение языка СМИ американизмами, и обилие в нем жаргонной, «блатной» и даже матерной лексики, и нарушение нормального темпа и нормативного интонационного рисунка речи.
...К языку средств массовой информации в последние годы...
...О некоторых особенностях языка средств массовой информации...
...Надо сказать, что исправить этот порок устной речи дикторов и ведущих не очень просто, но можно: необходимо, с одной стороны, осознание ими английской интонации в своей речи на русском языке именно как ошибки (а ведь осознать ошибку надо еще и захотеть), с другой стороны, им надо учиться подготовленной...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Бумага или «цифра»? Влияние формата чтения на понимание...
...«Ребенок, который не очень любит читать, скорее предпочтет читать с экрана, и наоборот: ребенок, который говорит, что читать он любит, скорее возьмет бумажную книгу....
Создатель и руководитель Саратовской лингвистической школы Ольга Борисовна Сиротинина в этом году отметила столетний юбилей. 75 лет она изучает русский разговорный язык. «Жизнь вопреки, или Я счастливый человек» — так называется книга мемуаров, которую ученики составили на основе ее устных рассказов.
...Создатель и руководитель Саратовской лингвистической...
...Ольга Сиротинина: «Так поняла, что Пушкин прав»...
...Негативным была не очень внятная речь (поскольку губы у меня после 1979 года парализованы, и я ничего тут не могу сделать). Положительного было много, но меня поразило то, что большинство отметили железную логику изложения»....
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Это не очень похоже на активацию врожденного механизма — больше похоже на постепенное обучение путем имитации. Известно, что ребенок начинает с несовершенных образцов речи, но постепенно говорит все лучше и лучше, и к пяти — семи годам овладевает родным языком....
Латинский язык нельзя назвать мертвым в той же мере, что древнеегипетский, хеттский или даже древнегреческий. Традиция преподавания латинского языка непрерывна и восходит к средневековым университетам; его до сих пор изучают историки, юристы, богословы, медики. Но уйти в прошлое ему не дают главным образом филологи-классики и многочисленные энтузиасты, которые до сих пор используют его для живого общения.
...Латинский язык нельзя назвать мертвым в той же...
...Латинский язык — самый живой из мертвых языков...
...Например, некоторые посты ВК-паблика «Латынь по-пацански» как будто написаны с помощью гугл-переводчика, который не очень хорошо справляется с задачей. Но само желание соприкоснуться с античной культурой можно только приветствовать....