Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Издательство «Грамота» выпустило новый словарь для 5–9-х классов. Его придумали и подготовили сотрудники Института русского языка им. В. В. Виноградова РАН, которые стремились соединить принципы академической лексикографии с потребностями и интересами современного школьника. Какие идеи заложены в словарь, что в нем особенного, чем он может быть полезен и интересен детям? Мы поговорили об этом с двумя членами авторского коллектива, кандидатами филологических наук Анной Владимировной Занадворовой, ведущим научным сотрудником отдела современного русского языка, и Еленой Андреевной Никишиной, научным сотрудником того же отдела и доцентом Школы лингвистики НИУ ВШЭ.
...Издательство «Грамота» выпустило новый...
...Зачем понадобился новый словарь? Анна Занадворова:...
Оценивая состояние языка, необходимо разграничивать три вида процессов: 1) в условиях функционирования языка; 2) в построении текста; 3) в системе языка. Раскрепощение, возможность свободно выражать свои мысли и чувства, игры с языком и при помощи языка — вот что характерно для русского языка нашего времени.
...Оценивая состояние языка, необходимо разграничивать...
...В последние десятилетия особенно резко изменились...
Лаконичный и логичный универсальный шрифт для незрячих, который используют во всем мире, — главная заслуга Луи Брайля. Этот человек отличался оригинальным умом, цельностью натуры и редкой настойчивостью. Вопреки представлениям своего времени он сумел доказать, что удобный для пальцев шрифт не обязан повторять шрифт, удобный для глаз. Исследователи предполагают, что если бы он не потерял зрение, то, скорее всего, стал бы математиком.
...Лаконичный и логичный универсальный шрифт для...
...Счастливое детство и несчастный случай Луи Брайль...
Чтобы возникла лаконичная и удобная система Брайля, понадобилось объединить достижения человеческой мысли в разных областях: идеи просветителей, усилия педагогов, мастерство криптографов. Спустя двести лет шрифт Брайля не устарел и сегодня востребован в цифровом мире.
...Чтобы возникла лаконичная и удобная система Брайля...
...Новаторы XIX века В 1824 году пятнадцатилетний...
Слова, у которых изменилось написание, выбор между «слитно» и «раздельно», новые или разговорные слова, которых еще нет в словарях, — все это сложные случаи, которые могут вызвать затруднения даже у очень грамотных кандидатов филологических наук. Давайте познакомимся поближе с этими опасными экземплярами.
...Слова, у которых изменилось написание, выбор между...
...Старая новая норма «Почему в книге 1952&...
ХХ век дал миру три бесспорных лингвистических гения — Фердинанда де Соссюра, Вилема Матезиуса и Лео Вайсгербера, но Вильгельм фон Гумбольдт (1767–1835) и до сих пор остается самой яркой звездой на лингвистическом небосклоне. У него было много восторженных поклонников. Но они не были объединены в научную школу. Вот почему о гумбольдтианстве как единой научной школе говорить не приходится.
...ХХ век дал миру три бесспорных лингвистических...
...В конце XIX века Георг фон Габеленц писал: «...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...