Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.
...21 февраля в мире отмечается Международный день родного...
...Родные языки в опасности Языки выходят из употребления...
Ясный язык — это специальная упрощенная форма языка, для каждого языка — своя. В ней нет сложных и длинных конструкций, а слова сопровождаются простыми и наглядными картинками-пиктограммами. Чтобы создать «ясноязычную» версию текста, нужно владеть специальными навыками, ведь задача такой версии — помочь людям, которым по разным причинам трудно прочитать и понять то, что написано обычным языком.
...Ясный язык — это специальная упрощенная форма...
...Кому нужен ясный язык По мнению нейропсихолога Елены...
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Новые технологии «отвязали» текст не только...
...Начало. Чтение вслух Письменность появилась примерно...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Все исследователи языка сходятся во мнении, что мы переживаем время резкой активизации жаргона (арго, сленга). Жаргонизмы переполняют речь людей, СМИ, художественную литературу. В связи с этим возникает ряд вопросов, на которые согласился ответить автор «Словаря московского арго», профессор МГУ и доктор культурологии Владимир Станиславович Елистратов.
...Все исследователи языка сходятся во мнении, что мы...
...Грамота: Уникальна ли наша ситуация экспансии жаргонизмов...
Этой осенью Грамота вступает в эпоху перемен. В чем будут заключаться эти перемены? Какая идея стоит за ними? И, самое главное, будет ли Грамота по-прежнему самым авторитетным сетевым источником сведений о русском языке? О смысле обновления и планах на будущее рассказывает главный редактор портала Ксения Киселева.
...Этой осенью Грамота вступает в эпоху перемен. В чем...
...Маска, я вас знаю? В ноябре 2023 года Грамоте исполнится...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Дискурсивные формулы — это короткие устойчивые...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...