Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...1. Елена Уханова. У истоков славянской письменности...
Как всегда, статьи номера посвящены проблемам современного русского языка, истории языка и языку художественной литературы. Отметим отдельно три статьи, которые нас заинтересовали.
...Как всегда, статьи номера посвящены проблемам современного...
...О принципах составления нормативных словарей русского...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...
Нам трудно себе это представить, но зимние праздники еще двести лет назад выглядели совсем не так, как сегодня. И не только потому, что главным было Рождество, но и потому, что никаких новогодних и рождественских елок во времена Пушкина еще не было. Мы решили разобраться, как появилось в России главное новогоднее слово и какими еще словами сопровождается встреча Нового года.
...Нам трудно себе это представить, но зимние праздники...
...Святки, Рождество, Новый год Впервые елку на рождественские...
Российская Федерация — многонациональное государство. На ее территории функционируют более 150 языков, из которых около ста — языки коренных народов России, остальные — это языки компактно или диаспорно проживающих некоренных этносов. Полиэтничность Российского государства выражена в начальных строках Конституции: «Мы — многонациональный народ России».
...Российская Федерация — многонациональное...
...Государственно-политические аспекты лингвокультурной...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...