Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Естественные языки складывались сами собой. В них много нелогичного, случайного, избыточного, двусмысленного, сложного. А что если попробовать создать «разумный язык», специально «скроить» его так, чтобы он точно описывал мир и облегчал взаимопонимание? История знает несколько таких попыток: грандиозных, но неудачных.
...Естественные языки складывались сами собой. В них много...
...Лингвистические утопии просветителей Джон Уилкинс...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Когда мы говорим «словарь», какие издания приходят в голову прежде всего? Наверняка кто-то вспомнит словари Даля, Ожегова и Ушакова, филологи назовут словарь Фасмера, люди старшего поколения — энциклопедию Брокгауза и Ефрона. Словарные статьи в нашем представлении обычно начинаются со слова или словосочетания и следуют друг за другом в алфавитном порядке. Но есть словари, которые устроены совсем иначе: в них единицы отобраны и организованы в единое целое по другим принципам.
...Когда мы говорим «словарь», какие издания...
...Что нового могут придумать лексикографы Лексикография...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
3 февраля отмечают Всемирный день борьбы с ненормативной лексикой, заявленная цель которого — призвать людей отказаться от использования мата и привлечь внимание к вопросам культуры речи. И хотя история появления этого дня туманна, у нас есть хороший повод обсудить, что такое обсценная лексика, почему она табуирована и как к ней относятся в разных странах.
...3 февраля отмечают Всемирный день борьбы с ненормативной...
...Мать, театр и строгая критика Строго говоря,...
Считается, что каждый естественный язык так или иначе связан с картиной мира говорящего на нем народа, отражает его историю, культуру, ценности, мышление. Япония — одна из соседних с Россией стран, но многое в культуре японцев для нас непонятно и удивительно. О том, что можно узнать о японцах, изучая японский язык, Грамота расспросила лингвиста и переводчика, сотрудника Института востоковедения РАН, автора телеграм-канала tarasawa_presents Екатерину Тарасову.
...Считается, что каждый естественный язык так или иначе...
...Система уровней вежливости Чужие и статусные Лингвисты...
ХХ век дал миру три бесспорных лингвистических гения — Фердинанда де Соссюра, Вилема Матезиуса и Лео Вайсгербера, но Вильгельм фон Гумбольдт (1767–1835) и до сих пор остается самой яркой звездой на лингвистическом небосклоне. У него было много восторженных поклонников. Но они не были объединены в научную школу. Вот почему о гумбольдтианстве как единой научной школе говорить не приходится.
...ХХ век дал миру три бесспорных лингвистических...
...В конце XIX века Георг фон Габеленц писал: «...
Представьте себе словарь, в котором значения слов зависят от возраста читающего, его культурного бэкграунда, политических взглядов и даже формата книги. Именно так обстоят дела с эмодзи — универсальными и одновременно субъективными пиктограммами, которыми каждый день пользуются миллионы людей во всем мире.
...Представьте себе словарь, в котором значения слов зависят...
...Этот материал — часть совместного...