Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.
...Революция нейросетей началась с текста. Но в ...
...Грамота: В 2024 году Нобелевскую премию по...
Пол Грэм — американский программист, предприниматель, один из создателей бизнес-инкубатора Y Combinator для стартапов в сфере информационных технологий. А еще человек пишущий — автор нескольких книг по программированию и многочисленных эссе, например «Как начать стартап» и «Как правильно возражать». В октябре он опубликовал в своем блоге текст об умении писать тексты. Грамота перевела его для вас, воспользовавшись помощью нейросетевых технологий.
...Пол Грэм — американский программист, предприниматель...
...Обычно я неохотно делаю прогнозы относительно технологий...
Новогодние праздники — удачное время, чтобы отвлечь ум от насущных дел и предложить ему что-то новое и увлекательное. А книги о языке подходят для этого как нельзя лучше: тут и история слов, чтобы блеснуть эрудицией в разговоре, и волнующие загадки древности, и игры для взрослой и детской компании. Мы собрали для вас разнообразную предпраздничную подборку — семь книг, которые приятно дарить, но всегда можно оставить себе!
...Новогодние праздники — удачное время, чтобы...
...1. Синклер Маккей. Шифры цивилизации: коды, секретные...
Какие этапы проходит иноязычное слово, прежде чем стать своим, окончательно закрепиться в русском языке? Об этом – в интереснейшей статье Леонида Петровича Крысина «Этапы освоения иноязычного слова», опубликованной в журнале «Русский язык в школе» (№ 2, 1991).
...Какие этапы проходит иноязычное слово, прежде...
...В школьной программе и учебниках русского языка не...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
Грамота спросила диалектолога и фонетиста Игоря Исаева, где в России можно услышать самые необычные диалекты, что влияет на их сохранность и кто из информантов ему запомнился за многие годы работы в экспедициях.
...Грамота спросила диалектолога и фонетиста Игоря...
...Грамота: Когда вы впервые столкнулись с диалектной...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...