Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Журнал «Наука и жизнь» проводит конкурс «Игры со словами». Перед вами третье задание конкурса, автор которого — кандидат филологических наук Илья Иткин. Итоги конкурса будут подведены в конце года. Победителей ждут призы от редакции журнала и ведущего игры Сергея Федина.
...Журнал «Наука и жизнь» проводит конкурс...
...На олимпиаде по лингвистике и математике, состоявшейся...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Международная акция «Тотальный диктант» пройдет 20 апреля уже в двадцать первый раз. Ее цель — объединить всех, кто любит русский язык, хочет лучше писать и говорить по-русски. Кроме того, диктант знакомит участников с современной литературой на русском языке: автором текста диктанта каждый год выбирают российского писателя. В 2024 году им стала Анна Матвеева, известная благодаря роману «Перевал Дятлова, или Тайна девяти». Вот ...
...Международная акция «Тотальный диктант»...
Инициатором выступило общественное движение «Всебурятская ассоциация развития культуры». О содержании проекта организаторы рассказали на пресс-конференции 22 апреля. Предполагается, что реалити-шоу «YЗЭсХЭЛЭНтэ буряад» («Учи язык») выйдет в эфир на телеканале «Буряад ТВ» в июне 2024 года. Участники должны будут за два месяца освоить основы разговорного бурятского языка. Команда победителей отправится на фестиваль ...
...Инициатором выступило общественное движение «...
Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты Школы лингвистики ВШЭ и других вузов. Школьники получают представление о разнообразии естественных языков, лингвистической типологии, современных достижениях фонетики, морфологии, синтаксиса, семантики, социолингвистики. Слушатели погружаются в проблемы современной компьютерной лингвистики, знакомятся с машинным обучением и его использованием в изучении языка. Занятия бесплатные. Актуальная информация о семинарах публикуется в группе ...
...Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...