Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В новом номере журнала среди прочих тем обсуждаются отглагольные существительные в русских говорах, язык личных писем первой жены Петра I Евдокии Лопухиной и правила пунктуационного оформления определительных оборотов в препозиции.
...В новом номере журнала среди прочих тем обсуждаются...
...Диалектные слова для взяточников и взяткодателей...
Изменения в законе о государственном языке были закреплены в виде отдельного федерального закона в феврале 2023 года. В новой версии закон о госязыке ограничивает употребление слов и выражений, не соответствующих нормам современного русского литературного языка, кроме иностранных слов без общеупотребительных аналогов в русском языке, которые будут зафиксированы в нормативных словарях. Однако, как отмечают авторы нового законопроекта, не все сферы оказались охвачены. «Рекламные ...
...Изменения в законе о государственном языке были закреплены...
О том, как глагол «слямзить» связан с лямкой и что значат слова «лямза», «лямить» и «лямзить», можно прочитать в рубрике «Беседы о языке» журнала «Наука и жизнь».
...О том, как глагол «слямзить» связан с лямкой...
...В рассказе «Столичная штучка» Михаил Зощенко...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
Вопросы функционального взаимодействия языков в различных сферах многоэтничного сообщества приобретают особую актуальность и остроту на каждом очередном витке модернизации или на этапе перехода общества из одного социально-политического и идеологического состояния в другое.
...Вопросы функционального взаимодействия языков в различных...
...Удивительно сходными в этом отношении предстают перед...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Картина русского языка к концу ХХ столетия изменилась. Одно из очевидных изменений — в лексике, прежде всего в таких сферах, как политическая, экономическая лексика. При этом изменения в русском языке не носят исключительного характера и не столь объемны, как это казалось некоторым лингвистам, слишком жестко увязывавшим политические события с языковой реальностью.
...Картина русского языка к концу ХХ столетия изменилась...
...Меру и степень состоявшихся и происходящих языковых...