Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...Чем отличаются по смыслу слова «знакомый», «друг» и...
...В статье анализируется группа слов, описывающих личные...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...Нейросеть помогает работать с церковнославянскими рукописями...
...До нас дошел очень большой массив рукописей на церковнославянском...
О необычных портретах, написанных при помощи букв и слов, рассказывает статья в журнале «Наука и жизнь».
...О необычных портретах, написанных при помощи букв и...
...«Словесные» портреты...
...Условные знаки, которые мы применяем на письме, произошли...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...Прогноз: текстовые данные для обучения нейросетей могут...
...В течение многих лет такие компании, как OpenAI...
Пятнадцать лет, прошедшие с начала развертывания широких и, без преувеличения, жестких дискуссий по национально-языковым проблемам на территории некогда единого государства, кажутся вполне достаточными для выявления основных тенденций в судьбе главного «героя» эпохи филологических войн — русского языка.
...Пятнадцать лет, прошедшие с начала развертывания широких...
...Русский язык в ближнем зарубежье и русская речь в российских...
...Если говорить о главном, то вопрос заключается...
Развитие лексики русского языка не только определяется внутрисистемными интенциями, но и находится под ощутимым давлением со стороны социальных факторов. Помимо появления новых реалий, требующих наименования, переосмысления уже существующих фактов действительности, поиска новых средств выразительности возникновение новых слов и значений может быть вызвано и напрямую определенными социальными событиями, катаклизмами.
...Развитие лексики русского языка не только определяется...
...«Застеколье» русского словообразования...
...Наименования таких событий становятся «ключевыми...
Проблема «отцов и детей» проявляется на разных уровнях: у представителей старшего и младшего поколения могут отличаться интересы, взгляды на жизнь, ценности. Но иногда им трудно понять друг друга в буквальном смысле — из-за разницы в языке. Грамота поговорила с доктором филологических наук, профессором МГПУ, заведующей кафедрой теории языка ГАУГН Еленой Борисовой о таком явлении, как язык поколений.
...Проблема «отцов и детей» проявляется...
...Язык поколений: в чем разница между лексиконами зумеров...
...О каком явлении идет речь Лингвисты определяют...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Искусственный интеллект научили создавать конспекты...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Если не учитывать историю происхождения слов, то даже в тех случаях, когда их родство очевидно носителям русского языка, их формально нельзя назвать однокоренными. Лингвист Борис Иомдин в журнале «Русская речь» предлагает использовать более гибкую методику оценки школьных заданий на сравнение корней.
...Если не учитывать историю происхождения слов, то даже...
...«Давать» и «дарить»: какие слова можно считать однокоренными...
...Если в слове воробей мы выделим корень -воробей...