Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Традиционная лекция о найденных в 2023 году грамотах была прочитана не только в Москве, но и в Новгороде, где она уже в пятый раз вызвала интерес у археологов, историков и других новгородцев. В интервью лингвист, доктор филологических наук, академик РАН Алексей Алексеевич Гиппиус рассказывает о результатах новгородских раскопок.
...Традиционная лекция о найденных в 2023 ...
...Алексей Гиппиус дал интервью о берестяных грамотах...
...По словам Алексея Гиппиуса, берестяные грамоты ...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...Общее и различное в освоении языка ребенком и взрослым...
...В качестве хорошо известных фактов можно привести правила...
Пособие «Правила русской орфографии и пунктуации. Полный академический справочник» под редакцией доктора филологических наук Владимира Лопатина вышло в 2006 году. Анонсированный в СМИ проект свода вызвал беспокойство у общества. Эта статья призвана объяснить, какие новвоведения были внесены и почему необходимо периодически упорядочивать систему письма.
...Пособие «Правила русской орфографии и пунктуации...
...Орфография и пунктуация: обойдемся без паники...
...Работа по подготовке новой редакции «Свода правил...
Во время стрима «Лингвисты о лингвистках. Феминитивы в научном освещении» сотрудники Института языкознания РАН, ведущие подкаста «Глагольная группа» Игорь Исаев и Дмитрий Коломацкий обсудили явление, которое не уходит из новостной повестки и вызывает бесконечные споры. В обсуждении прозвучали экспертные мнения члена-корреспондента РАН Евгения Головко, доктора филологических наук Валерия Ефремова, блогера, преподавателя, автора книги «В начале было кофе» Светланы Гурьяновой, а в дополнительных материалах можно услышать научного сотрудника РГГУ Ирину Фуфаеву и научного сотрудника Института славяноведения РАН Глеба Пилипенко.
...Во время стрима «Лингвисты о лингвистках...
...На канале «Глагольная группа» вышел стрим о феминитивах...
...Что такое феминитивы? С точки зрения лингвистической...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Искусственный интеллект научили создавать конспекты...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Владимир Алпатов. Избранные труды XX века...
...Отдельно отметим раздел «Лингвистические задачи...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...Национальный словарный фонд обещают открыть для пользователей...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Какими методами можно изучать язык животных...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Мир ономастики интересен тем, что позволяет через имена и названия многое узнать об истории и культуре. Одних только русских фамилий насчитывается более 200 тысяч! Собранные под одной цифровой обложкой печатные выпуски уникальной газеты будут интересны широкой аудитории, особенно учащимся, школьным учителям и преподавателям вузов.
...Мир ономастики интересен тем, что позволяет через имена...
...Газета по ономастике «Мiръ имён и названiй» издана...
...Мы живем в мире имен и названий. Практически любое...