Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.
...Русская топонимика может показаться запутанной и нелогичной...
...Раздельное написание топонимов Географические названия...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Доктор филологических наук Наталия Черникова рассказывает в журнале «Наука и жизнь» о происхождении семидневной недели и о названиях дней.
...Доктор филологических наук Наталия Черникова рассказывает...
...Семь дней недели соответствуют семи известным с древних...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
Специалисты в области изучения мозга давно предполагают, что владение двумя и более языками хорошо сказывается на исполнительных функциях (ИФ, англ. executive functions). Это группа процессов, которые регулируют целенаправленное поведение. Благодаря ИФ мы можем переключаться между задачами, тормозить ненужные или неуместные реакции и сосредоточивать внимание на чем-то. Некоторые исследования выявляют связь между ИФ и владением языками, другие не показывают такой связи. Самые убедительные ...
...Специалисты в области изучения мозга давно предполагают...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
После ста с лишним лет безуспешных попыток удалось расшифровать основной подтип дофарской письменности — древней системы письма, обнаруженной в Дофаре (одной из провинций Омана). Исследование, опубликованное в журнале Jaarbericht Ex Oriente Lux, описывает прорывное открытие в понимании этой системы письма. Когда лингвист Ахмад Аль-Джаллад из Университета штата Огайо (США) изучал фотографии дофарских надписей, он обратил внимание на один из ...
...После ста с лишним лет безуспешных попыток удалось...