НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Наш мозг любит находить знакомые шаблоны — в том числе в языке. Иногда это приводит к забавным и живучим ошибкам в понимании происхождения слов. Рассказываем, как народная этимология переписывает историю слов и почему мы так легко верим «альтернативным» версиям.
...Наш мозг любит находить знакомые шаблоны — в...
...1. Слишком простое объяснение: богадельня &mdash...
Надписывать кнопки — что в этом сложного? С этим справится любой копирайтер. Но это, наверное, скучно? Для копирайтеров, а также редакторов, корректоров и журналистов, которые хотят стать UX-редакторами, есть две новости: это интересная и востребованная профессия, но думать только про слова не получится. Текст — это очевидный результат, но за хорошим текстом стоит погружение в технологии, умение переводить с технического на простой и привычка ставить себя на место самого неискушенного пользователя.
...Надписывать кнопки — что в этом сложного? С этим...
...Работать с людьми и смыслами UX-редактор (UX от англ...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
В новом разделе «Библиотека о Толстом» теперь есть возможность удобного поиска по свидетельствам современников Толстого и исследованиям толстоведов. Пока что в библиотеку включены записи трех важнейших свидетелей жизни Толстого: врача Душана Маковицкого, пианиста Александра Гольденвейзера и жены писателя Софьи Андреевны Толстой, — но коллекция свидетельств будет пополняться. Также у специалистов и любителей будет возможность ...
...В новом разделе «Библиотека о Толстом...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Индская, или Хараппская, цивилизация — одно из древнейших городских обществ в мире, возникшее около 5,3 тыс. лет назад на территории современной северо-западной Индии и Пакистана. С момента ее открытия прошло сто лет, но изучение ее особенностей затруднено из-за того, что мы пока не знаем ее языка. В книге индолога Грегори Посселя перечислены 60 важнейших попыток дешифровки, и среди них нет двух, которые были бы согласны друг с другом в трактовке значения символов.
...Индская, или Хараппская, цивилизация — одно из...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...