Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В издательстве «Дискурс» вышла монография двух докторов филологических наук Максима Кронгауза и Марии Ковшовой «Смех не без причины», посвященная разным жанрам сетевой поэзии, таким как, например, пирожки, порошки и депрессяшки, и языковым механизмам, которые заставляют читателя смеяться.
...В издательстве «Дискурс» вышла монография...
...В центре внимания авторов текста —...
Почему мы иногда говорим где территориально, а не просто где? О каких тенденциях говорят слова из молодежного сленга масик, чечик и нормис? Какие функции в речи выполняют слова вроде штуковина с размытой семантикой? Эти и множество других тем рассматриваются в новом номере «Трудов Института русского языка им. В. В. Виноградова», посвященном 90-летию Леонида Петровича Крысина.
...Почему мы иногда говорим где территориально, а...
...Где территориально и когда по времени Обе...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Нецензурная брань — тема, которая вызывает в обществе вопросы, споры, недопонимание и разногласия. Нормы законодательства карают за использование таких слов в публичной коммуникации. Культурное табу ослабевает, но по-прежнему действует, особенно в письменной речи. Но при этом странно делать вид, что этих слов не существует или не должно быть в языке. Два доктора наук, специалисты по русской фразеологии, рискнули изучить этот пласт лексики с научной точки зрения и рассказать о своих результатах взрослым читателям.
...Нецензурная брань — тема, которая вызывает в...
...Анатолий Баранов и Дмитрий Добровольский в 1990-е годы...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Человечество постоянно изобретает способы превратить агрессию в созидательную энергию. Будь то поэтическая дуэль скальдов, современный рэп-батл или прием буддийского мастера, — оскорбление, лишенное своего буквального значения и помещенное в контекст ритуала, становится особым способом социального взаимодействия и даже формой искусства.
...Человечество постоянно изобретает способы превратить...
...Дазенс: словесный бокс — Твоя мама такая...
Об истории появления буквы «э» в русском алфавите и о сложных случаях ее употребления рассказывает журнал «Наука и жизнь».
...Об истории появления буквы «э» в русском...
...Э появилась в русской письменности позже большинства...
IX Международная научная конференция «Фонетика сегодня» пройдет в Институте русского языка им. В. В. Виноградова РАН в очно-дистанционном формате (возможно участие онлайн). На конференции предлагается к обсуждению широкий круг тем: актуальные проблемы сегментной фонетики; актуальные проблемы суперсегментной фонетики: ударение, интонация; актуальные проблемы фонологии; история звуковой системы; орфоэпия: дескриптивные описания и проблемы ...
...IX Международная научная конференция «Фонетика...
В подкасте «Как это по-русски» наше внимание привлекли выпуски, посвященные святочным словам, устаревшей лексике и языку геймеров, которые показывают глубину и разнообразие того, что мы привычно называем нашим родным языком.
...В подкасте «Как это по-русски» наше...
...Святочные слова. Что такое сочиво и чем угощать...