Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Европейский союз и Совет Европы объявили первый год нового тысячелетия Европейским годом языков — 2001. Каждый язык занимает важное место в культурном наследии Европы и в ее будущем. Трудно себе представить культурные события, произведения литературы, искусства, научные и другие открытия без упоминания каких-либо имен, принадлежащих языковому многообразию Европы.
...Европейский союз и Совет Европы объявили первый год...
...Наряду с изучением иностранных языков в Европейский...
Словесные игры — это развлечение для ума и души. Массовый успех простой онлайн-игры «Вордли», в которую играли миллионы людей по всему миру во время пандемии, доказал, что составлять слова интересно всем. Но играть всегда лучше в компании, а словесные игры идеально подходят для того, чтобы развлечься в пути, провести вечер с друзьями на даче или сблизить незнакомых людей на вечеринке. Мы собрали игры разного типа, чтобы вы могли выбрать свой набор в зависимости от ваших склонностей и обстоятельств.
...Словесные игры — это развлечение для ума...
...Устные игры Ассоциации Количество участников...
В старые времена люди переписывали книги пером: «что написано пером, не вырубишь топором»... Относительно недавно многие писали от руки большие тексты и только потом печатали их на пишущей машинке. Сегодня мы всё реже оказываемся в ситуации, когда без ручного письма не обойтись. Значит ли это, что скоро оно отомрет за ненадобностью? Или у него есть ценные стороны, которые дадут шанс на долгую жизнь?
...В старые времена люди переписывали книги пером...
...Как развивалась письменность Изначально для передачи...
Ведущий канала «Основа» Борис Веденский и доктор филологических наук, автор книги «Происхождение языка» Светлана Бурлак выясняли, был ли у человечества единый праязык, смогут ли все языки объединиться в один и как английскому языку повредила глобализация.
...Ведущий канала «Основа» Борис Веденский...
...Обезьяны в определенный момент научились обмениваться...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Согласно последнему исследованию «Яндекс Маркета» (о нем рассказывают «Известия»), более половины опрошенных россиян (54%) употребляют диалектизмы в своей речи, а каждый третий использует такие слова при поиске товаров онлайн. Региональная лексика существенно влияет на покупательские решения. 68% респондентов отметили, что с большей вероятностью сделают покупку, если в описании или названии товара встретят знакомую местную лексику. Кроме ...
...Согласно последнему исследованию «Яндекс Маркета...