В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Ведущий подкаста «Сложное предложение» лингвист Игорь Исаев пригласил авторов книги «Запретные слова», докторов филологических наук Анатолия Баранова и Дмитрия Добровольского поговорить о русском мате: его изучении, его уместности и его табуированности. Грамота изложила близко к тексту фрагменты этого разговора.
...Ведущий подкаста «Сложное предложение»...
...Игорь Исаев: Зачем было писать эту книгу? Дмитрий...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Английский писатель-фантаст, автор романа «Россия во мгле», имел собственное мнение о том, как лучше преподавать русский язык иностранцам. Его точка зрения изложена в журнале «Наука и жизнь».
...Английский писатель-фантаст, автор романа «Россия...
...Герберт Уэллс считал, что Западу необходимо налаживать...
Исследователи Балтийского центра нейротехнологий и искусственного интеллекта БФУ им. Канта натренировали большую языковую модель на текстах трудов Иммануила Канта. В результате, по их словам, модель научилась поддерживать диалог о философских понятиях. Пресс-служба БФУ опубликовала несколько цитат из ответов бота. Например, вот как он отреагировал на вопрос, возможна ли ложь во спасение: «Дорогой друг, я считаю, что ложь не может быть использована во спасении. Ведь ложь противоречит ...
...Исследователи Балтийского центра нейротехнологий и...
Книга «Табу слов у народов Восточной Европы и Северной Азии» в двух частях — фундаментальный труд по этнографии и лингвистике, который не переиздавался с 1929 года. Этнограф и фольклорист Дмитрий Зеленин подробно описал языковые табу у разных народов Евразии в сопоставлении с другими регионами мира.
...Книга «Табу слов у народов Восточной Европы...
...Древние считали, что «подлинные» названия...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Одна из целей в обучении иностранному языку — помочь студенту понимать живую речь носителей. Здесь может быть полезен просмотр видео — не только обучающих фрагментов, но и любимых сериалов или фильмов. Вопрос в том, включать ли при этом субтитры на языке оригинала. Один подход заключается в том, чтобы смотреть запись без вспомогательных инструментов, в расчете на то, что студент научится различать знакомые слова на слух и по контексту ...
...Одна из целей в обучении иностранному языку ...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
С некоторых пор слово «виртуальный» стало очень модным. Его любят употреблять политики, общественные деятели, артисты, но они часто используют его не совсем в том значении, которое оно изначально имело.
...С некоторых пор слово «виртуальный» стало...
...В приложении «Москва» к еженедельнику &...