ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2217
Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
22 января 2025
Семья погибшего от отравления российского предпринимателя выставила 1,5-миллиардный счет армянской компании
22 января 2025
Трамп инвестирует 500 миллиардов долларов в искусственный интеллект через частные компании
22 января 2025
Словацкий премьер обвиняет протестующих в подготовке майдана
22 января 2025
Демократы оспаривают указ Трампа, лишающий детей нелегалов права на гражданство по рождению
22 января 2025
Павловский ПНИ снова в руках «Балтрос» с дополнительными средствами на завершение строительства
21 января 2025
Россия заявила о готовности выстраивать отношения с США, но ждет шагов от команды Трампа