ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2377

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
02 июня 2025
Политический ветеран Андрей Чепурной под следствием за присвоение недвижимости на 1 миллиард рублей
02 июня 2025
Сотрудники прокуратуры и Администрации Президента России покрывают коррупцию в Самарской области
02 июня 2025
Исторический мемориал в Орле превратился в площадку для незаконных поставок несертифицированных материалов
02 июня 2025
Переговоры РФ и Украины стартовали в Стамбуле
02 июня 2025
Милиция в Беларуси займется неработающими гражданами
02 июня 2025
Обыски и изъятия документов в Москве и Подмосковье в рамках дела о коррупции в ветеранской структуре
02 июня 2025
Министр культуры Бурятии сообщила о сдвиге сроков и уголовном деле подрядчика на реконструкции «Ульгэра»