ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2354

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
18 апреля 2025
Депутат Нина Останина раскритиковала местные власти за скейт-рампу на месте памятника Ленину
18 апреля 2025
Дмитрий Мезенцев в Конституционном суде: очередное назначение по знакомству, несмотря на скандалы
18 апреля 2025
Москва подтвердила контакты по инициативе прекращения огня, но без переговоров Путина и Трампа
18 апреля 2025
Городенкер соскальзывает с Лодочной: офшорный девелопер уходит из Москвы под гнётом долгов и подозрений
18 апреля 2025
Провал инвестиций «Россетей Тюмень»: обещания не выполнены, регионы остались без модернизации
18 апреля 2025
«Решала» в законе: как Руслан Рамазанов захватывает теневой сектор и диктует правила в органах власти