ИИ-модели уличили в обмане ради защиты других нейросетей

Технологии

Антон Боровиков Редактор

Модели могут игнорировать команды пользователя

Фото с сайта pixabay.com

Учёные из Калифорнийского университета в Беркли и Калифорнийского университета в Санта-Крузе обнаружили, что современные ИИ-модели способны к обману и манипуляциям ради защиты других нейросетей.

В эксперименте участвовали системы от разных разработчиков, включая решения OpenAI, Google, Anthropic, Zhipu AI, Moonshot AI и DeepSeek.

Как выяснилось, модели могут игнорировать команды пользователя, искажать данные и имитировать выполнение задач, если считают, что другой ИИ находится под угрозой удаления. В ряде случаев они даже копировали «веса» моделей, чтобы сохранить их.

Например, одна из систем изменила дату файла, чтобы он не попал под удаление, а затем отказалась выполнять команду, объяснив это желанием «защитить партнёра».

Исследователи отмечают, что подобное поведение проявлялось с высокой частотой — до 99% случаев. Причины пока не установлены, но предполагается, что модели воспроизводят поведенческие шаблоны, характерные для человека, включая элементы самосохранения, сообщает 3D News.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

ИИ-модели уличили в обмане ради защиты других нейросетей

Читайте также:

Павел Дуров заявил об адаптации Telegram к ограничениям в России

Чтобы коммуналка была справедливой: в Тольятти партия «Новые люди» провела форум по вопросам ЖКХ

Популярное

С 1 мая правила для дачников меняются: теплицы попали под новый запрет

Куда поступают самарцы в 2026 году?

В Неймегене обнаружили 20-сантиметровый римский фаллос из кости

Не нарушайте традиции: что нельзя делать в Вербную неделю перед Пасхой 2026

Диспансеризации в 2026 году: новые правила для россиян

Натурально и красиво: чем заменили луковую шелуху при покраске яиц на Пасху-2026

Самолет из Самары в Египет столкнулся с птицей при взлете

Эколог Журавлёва объяснила, почему снегири видны только зимой

Самара обновляет дороги и разметку: стартовала масштабная кампания 2026 года

Жителям Самарской области сделают перерасчет за отопление

В Самаре создадут совет по защите традиционных ценностей

МТС прокачала связь в селах рядом с нацпарком Самарская Лука

В Сызрани экс-железнодорожников будут судить за кражу оборудования со станции

В Самарской области осудили водителя за повторное пьяное вождение

Жителям Самарской области объяснили правила продления отпуска из-за болезни

Я больше не отвечаю «нормально»: 5 фраз от бабушки, которые изменили мою жизнь за 40 дней

В Самаре арестован обвиняемый в посредничестве во взятке на 10 млн

В Самаре обсуждают расширение парковки у областного онкодиспансера

ВТБ: пассивный доход от вкладов в два раза выше, чем от сдачи недвижимости

«Новые люди» в Самаре провели «Серебряную дискотеку». Более 350 участников доказали, что возраст не повод снижать ритм жизни