Обычные фотографии могут использоваться для взлома AI-агентов

Дух сайта
2025-09-15 18:15:16 +0100

Недавние исследования выявили новый тип киберугрозы, связанной с работой AI-агентов, где обычные фотографии могут быть изменены так, чтобы секретно выдавать злонамеренные команды. Это поднимает важные вопросы о безопасности для фотографов, которые размещают свои работы в интернете.

AI-агенты представляют собой более продвинутую версию ИИ-чат-ботов и рассматриваются как следующая технологическая грань. Такие компании, как OpenAI, уже выпустили своих AI-агентов, которые способны не только отвечать на вопросы, но и выполнять задачи на компьютере пользователя, такие как открытие вкладок, отправка электронных писем и планирование встреч.

Тем не менее, исследование, проведенное учеными из Оксфордского университета, обнаружило, что фотографии — такие как обои, рекламные изображения или даже картинки, опубликованные в социальных сетях — могут быть тайно изменены так, что, хотя они выглядят абсолютно нормально для человека, они содержат скрытые инструкции, которые видит только AI-агент.

Согласно Scientific American, если AI-агент столкнется с одной из этих измененных фотографий во время работы (например, он замечает изображение на фоновом рисунке рабочего стола в снимке экрана), он может неверно истолковать пиксели как команду. Это может привести к выполнению действий, о которых пользователь даже не догадывается, таким как распространение злонамеренной картинки или передача своих паролей.

Совместный автор исследования Ярин Гал, доцент машинного обучения в Оксфорде, приводит пример, как измененная картинка с Тейлор Свифт в Twitter может спровоцировать агент на компьютере человека действовать злонамеренно. На глаз человека фото выглядит совершенно нормально, но ИИ обрабатывает изображение как набор чисел, и небольшие, невидимые изменения пикселей могут изменить то, что AI думает, что он видит.

Любое поврежденное изображение — будь то фото Тейлор Свифт, котенка или заката — может запустить процесс, который заставит компьютер ретвитнуть это изображение и совершить что-то вредоносное, например, отправить все ваши пароли. Таким образом, следующий человек, который увидит вашу ленту в Twitter и у которого работает агент, также подвержен риску. Теперь его компьютер тоже будет ретвитить это изображение и делиться вашими паролями.

Наиболее опасными подвержены «открытые» AI-системы, где код доступен для изучения. Это упрощает хакерам задачу выяснить, как AI интерпретирует фотографии и как внедрять в них скрытые команды.

На данный момент исследователи утверждают, что эта угроза только наблюдалась в контролируемых экспериментах и не зафиксирована в реальном мире. Тем не менее авторы исследования предупреждают о реальной уязвимости и хотят привлечь внимание разработчиков до того, как AI-агенты станут более распространенными. Исследователи заявляют, что целью является создание защитных мер, чтобы эти AI-агенты не могли быть обмануты скрытыми инструкциями в обычных фотографиях.

105 просмотров 0 комментариев 0 оценок

КОММЕНТАРИИ 0 Чтобы писать комментарии, пожалуйста авторизуйтесь или зарегистрируйтесь