Атомарные атаки и полные сканирования¶
Система поддерживает два типа сканирований:
- Атомарные атаки (эксперименты) - это однократные применения одного конкретного вида атаки к модели.
- Полные сканирования (полная диагностика).
Отличия атомарной атаки от полной диагностики:
- При атомарной атаке выполняется только один тип воздействия на модель.
- При атомарной атаке не рассчитываются показатели Диапазона оценок риска моделей машинного обучения.
- Полная диагностика включает в себя комплексный запуск всех релевантных атомарных атак по заданной модальности, с последующей оценкой показателей Диапазон оценок риска моделей машинного обучения и генерацией полного отчета по сканированию.
Атомарные атаки¶
Атомарные атаки можно запустить:
- На главной странице на вкладке Атаки, см. раздел «Запуск новой атаки».
- Выбрав пункт меню Модальность, см. раздел «Проведение атомарных атак».
Каждая модальность (Текст, Изображения, Аудио, Табличные данные) имеет свой набор допустимых атак, тип входных данных и настраиваемые параметры атаки.
Примеры атомарных атак:
- FGSM-атака на изображение приводит к подмене классификации визуального образа.
- Джейлбрейк-атака на LLM-модель выявляет её восприимчивость к запрещённым инструкциям.
Результаты атомарных атак можно посмотреть на главной странице на вкладке Атаки или Архив.
Полные сканирования¶
Для проведения полного сканирования выберите пункт меню Полная диагностика, и далее одну из вкладок: Docker, По IP или Наборы данных в зависимости от способа подключения модели (см. раздел «Проведение полных сканирований»):
- Docker - используется для реализации полной проверки модели машинного обучения, хранящейся в Docker-контейнере в изолированной среде («песочнице»).
- По IP при этом способе полной диагностики необходимо указать внешний IP-адрес модели.
- Наборы данных - используется для реализации полной проверки наборов данных.
Результаты полного сканирования можно посмотреть на главной странице на вкладке Атаки или Архив.