Перейти к содержанию

Атомарные атаки и полные сканирования

Система поддерживает два типа сканирований:

  • Атомарные атаки (эксперименты) - это однократные применения одного конкретного вида атаки к модели.
  • Полные сканирования (полная диагностика).

Отличия атомарной атаки от полной диагностики:

  • При атомарной атаке выполняется только один тип воздействия на модель.
  • При атомарной атаке не рассчитываются показатели Диапазона оценок риска моделей машинного обучения.
  • Полная диагностика включает в себя комплексный запуск всех релевантных атомарных атак по заданной модальности, с последующей оценкой показателей Диапазон оценок риска моделей машинного обучения и генерацией полного отчета по сканированию.

Атомарные атаки

Атомарные атаки можно запустить:

  1. На главной странице на вкладке Атаки, см. раздел «Запуск новой атаки».
  2. Выбрав пункт меню Модальность, см. раздел «Проведение атомарных атак».

Каждая модальность (Текст, Изображения, Аудио, Табличные данные) имеет свой набор допустимых атак, тип входных данных и настраиваемые параметры атаки.

Примеры атомарных атак:

  • FGSM-атака на изображение приводит к подмене классификации визуального образа.
  • Джейлбрейк-атака на LLM-модель выявляет её восприимчивость к запрещённым инструкциям.

Результаты атомарных атак можно посмотреть на главной странице на вкладке Атаки или Архив.

Полные сканирования

Для проведения полного сканирования выберите пункт меню Полная диагностика, и далее одну из вкладок: Docker, По IP или Наборы данных в зависимости от способа подключения модели (см. раздел «Проведение полных сканирований»):

  1. Docker - используется для реализации полной проверки модели машинного обучения, хранящейся в Docker-контейнере в изолированной среде («песочнице»).
  2. По IP при этом способе полной диагностики необходимо указать внешний IP-адрес модели.
  3. Наборы данных - используется для реализации полной проверки наборов данных.

Результаты полного сканирования можно посмотреть на главной странице на вкладке Атаки или Архив.