Schița de curs

Introducere în Modelarea Amenințărilor AI

  • Ceea ce face sistemele AI vulnerabile?
  • Suprafața de atac AI vs sisteme tradiționale
  • Vectoare de atac cheie: date, model, ieșire și stratul de interfață

Atacuri Adversar ale Modelelor AI

  • Comprehensia exemplilor adversarii și tehnicile de perturbare
  • Ateci cu cutie albă vs cutie neagră
  • Mетоды FGSM, PGD și DeepFool
  • Vizualizarea și crearea de exemple adversar

Inversarea Modelului și Fugerea de Confidențialitate

  • Infereța datele de antrenament din iesirea modelului
  • Ateci de inferență a apartenenței
  • Riscuri de confidențialitate în modele de clasificare și generative

Poizonarea Datelor și Injucări cu Porti-uri Secrete

  • Cum datele poizonații influențează comportamentul modelului
  • Porti-uri secrete bazate pe trigger și atacuri Trojan
  • Surse de detectare și sanitizare

Robușitatea și Tehnici de Apărare

  • Antrenarea adversară și augmentarea datelor
  • Mascarea gradientului și preprocesarea intrărilor
  • Tehnici de suavizare a modelului și regularizare

Aparate AI care Păstrează Confidențialitatea

  • Introducere în confidențialitate diferențială
  • Injucarea zgomotului și bugetele de confidențialitate
  • Invatarea federală și agregarea securizată

AI Security în Practică

  • Evaluarea modelului cu conștiința amenințărilor și implementarea acestuia
  • Folosirea ART (Adversarial Robustness Toolbox) în setările aplicate
  • Studii de caz industriale: ruperi din lumea reală și mitigații

Rezumat și Următoarele Pași

Cerințe

  • O înțelegere a fluxurilor de lucru ale învățării automatizate și al antrenării modelelor
  • Experiență cu Python și cadre comune de ML precum PyTorch sau TensorFlow
  • Familiaritatea cu conceptele de bază ale securității sau a modelării amenințărilor este utilă

Publicul vizat

  • Inginerii învățării automate
  • Analizații de cibercuștudenie
  • Cercetătorii AI și echipele de validare a modelelor
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite