Intrati in legatura

Schița de curs

Fundamentele AI Sigur și Echitabil

  • Concepte cheie: siguranță, părtinire, echitate, transparență
  • Tipuri de părtinire: din setul de date, de reprezentare, algoritmică
  • Prezentare generală a cadrelor de reglementare (Legea UE privind AI, GDPR etc.)

Părtinirea în Modelele Fine-Tuned

  • Cum poate introduce sau amplifica fine-tuning-ul părtinirea
  • Studii de caz și eșecuri din lumea reală
  • Identificarea părtinirii în seturile de date și predicțiile modelelor

Tehnici de Mitigare a Părtinirii

  • Strategii la nivel de date (reechilibrare, augmentare)
  • Strategii în timpul antrenamentului (regularizare, debiasing adversar)
  • Strategii post-procesare (filtrare a ieșirilor, calibrare)

Siguranța și Robustea Modelelor

  • Detectarea ieșirilor nesigure sau dăunătoare
  • Gestionarea inputurilor adverse
  • Testarea „red team” și testarea de stres a modelelor fine-tuned

Auditarea și Monitorizarea Sistemelor AI

  • Metrici de evaluare a părtinirii și echității (de ex., paritate demografică)
  • Instrumente de explicabilitate și cadre de transparență
  • Practici de monitorizare și guvernanță continuă

Seturi de Instrumente și Practică Hands-On

  • Utilizarea bibliotecilor open-source (de ex., Fairlearn, Transformers, CheckList)
  • Hands-on: Detectarea și mitigarea părtinirii într-un model fine-tuned
  • Generarea de ieșiri sigure prin designul și constrângerile prompturilor

Cazuri de Utilizare Întreprindere și Pregătire pentru Conformitate

  • Bune practici pentru integrarea siguranței în fluxurile de lucru LLM
  • Documentare și fișe de model pentru conformitate
  • Pregătirea pentru audituri și revizii externe

Rezumat și Pași Următori

Cerințe

  • Înțelegerea modelelor de machine learning și a proceselor de antrenament
  • Experiență în lucrul cu fine-tuning și modele de limbaj (LLMs)
  • Cunoașterea limbajului Python și a conceptelor de NLP

Public țintă

  • Echipe de conformitate AI
  • Ingineri de machine learning
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite