Schița de curs

Concepte și Metrice de Performanță

  • Latență, rata de procesare, utilizarea energiei, utilizarea resurselor
  • Bottlenecks la nivelul sistemului vs. modelului
  • Profiler pentru inferență vs. antrenament

Profiler pe Huawei Ascend

  • Folosirea profilerului CANN și MindInsight
  • Diagnostics ale kernel-urilor și operatorilor
  • Paterni de delegare și mapping-ul memoriei

Profiler pe Biren GPU

  • Caracteristici de monitorizare a performanței Biren SDK
  • Fuzionarea kernel-urilor, alinierea memoriei și cozi de executare
  • Profiler sensibil la consumul de energie și temperatură

Profiler pe Cambricon MLU

  • Unelte pentru performanță BANGPy și Neuware
  • Vizibilitate la nivelul kernel-urilor și interpretarea jurnalului
  • Integrarea profilerului MLU cu framework-uri de deploy

Optimizare la nivelul graficelor și modelului

  • Tehnici de tăiere a graficelor și cantitativizare
  • Fuzionarea operatorilor și restrucțuirea graficelor computaționale
  • Standardizarea dimensiunii intrării și ajustarea lotului

Optimizare a memoriei și kernel-urilor

  • Optimizarea dispoziției și a reințăririi memoriei
  • Gestionarea eficientă a bufferelor în treptele de chipset
  • Tehnici de ajustare la nivelul kernel-ului pentru fiecare platformă

Practici Optime Interplatforme

  • Portabilitatea performanței: strategii de abstractizare
  • Construirea unor pipeline-uri de ajustare partajate pentru medii cu multiple chipuri
  • Exemplu: ajustarea unei modele de detectare a obiectelor pe Ascend, Biren și MLU

Synopsis și Următoarele Pași

Cerințe

  • Experiență în lucru cu pipe-uri de antrenare sau deployare a modelelor AI
  • Înțelegere a principiilor computaționale GPU/MLU și optimizarea modelelor
  • Familiaritate de bază cu instrumentele și metricele de profilare a performanței

Audientă

  • Ingineri de performanță
  • Echipe de infrastructură de învățare automată
  • Arhitecți de sisteme AI
 21 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite