Schița de curs

Prezentarea ecosistemului AI chinezesc GPU

  • Comparație între Huawei Ascend, Biren, Cambricon MLU
  • CUDA vs CANN, Biren SDK și modelele BANGPy
  • Trenduri industriale și ecosisteme de furnizori

Pregătirea pentru migrație

  • Evaluarea codului sursă CUDA
  • Identificarea platformelor țintă și versiunilor SDK
  • Instalarea lanțurii instrumentale și configurarea mediu

Tehnici de traducere a codului

  • Ponterizarea accesului la memorie CUDA și logica nucleelor
  • Mapearea modelelor grilei de calcul/threads
  • Opțiuni de traducere automatizată vs manuală

Implementări specifice platformelor

  • Folosirea operatorilor Huawei CANN și nucleelor personalizate
  • Pipeline-ul de conversie Biren SDK
  • Reconstrucția modelului cu BANGPy (Cambricon)

Testare și optimizare inter-platformă

  • Afisarea profilurilor executiei pe fiecare platforma țintă
  • Ajustarea memoriei și comparațiile de execuție paralelă
  • Urmarirea performanței și iterații

Gestionarea mediilor mixte GPU

  • Distribuirea hibridă cu mai multe arhitecturi
  • Strategii de cădere înapoi și detecția dispozitivului
  • Niveluri de abstracție pentru menținerea codului

Cazuri studiu și cele mai bune practici

  • Ponterizarea modelelor de visionare/NLP spre Ascend sau Cambricon
  • Adăugarea pipeline-urilor de inferență pe clustere Biren
  • Gestionarea discrepanțelor de versiuni și gâlbi ale API-urilor

Synopsis și următoarele pași

Cerințe

  • Experiență în programare cu CUDA sau aplicații bazate pe GPU
  • Înțelegere a modelelor de memorie și nucleelor de calcul ale GPU
  • Familiaritate cu fluxurile de lucru pentru deploy sau accelerare a modelelor AI

Publicul vizat

  • Programatori GPU
  • Arhitecți de sistem
  • Especialiști în portabilizare
 21 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite