Schița de curs

Introducere în arhitectura Biren GPU

  • Prezentare generală a Birien și cazuri de utilizare
  • Layout hardware: nucleu, memorie, clustere de calcul
  • Comparativ cu NVIDIA și AMD GPU

Configurarea mediului Biren Programming

  • Instalarea pachetului SDK Biren și runtime
  • Comprehesionarea șirului de instrumente și modelului compilator
  • Structura proiectelor de bază și procesul de construire

GPU Programming cu pilota Biren

  • Modele de thread și bloc
  • Gestionarea memoriei și transferurile de date
  • Dezvoltarea nucleelor și modele de lansare

Portat de la CUDA la Biren

  • Tehnici de traducere pentru codul CUDA
  • Mapearea API-urilor și adaptările comune
  • Laboratoare de conversie a codului și practică

Depanare și profilizare

  • Utilizarea depenerei și profilizatorului Biren
  • Identificarea punctelor de blocare
  • modele de acces la memorie și optimizări

Tehnici de optimizare

  • Programare thread și canalizarea instrucțiunilor
  • Desvăluire ciclică a buclelor și utilizarea memoriei partajate
  • Afinarea avansată a nucleelor pentru prelucrare

Studiu de caz și exemple de aplicații

  • Antrenament al unui model cu acceleratoare Biren
  • Portat și profilizare a unui model de viziune sau NLP
  • Compararea performanței cu CUDA/NVIDIA

Rezumat și următoarele pași

Cerințe

  • O înțelegerea arhitecturii GPU și a procesării paralele
  • Experiență cu CUDA, OpenCL, sau medii de programare similare GPU
  • Familiaritatea cu cadrele pentru învățarea profundă precum PyTorch sau TensorFlow

Publicul vizat

  • Dezvoltatori HPC
  • Ingineri infrastructură AI
  • Specialişti în optimizarea performanței
 21 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Upcoming Courses

Categorii înrudite