Cursuri de pregatire Programare GPU cu OpenACC
OpenACC este un standard deschis pentru programarea eterogenă care permite rularea unui cod pe diferite platforme și dispozitive, cum ar fi procesoare multicore, GPU, FPGA și altele.
Acest training condus de un instructor, în format live (online sau la fața locului), este destinat dezvoltatorilor de nivel începător până la intermediar care doresc să utilizeze OpenACC pentru a programa dispozitive eterogene și să exploateze paralelismul acestora.
La sfârșitul acestui training, participanții vor putea:
- Să configureze un mediu de dezvoltare OpenACC.
- Să scrie și să ruleze un program OpenACC de bază.
- Să adnoteze codul cu directive și clauze OpenACC.
- Să utilizeze API-ul și bibliotecile OpenACC.
- Să profileze, să depisteze erori și să optimizeze programe OpenACC.
Formatul cursului
- Curs interactiv și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a stabili detaliile.
Schița de curs
Introducere
- Ce este OpenACC?
- OpenACC vs OpenCL vs CUDA vs SYCL
- Prezentare generală a caracteristicilor și arhitecturii OpenACC
- Configurarea mediului de dezvoltare
Început
- Crearea unui proiect OpenACC în Visual Studio Code
- Explorarea structurii și fișierelor proiectului
- Compilarea și rularea programului
- Afișarea rezultatelor cu printf și fprintf
Directive și clauze OpenACC
- Înțelegerea directivelor și clauzelor OpenACC
- Utilizarea directivelor parallel pentru crearea de regiuni paralele
- Utilizarea directivelor kernels pentru paralelism gestionat de compilator
- Utilizarea directivelor loop pentru paralelizarea buclelor
- Gestionarea mișcării datelor cu directivele data
- Sincronizarea datelor cu directivele update
- Îmbunătățirea reutilizării datelor cu directivele cache
- Crearea funcțiilor pe dispozitiv cu directivele routine
- Sincronizarea evenimentelor cu directivele wait
API OpenACC
- Înțelegerea rolului API-ului OpenACC
- Interogarea informațiilor și capabilităților dispozitivului
- Setarea numărului și tipului de dispozitiv
- Gestionarea erorilor și excepțiilor
- Crearea și sincronizarea evenimentelor
Biblioteci și interoperabilitate OpenACC
- Înțelegerea bibliotecilor și interoperabilității OpenACC
- Utilizarea bibliotecilor matematice, de numere aleatoare și complexe
- Integrarea cu alte modele (CUDA, OpenMP, MPI)
- Integrarea cu biblioteci GPU (cuBLAS, cuFFT)
Instrumente OpenACC
- Înțelegerea instrumentelor OpenACC în dezvoltare
- Profilarea și depanarea programelor OpenACC
- Analiza performanței cu PGI Compiler, NVIDIA Nsight Systems, Allinea Forge
Optimizare
- Factorii care afectează performanța programelor OpenACC
- Optimizarea localității datelor și reducerea transferurilor
- Optimizarea paralelismului și fuziunii buclelor
- Optimizarea paralelismului și fuziunii kernel-urilor
- Optimizarea vectorizării și auto-ajustării
Rezumat și pași următori
Cerințe
- Cunoștințe de bază în limbajele C/C++ sau Fortran și concepte de programare paralelă
- Cunoștințe de bază despre arhitectura calculatoarelor și ierarhia memoriei
- Experiență cu instrumente de linie de comandă și editori de cod
Public țintă
- Dezvoltatori care doresc să învețe cum să utilizeze OpenACC pentru a programa dispozitive eterogene și să exploateze paralelismul acestora
- Dezvoltatori care doresc să scrie cod portabil și scalabil care să ruleze pe diferite platforme și dispozitive
- Programatori care doresc să exploreze aspectele de nivel înalt ale programării eterogene și să își optimizeze productivitatea codului
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Programare GPU cu OpenACC - Rezervare
Cursuri de pregatire Programare GPU cu OpenACC - Solicitare
Programare GPU cu OpenACC - Cerere de consultanta
Cerere de consultanta
Cursuri viitoare
Cursuri înrudite
Dezvoltarea Aplicațiilor AI cu Huawei Ascend și CANN
21 OreHuawei Ascend este o familie de procesoare AI proiectate pentru inferență și antrenament de înaltă performanță.
Această formare condusă de un instructor, live (online sau la fața locului), este destinată inginerilor AI și oamenilor de știință de date de nivel intermediar care doresc să dezvolte și să optimizeze modele de rețele neuronale folosind platforma Huawei Ascend și toolkit-ul CANN.
La finalul acestei formări, participanții vor putea:
- Să configureze și să seteze mediul de dezvoltare CANN.
- Să dezvolte aplicații AI folosind fluxurile de lucru MindSpore și CloudMatrix.
- Să optimizeze performanța pe NPU-urile Ascend folosind operatori personalizați și tiling.
- Să implementeze modele în medii de tip edge sau cloud.
Formatul Cursului
- Prezentare interactivă și discuții.
- Utilizare practică a platformei Huawei Ascend și a toolkit-ului CANN în aplicații exemplu.
- Exerciții ghidate axate pe construirea, antrenarea și implementarea modelelor.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o formare personalizată pentru acest curs bazată pe infrastructura sau seturile de date ale dumneavoastră, vă rugăm să ne contactați pentru a aranja.
Deploying AI Models with CANN și Procesatoarele Ascend AI
14 OreCANN (Compute Architecture for Neural Networks) este pilonul de calcul AI al Huawei pentru a depune și optimiza modelele AI pe procesorii Ascend AI.
Această antrenament sub conducerea unui instrucțuator (online sau la locație) se adresează dezvoltatorilor și inginerilor cu cunoștințe intermediare în AI care doresc să depună modelele AI antrenate eficient pe hardwareul Huawei Ascend folosind pachetul CANN și instrumente precum MindSpore, TensorFlow, sau PyTorch.
La sfârșitul acestui antrenament, participantii vor putea:
- Înțelege arhitectura CANN și rolul său în pipeline-ul de depunere AI.
- Convertește și adaptează modelele din cadre populare la formate compatibile cu Ascend.
- Folosește instrumente precum ATC, OM model conversion, și MindSpore pentru inferență la marginea retelei și în cloud.
- Diagnostichează problemele de depunere și optimizarea performanței pe hardwareul Ascend.
Format al cursului
- Curs interactiv și demonstrații.
- Laborator practic folosind instrumentele CANN și simulari sau dispozitive Ascend.
- Scenarii de depunere practice bazate pe modele AI din lumea reală.
Opțiuni pentru Personalizarea Cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru aranjamente.
GPU Programming pe Biren AI Accelerators
21 OreAccelerațorii AI Biren sunt dispozitive de înaltă performanță GPU concepute pentru sarcini de lucru AI și HPC, cu susținere pentru antrenament la scară largă și inferență.
Acest training live, condus de un instrucțuator (online sau în prezență), este destinat dezvoltatorilor de nivel intermediar până avansat care dorește să programeze și să optimizeze aplicații folosind stack-ul proprietar GPU al Birien, cu comparații practice cu mediu CUDA.
La sfârșitul acestui training, participanții vor putea:
- Comprende arhitectura Biren GPU și ierarhia memoriei.
- Configurați mediul de dezvoltare și utilizați modelul de programare al Birien.
- Traduceți și optimizați codul CUDA pentru platformele Biren.
- Aplicați tehnici de ajustare a performanței și de depurare.
Format al cursului
- Lecturi interactive și discuții.
- Utilizarea practică a SDK-ului Biren în sarcini de lucru GPU exemple.
- Exerciții guiite dedicate portabilizării și ajustării performanței.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat bazat pe stiva aplicațiilor sau nevoile de integrare, vă rugăm să ne contactați pentru a organiza.
Cambricon MLU Development with BANGPy and Neuware
21 OreCambricon MLUs (Machine Learning Unități) sunt chipuri AI specializate optimizate pentru inferență și antrenament în scenarii la marginea rețelei și în centre de date.
Acest training live, condus de un instrucțurator (online sau pe locație), se adresează dezvoltatorilor cu nivel intermediar care doresc să construiască și să deployeze modele AI folosind cadrul BANGPy și SDK-ul Neuware pe hardware Cambricon MLU.
La sfârșitul acestui training, participanții vor putea:
- Să configureze mediile de dezvoltare pentru BANGPy și Neuware.
- Să dezvolte și să optimizeze modele bazate pe Python și C++ pentru Cambricon MLUs.
- Să deployeze modelele la dispozitive de margine sau centre de date care rulează runtime-ul Neuware.
- Să integreze fluxurile de lucru AI cu caracteristici specifice de accelerare MLU.
Formatul cursului
- Lecții interactive și discuții.
- Utilizarea practică a BANGPy și Neuware pentru dezvoltare și deploy.
- Exerciții guiite cu accent pe optimizare, integrare și testare.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs bazat pe modelul dispozitivului Cambricon sau scenariul dumneavoastră, vă rugăm să ne contactați pentru a organiza.
Introducere în CANN pentru dezvoltatori de cadre AI
7 OreCANN (Compute Architecture for Neural Networks) este un set de instrumente pentru calcul AI al Huawei folosit pentru a compila, optimiza și_deploya modelele AI pe procesorii AI Ascend.
Această formare guidată de instrucțoare (online sau în prezență) se adresează dezvoltatorilor AI la nivel începător care doresc să înțeleagă cum CANN se integrează în ciclul de viață al modelelor, din antrenament până la deploy, și cum funcționează cu cadre precum MindSpore, TensorFlow, și PyTorch.
La sfârșitul acestei formări, participanții vor putea:
- Înțelege scopul și arhitectura setului de instrumente CANN.
- Configura un mediu de dezvoltare cu CANN și MindSpore.
- Convertește și deployează o model AI simplă pe hardware-ul Ascend.
- Obține cunoștințe fundamentale pentru proiectele viitoare de optimizare sau integrare cu CANN.
Format al cursului
- Lecturi interactive și discuții.
- Laboratoare practice cu deployarea unui model simplu.
- Pas cu pas a traversării lanțului de instrumente CANN și punctelor de integrare.
Opțiuni de personalizare ale cursului
- Pentru a solicita o formare personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
CANN pentru Edge AI Implementare
14 OreSetul de instrumente Ascend CANN al Huawei permite inferențe puternice AI pe dispozitive la marginea rețelei, cum ar fi Ascend 310. CANN oferă instrumente esențiale pentru compilarea, optimizarea și deployul modelelor în medii cu resurse limitate de calcul și memorie.
Această antrenament sub formă de curs (online sau presencial) este destinat dezvoltatorilor AI intermediari și integratorilor care doresc să depună și să optimizeze modelele pe dispozitive la marginea rețelei folosind lanțul de instrumente CANN.
La sfârșitul antrenamentului, participantii vor putea:
- Prepara și converti modele AI pentru Ascend 310 folosind instrumentele CANN.
- Construi pipeline-uri de inferență ușoare folosind MindSpore Lite și AscendCL.
- Optimiza performanța modelelor pentru medii cu resurse limitate de calcul și memorie.
- Deploya și monitoriza aplicațiile AI în scenarii reale la marginea rețelei.
Format al cursului
- Predare interactivă și demonstrații.
- Muncă practică cu modele specifice marginii rețelei și scenarii.
- Exemple de deploy live pe hardware virtual sau fizic la marginea rețelei.
Opțiuni de personalizare a cursului
- Pentru a cere un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Înțelegerea Stivei de Calcul AI a Huawei: De la CANN la MindSpore
14 OreStiva AI a Huawei — de la SDK la nivel scăzut CANN până la cadrul MindSpore la nivel ridicat — oferă un mediu integrat de dezvoltare și implementare AI optimizat pentru hardware Ascend.
Acest training guiț la distanță sau live (online sau pe locație) se adresează profesionistilor tehnici cu niveluri de începător până la intermediar care doresc să înțeleagă cum componentele CANN și MindSpore lucrează împreună pentru a susține gestionarea ciclului de viață AI și deciziile infrastructurii.
La sfârșitul acestui training, participanții vor putea:
- Înțelege arhitectura stratificată a stivei de calcul AI a Huawei.
- Identifica modul în care CANN susține optimizarea modelului și implementarea la nivel hardware.
- Evalua cadrul și lanțul de instrumente MindSpore în raport cu alternativele industriei.
- Pozitiona stiva AI a Huawei în mediile enterprise sau cloud/on-prem.
Formatul Cursului
- Lectură interactivă și discuție.
- Demo-uri live ale sistemelor și parcurgeri bazate pe cazuri.
- Laboratoare guiț opționale privind fluxul modelului din MindSpore în CANN.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Optimizarea Performanței Rețelelor Neuronale cu CANN SDK
14 OreCANN SDK (Compute Architecture pentru Neural Networks) este fundamentul de calcul AI al Huawei care permite dezvoltatorilor să ajusteze și optimizeze performanța rețelelor neuronale depozitare pe procesorii Ascend AI.
Acest training dirijat de instrucțuator (în mod online sau în prezență) este destinat dezvoltatorilor avansați de AI și inginerilor sistemelor care doresc să optimizeze performanța inferenței folosind setul avansat de instrumente al CANN, inclusiv Motorul Grafic, TIK și dezvoltarea operatorilor personalizați.
La sfârșitul acestui training, participanții vor putea:
- Să înțeleagă arhitectura de runtime a CANN și ciclul de viață al performanței.
- Să folosească instrumentele de profilare și Motorul Grafic pentru analiza și optimizarea performanței.
- Să creeze și să optimizeze operatori personalizați folosind TIK și TVM.
- Să rezolve bocagele de memorie și să îmbunătățească fluxul modelului.
Format al cursului
- Lecții interactive și discuții.
- Ateliere practice cu profilare în timp real și ajustare a operatorilor.
- Exerciții de optimizare folosind exemple de depozitare pentru cazuri speciale.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să vă adresați la noi pentru programare.
CANN SDK pentru Pipeline-uri de Computer Vision și NLP
14 OreCANN SDK (Compute Architecture for Neural Networks) oferă unelte puternice de implementare și optimizare pentru aplicații AI în timp real din computer vision și NLP, în special pe hardware Huawei Ascend.
Această instruire live, guvernată de instructor (online sau la fața locului), este destinată practicienilor intermediari ai inteligenței artificiale care doresc să construiască, să implementeze și să optimizze modele de computer vision și limbaj natural folosind CANN SDK pentru cazuri de utilizare în producție.
La sfârșitul acestei instruiri, participanții vor putea:
- Implementa și optimiza modele CV și NLP folosind CANN și AscendCL.
- Folosi instrumentele CANN pentru a converti modelele și să le integreze în pipeline-uri live.
- Optimiza performanța inferenței pentru sarcini precum detectarea, clasificarea și analiza sentimentului.
- Construi pipeline-uri live de CV/NLP pentru scenarii de implementare pe margine sau în cloud.
Formatul Cursului
- Prezentare interactivă și demonstrație.
- Laborator de manipulare cu implementarea modelelor și profilarea performanței.
- Proiectarea pipeline-urilor live folosind cazuri reale de utilizare din CV și NLP.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a programa.
Construirea operatorilor AI personalizați cu CANN TIK și TVM
14 OreCANN TIK (Tensor Instruction Kernel) și Apache TVM permit optimizarea și personalizarea avansată a operatorilor de modele AI pentru hardware-ul Huawei Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de sisteme de nivel avansat care doresc să construiască, să implementeze și să ajusteze operatori personalizați pentru modele AI folosind modelul de programare TIK al CANN și integrarea compilatorului TVM.
La finalul acestui training, participanții vor putea:
- Scrie și testează operatori AI personalizați folosind TIK DSL pentru procesoarele Ascend.
- Integrează operatori personalizați în runtime-ul CANN și graful de execuție.
- Folosește TVM pentru planificarea operatorilor, auto-ajustarea și benchmarking.
- Depanează și optimizează performanța la nivel de instrucțiuni pentru modele de calcul personalizate.
Formatul cursului
- Curs interactiv și demonstrații.
- Scrierea de cod pentru operatori folosind pipeline-urile TIK și TVM.
- Testare și ajustare pe hardware-ul Ascend sau simulatoare.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Migrarea Aplicațiilor CUDA către Arhitecturile Chinezești GPU
21 OreArhitecturile chinezești GPU, cum ar fi Huawei Ascend, Biren și Cambricon MLU, oferă alternative CUDA adaptate pentru piețele locale de AI și HPC.
Acest training live (online sau presencial), condus de un instrucțurator, se adresează programatorilor avansati și specialistilor infrastructurii care doresc să migreze și să optimizeze aplicațiile existente CUDA pentru a fi depozitate pe platformele hardware chinezești.
La sfârșitul acestui training, participanții vor putea:
- Evaluea compatibilitatea sarcinilor de lucru CUDA existente cu alternativele de chipuri chinezești.
- Migra bazile de cod CUDA către mediul Huawei CANN, Biren SDK și Cambricon BANGPy.
- Compara performanța și identifica punctele de optimizare pe mai multe platforme.
- Răspunde la provocările practice în sprijinul și depunerea multi-arhitectură.
Formatul cursului
- Lecții interactive și discuții.
- Laboratoare practice de traducere a codului și compararea performanței.
- Sesiuni guiâte cu accent pe strategiile de adaptare multi-GPU.
Opțiuni pentru personalizarea cursului
- Pentru a solicita un training personalizat bazat pe platforma sau proiectul CUDA dvs., vă rugăm să ne contactați pentru a organiza.
Performance Optimization on Ascend, Biren, and Cambricon
21 OreAscend, Biren și Cambricon sunt platforme hardware de IA lider în China, oferind fiecare instrumente unice de accelerare și profilare pentru sarcinile AI la scară de producție.
Acest antrenament live, sub conducerea instruirei (online sau pe locație), se adresează inginerilor avansați de infrastructură AI și performanță care dorește optimizarea fluxurilor de lucru pentru inferența și antrenarea modelelor pe mai multe platforme de chipuri AI chinezești.
La sfârșitul acestui antrenament, participantii vor putea:
- Benchmark-a modelle pe platformele Ascend, Biren și Cambricon.
- Identifica bocanci de sistem și ineficiențe la nivelul memoriei/sursei de calcul.
- Aplica optimizări la nivelul graficului, nucleului și operatorului.
- Tuneaza pipeline-urile de implementare pentru a îmbunătăți fluxul și întârzierile.
Format al cursului
- Lecții interactive și discuții.
- Utilizarea practică a instrumentelor de profilare și optimizare pe fiecare platformă.
- Exerciții guiți care se concentrează pe scenarii practice de tuneare.
Opțiuni pentru personalizarea cursului
- Pentru a solicita un antrenament personalizat pentru acest curs în funcție de mediul dvs. de performanță sau tipul modelului, vă rugăm să ne contactați pentru a organiza.