Schița de curs

Introducere în Operațiunile Kubernetes Îmbunătățite de AI

  • De ce AI contează pentru operațiunile moderne de cluster
  • Limitările logicii tradiționale de scalare și planificare
  • Concepte cheie ale ML pentru gestionarea resurselor

Fundamentele Gestionării Resurselor în Kubernetes

  • Elementele de bază ale alocării CPU, GPU și memorie
  • Înțelegerea cotelor, limitelor și cererilor
  • Identificarea punctelor de blocaj și ineficiențelor

Abordări de Învățare Automată pentru Planificare

  • Modele supervizate și nesupervizate pentru plasarea sarcinilor de lucru
  • Algoritmi predictivi pentru cererea de resurse
  • Utilizarea caracteristicilor ML în planificatori personalizați

Învățarea prin Întărire pentru Scalare Automată Inteligentă

  • Cum învață agenții RL din comportamentul clusterului
  • Proiectarea funcțiilor de recompensă pentru eficiență
  • Construirea strategiilor de scalare automată bazate pe RL

Scalare Automată Predictivă cu Metrici și Telemetrie

  • Utilizarea datelor Prometheus pentru prognoză
  • Aplicarea modelelor de serii temporale în scalarea automată
  • Evaluarea acurateței predicțiilor și ajustarea modelelor

Implementarea Instrumentelor de Optimizare Conduse de AI

  • Integrarea cadrelor de ML cu controlerele Kubernetes
  • Implementarea buclelor de control inteligente
  • Extinderea KEDA pentru luarea de decizii asistate de AI

Strategii de Optimizare a Costurilor și Performanței

  • Reducerea costurilor de calcul prin scalare predictivă
  • Îmbunătățirea utilizării GPU cu plasare bazată pe ML
  • Echilibrarea latenței, debitului și eficienței

Scenarii Practice și Cazuri de Utilizare din Lumea Reală

  • Scalarea automată a aplicațiilor cu încărcare mare folosind AI
  • Optimizarea pool-urilor de noduri eterogene
  • Aplicarea ML în medii multi-tenant

Rezumat și Pași Următori

Cerințe

  • Înțelegerea elementelor de bază ale Kubernetes
  • Experiență în implementarea aplicațiilor containerizate
  • Familiaritate cu operațiunile de cluster și gestionarea resurselor

Publicul Țintă

  • SRE-uri care lucrează cu sisteme distribuite la scară mare
  • Operatorii Kubernetes care gestionează sarcini de lucru de mare solicitare
  • Ingineri de platformă care optimizează infrastructura de calcul
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite