Schița de curs

Introducere la AIOps cu Instrumente Open Source

  • Prezentare a conceptelor și avantajelor AIOps
  • Prometheus și Grafana în stack-ul de observabilitate
  • Unde se integrează ML în AIOps: analiza predictivă vs. reactivă

Configurarea Prometheus și Grafana

  • Instalarea și configurarea Prometheus pentru colectarea datelor de serie temporale
  • Crearea de tablouri de bord în Grafana folosind metricile în timp real
  • Explorarea exporter-ilor, relabeling-ului și descoperirii serviciilor

Prelucrarea Datelor pentru ML

  • Extracția și transformarea metricilor Prometheus
  • Pregătirea seturilor de date pentru detectarea anomaliei și previziuni
  • Utilizarea transformărilor Grafana sau pipeline-urile Python

Aplicarea Învățării Automatice pentru Detectarea Anomalilor

  • Modele ML de bază pentru detectarea outlier-ilor (de exemplu, Isolation Forest, One-Class SVM)
  • Antrenarea și evaluarea modelelor pe date de serie temporale
  • Vizualizarea anomalilor în tablourile de bord Grafana

Previziunile Metricelor cu ML

  • Construirea modelelor de previziune simple (ARIMA, Prophet, introducere la LSTM)
  • Previzionarea încărcării sistemului sau utilizării resurselor
  • Utilizarea previziunilor pentru alerte anticipate și deciziuni de scalare

Integrarea ML cu Alerting și Automatizare

  • Definirea regulilor de alertare bazate pe output-ul ML sau praguri
  • Utilizarea Alertmanager și routarea notificărilor
  • declanșarea script-urilor sau fluxurilor de automatizare la detectarea anomaliei

Scalarea și Operationalizarea AIOps

  • Integrarea instrumentelor de observabilitate externe (de exemplu, ELK stack, Moogsoft, Dynatrace)
  • Operationalizarea modelilor ML în pipeleline-urile de observabilitate
  • Cele mai bune practici pentru AIOps la scară largă

Rezumat și Următoarele Pași

Cerințe

  • O înțelegere a conceptelor de monitorizare și observabilitate a sistemului
  • Experiență cu utilizarea Grafana sau Prometheus
  • Familiarizare cu Python și principiile de bază ale învățării automatice (machine learning)

Audiență

  • Ingineri de observabilitate
  • Echipe de infrastructură și DevOps
  • Arhitecți de platforme de monitorizare și ingineri de fiabilitate a site-ului (SREs)
 14 ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite