Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Introducere la AIOps cu Instrumente Open Source
- Prezentare a conceptelor și avantajelor AIOps
- Prometheus și Grafana în stack-ul de observabilitate
- Unde se integrează ML în AIOps: analiza predictivă vs. reactivă
Configurarea Prometheus și Grafana
- Instalarea și configurarea Prometheus pentru colectarea datelor de serie temporale
- Crearea de tablouri de bord în Grafana folosind metricile în timp real
- Explorarea exporter-ilor, relabeling-ului și descoperirii serviciilor
Prelucrarea Datelor pentru ML
- Extracția și transformarea metricilor Prometheus
- Pregătirea seturilor de date pentru detectarea anomaliei și previziuni
- Utilizarea transformărilor Grafana sau pipeline-urile Python
Aplicarea Învățării Automatice pentru Detectarea Anomalilor
- Modele ML de bază pentru detectarea outlier-ilor (de exemplu, Isolation Forest, One-Class SVM)
- Antrenarea și evaluarea modelelor pe date de serie temporale
- Vizualizarea anomalilor în tablourile de bord Grafana
Previziunile Metricelor cu ML
- Construirea modelelor de previziune simple (ARIMA, Prophet, introducere la LSTM)
- Previzionarea încărcării sistemului sau utilizării resurselor
- Utilizarea previziunilor pentru alerte anticipate și deciziuni de scalare
Integrarea ML cu Alerting și Automatizare
- Definirea regulilor de alertare bazate pe output-ul ML sau praguri
- Utilizarea Alertmanager și routarea notificărilor
- declanșarea script-urilor sau fluxurilor de automatizare la detectarea anomaliei
Scalarea și Operationalizarea AIOps
- Integrarea instrumentelor de observabilitate externe (de exemplu, ELK stack, Moogsoft, Dynatrace)
- Operationalizarea modelilor ML în pipeleline-urile de observabilitate
- Cele mai bune practici pentru AIOps la scară largă
Rezumat și Următoarele Pași
Cerințe
- O înțelegere a conceptelor de monitorizare și observabilitate a sistemului
- Experiență cu utilizarea Grafana sau Prometheus
- Familiarizare cu Python și principiile de bază ale învățării automatice (machine learning)
Audiență
- Ingineri de observabilitate
- Echipe de infrastructură și DevOps
- Arhitecți de platforme de monitorizare și ingineri de fiabilitate a site-ului (SREs)
14 ore