Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere în AIOps cu instrumente de cod sursă deschis
- Prezentare generală a conceptelor și beneficiilor asociate cu AIOps
- Prometheus și Grafana în stiva observabilității
- Poziția ML în cadrul AIOps: analize predictive vs. reactive
Configurarea Prometheus și Grafana
- Instalarea și configurarea Prometheus pentru colectarea seriilor de timp
- Creați panouri instrumentale în Grafana folosind metricele în timp real
- Explorați exporterii, relabeling-ul și descoperirea serviciului
Preprocesarea datelor pentru ML
- Extragerea și transformarea metricilor Prometheus
- Pregătirea seturilor de date pentru detectarea anomaliei și a previziunii
- Folosirea transformărilor din Grafana sau canalelor Python
Utilizarea Machine Learning pentru Detectarea Anomalilor
- Motive de bază ML pentru detectarea punctelor externe (de exemplu, Izolația Forest, SVM la clasa unică)
- Trenare și evaluare a modelelor pe datele seriei de timp
- Vizualizarea anomalilor în panourile instrumentale Grafana
Forecasting Metrice cu ML
- Construirea unor modele simple de previziune (ARIMA, Prophet, introducere LSTM)
- Predicția sarcinii sistemului sau utilizării resurselor
- Folosirea predicțiilor pentru alerte timpurii și decizii de scalare
Integrarea ML cu Avertizările și Automatizarea
- Definirea regulilor de avertisment bazate pe ieșirea ML sau praguri
- Folosirea Alertmanager și roții de notificare
- Inițierea scriptelor sau fluxurilor de automatizare la detectarea anomaliei
Scalare și Operationalizarea AIOps
- Integrarea unor instrumente externe observabil (de exemplu, stiva ELK, Moogsoft, Dynatrace)
- Operationalizarea modelelor ML în canalele de observabilitate
- Cele mai bune practici pentru AIOps la scară largă
Rezumat și Următoarele Pași
Cerințe
- Ocupația cu conceptele de monitorizare a sistemelor și observabilitate
- Experiență în utilizarea Grafana sau Prometheus
- Cunoștințe despre Python și principii de bază ale învățării automatize
Auditoriu
- Inginerii de observabilitate
- Echipele de infrastructură și DevOps
- Arhitecții platformei de monitorizare și inginerii site reliability (SRE)
14 ore