Schița de curs

Introducere în AIOps cu instrumente de cod sursă deschis

  • Prezentare generală a conceptelor și beneficiilor asociate cu AIOps
  • Prometheus și Grafana în stiva observabilității
  • Poziția ML în cadrul AIOps: analize predictive vs. reactive

Configurarea Prometheus și Grafana

  • Instalarea și configurarea Prometheus pentru colectarea seriilor de timp
  • Creați panouri instrumentale în Grafana folosind metricele în timp real
  • Explorați exporterii, relabeling-ul și descoperirea serviciului

Preprocesarea datelor pentru ML

  • Extragerea și transformarea metricilor Prometheus
  • Pregătirea seturilor de date pentru detectarea anomaliei și a previziunii
  • Folosirea transformărilor din Grafana sau canalelor Python

Utilizarea Machine Learning pentru Detectarea Anomalilor

  • Motive de bază ML pentru detectarea punctelor externe (de exemplu, Izolația Forest, SVM la clasa unică)
  • Trenare și evaluare a modelelor pe datele seriei de timp
  • Vizualizarea anomalilor în panourile instrumentale Grafana

Forecasting Metrice cu ML

  • Construirea unor modele simple de previziune (ARIMA, Prophet, introducere LSTM)
  • Predicția sarcinii sistemului sau utilizării resurselor
  • Folosirea predicțiilor pentru alerte timpurii și decizii de scalare

Integrarea ML cu Avertizările și Automatizarea

  • Definirea regulilor de avertisment bazate pe ieșirea ML sau praguri
  • Folosirea Alertmanager și roții de notificare
  • Inițierea scriptelor sau fluxurilor de automatizare la detectarea anomaliei

Scalare și Operationalizarea AIOps

  • Integrarea unor instrumente externe observabil (de exemplu, stiva ELK, Moogsoft, Dynatrace)
  • Operationalizarea modelelor ML în canalele de observabilitate
  • Cele mai bune practici pentru AIOps la scară largă

Rezumat și Următoarele Pași

Cerințe

  • Ocupația cu conceptele de monitorizare a sistemelor și observabilitate
  • Experiență în utilizarea Grafana sau Prometheus
  • Cunoștințe despre Python și principii de bază ale învățării automatize

Auditoriu

  • Inginerii de observabilitate
  • Echipele de infrastructură și DevOps
  • Arhitecții platformei de monitorizare și inginerii site reliability (SRE)
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite