Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere în AIOps
- Ce este AIOps și de ce contează
- Monitorizarea tradițională vs. observabilitatea orientată pe AIOps
- Arhitectura AIOps și componentele cheie
Colectarea și Normalizarea Datelor Operaționale
- Tipuri de date de observabilitate: metrici, jurnale și trasee
- Ingestionarea datelor din multiple surse (servere, contenedorizări, cloud)
- Utilizarea agentilor și exportatorilor (Prometheus, Beats, Fluentd)
Corelarea Datelor și Detectarea Anomaliilor
- Corelația seriei temporale și metodele statistice
- Utilizarea modelului ML pentru detectarea anormalităților
- Detectarea incidentelor în sisteme distribuite
Alertare și Reducerea Zgomotului de Alertă
- Proiectarea regulilor inteligente de alertare și praguri
- Supresia, deduplicarea și gruparea alertelor
- Integrarea cu Alertmanager, Slack, PagerDuty sau Opsgenie
Analiza Cauzei Fundamentale și Visualizarea
- Utilizarea panourilor de instrumente pentru vizualizarea metricelor și detecția tendințelor
- Explorarea evenimentelor și cronologiilor pentru RCA (Analiza Cauzei Fundamentale)
- Urmarirea problemelor în straturi utilizând instrumentele de urmărire distribuită
Automatizare și Remediere
- Trigerarea scriptelor sau fluxurilor automatizate din incidente
- Integrarea cu sisteme ITSM (ServiceNow, Jira)
- Cazuri de utilizare: auto-curățenie, scalare, redirecționare trafic
Platforme Open Source și Comerciale pentru AIOps
- Prezentarea instrumentelor: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterii de evaluare pentru alege o platformă AIOps
- Demo și mâneci de lucru cu un stoc selectat
Rezumat și Pași Următori
Cerințe
- Oțelinița de operări IT și conceptele monitorizării sistemelor
- Experiență cu instrumente sau panouri de monitorizare
- Cunoștințele bazice ale formatelor de loguri și metrice
Auditoriu
- Echipele de operări responsabile pentru infrastructura și aplicațiile
- Inginerii de Sarcină a Fiabilității (SREs)
- Echipele de monitorizare IT și observabilitate
14 ore