Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Introducere în AIOps
- Ce este AIOps și de ce este important
- Monitorizarea tradițională vs. observabilitate bazată pe AIOps
- Arhitectura AIOps și componentele cheie
Colectarea și Normalizarea Datelor Operaționale
- Tipuri de date de observabilitate: metrici, loguri și urme
- Ingestia datelor din surse multiple (servere, containere, cloud)
- Utilizarea agenților și a exportatorilor (Prometheus, Beats, Fluentd)
Corelarea Datelor și Detectarea Anomaliilor
- Corelarea seriilor temporale și metode statistice
- Utilizarea modelelor de ML pentru detectarea anomaliilor
- Detectarea incidentelor în sisteme distribuite
Alertarea și Reducerea Zgomotului
- Proiectarea regulilor și a pragurilor de alerte inteligente
- Suprimarea, deduplicarea și gruparea alertelor
- Integrarea cu Alertmanager, Slack, PagerDuty sau Opsgenie
Analiza Cauzei Rădăcină și Vizualizarea
- Utilizarea dashboard-urilor pentru vizualizarea metricilor și detectarea trendurilor
- Explorarea evenimentelor și a cronologiilor pentru RCA
- Trasarea problemelor pe straturi cu instrumente de trasare distribuită
Automatizarea și Remedierea
- Declanșarea scripturilor sau fluxurilor de lucru automate din incidente
- Integrarea cu sisteme ITSM (ServiceNow, Jira)
- Cazuri de utilizare: autoreparare, scalare, redirecționare a traficului
Platforme AIOps Open Source și Comerciale
- Prezentare generală a instrumentelor: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterii de evaluare pentru selectarea unei platforme AIOps
- Demo și lucru practic cu un stack selectat
Rezumat și Pași Următori
Cerințe
- Înțelegere a conceptelor de operațiuni IT și monitorizare a sistemelor
- Experiență cu instrumente de monitorizare sau dashboard-uri
- Familiarizare cu formatele de bază ale logurilor și metricilor
Public Țintă
- Echipe de operațiuni responsabile de infrastructură și aplicații
- Ingineri de Fiabilitate a Site-urilor (SREs)
- Echipe de monitorizare și observabilitate IT
14 Ore