Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Dizajnarea unei Arhitecturi Deschise AIOps
- Prezentare generală a componentelor cheie în canalele deschise AIOps
- Ciclul de flux de date de la aducere până la alertă
- Compararea instrumentelor și strategiile de integrare
Colecționarea și Agregarea Datelor
- Aducerea datelor în serie cu Prometheus
- Captarea jurnalizării cu Logstash și Beats
- Normalizarea datelor pentru corelațiile între surse multiple
Construirea Panourilor de Observabilitate
- Vizualizarea metricilor cu Grafana
- Crearea panourilor Kibana pentru analiza jurnalizării
- Folosirea cererilor Elasticsearch pentru extragerea de informații operaționale
Detectarea Anomaliilor și Previziunea Incidentelor
- Exportarea datelor de observabilitate către canalele Python
- Trecelegerea modelelor ML pentru detectarea outlier-urilor și predictia
- Deployarea modelului pentru inferență live în pipeline-ul de observabilitate
Alerta și Automatizare cu Instrumente Deschise
- Creați reguli de alerta Prometheus și enrutarea Alertmanager
- Aprovocarea scriptelor sau fluxurilor API pentru răspuns automat
- Folosirea instrumentelor de orchestrare open-source (de exemplu, Ansible, Rundeck)
Integrare și Considerente de Scalabilitate
- Gestionarea adevăratului volum al aducerii și retinerea pe termen lung
- Siguranța și controlul accesului în stivele open-source
- Scalarea fiecărui strat separat: aducere, procesare, alerta
Apa de La Viesă și Extensii
- Cazuri Studiu: ajustarea performanței, prevenirea downtime-urilor și optimizarea costurilor
- Extinderea pipeline-urilor cu instrumentele de urmărire sau graficele serviciului
- Best practices pentru rularea și menținerea a AIOps în mediu de producție
Rezumat și Următoarele Pași
Cerințe
- Experiență cu instrumente de observabilitate precum Prometheus sau ELK
- Cunoașteri practice ale lui Python și fundamentelor machine learning
- Compreensiune a operatiunilor IT și fluxurilor de lucru pentru alertare
Audiență
- Ingineri avansați de fiabilitatea site-ului (SRE)
- Ingineri de date care lucrează în operatii
- Lideri ai platformei DevOps și arhitecți de infrastructură
14 ore