Schița de curs

Dizajnarea unei Arhitecturi Deschise AIOps

  • Prezentare generală a componentelor cheie în canalele deschise AIOps
  • Ciclul de flux de date de la aducere până la alertă
  • Compararea instrumentelor și strategiile de integrare

Colecționarea și Agregarea Datelor

  • Aducerea datelor în serie cu Prometheus
  • Captarea jurnalizării cu Logstash și Beats
  • Normalizarea datelor pentru corelațiile între surse multiple

Construirea Panourilor de Observabilitate

  • Vizualizarea metricilor cu Grafana
  • Crearea panourilor Kibana pentru analiza jurnalizării
  • Folosirea cererilor Elasticsearch pentru extragerea de informații operaționale

Detectarea Anomaliilor și Previziunea Incidentelor

  • Exportarea datelor de observabilitate către canalele Python
  • Trecelegerea modelelor ML pentru detectarea outlier-urilor și predictia
  • Deployarea modelului pentru inferență live în pipeline-ul de observabilitate

Alerta și Automatizare cu Instrumente Deschise

  • Creați reguli de alerta Prometheus și enrutarea Alertmanager
  • Aprovocarea scriptelor sau fluxurilor API pentru răspuns automat
  • Folosirea instrumentelor de orchestrare open-source (de exemplu, Ansible, Rundeck)

Integrare și Considerente de Scalabilitate

  • Gestionarea adevăratului volum al aducerii și retinerea pe termen lung
  • Siguranța și controlul accesului în stivele open-source
  • Scalarea fiecărui strat separat: aducere, procesare, alerta

Apa de La Viesă și Extensii

  • Cazuri Studiu: ajustarea performanței, prevenirea downtime-urilor și optimizarea costurilor
  • Extinderea pipeline-urilor cu instrumentele de urmărire sau graficele serviciului
  • Best practices pentru rularea și menținerea a AIOps în mediu de producție

Rezumat și Următoarele Pași

Cerințe

  • Experiență cu instrumente de observabilitate precum Prometheus sau ELK
  • Cunoașteri practice ale lui Python și fundamentelor machine learning
  • Compreensiune a operatiunilor IT și fluxurilor de lucru pentru alertare

Audiență

  • Ingineri avansați de fiabilitatea site-ului (SRE)
  • Ingineri de date care lucrează în operatii
  • Lideri ai platformei DevOps și arhitecți de infrastructură
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite