Schița de curs

Fundamentele operațiunilor în cloud pe AWS

  • Roluri și responsabilități operaționale în cloud
  • Structura contului AWS, organizații și strategie multi-cont
  • Servicii operaționale de bază: CloudWatch, CloudTrail, AWS Config

Infrastructură ca Cod și Furnizare

  • Principiile IaC și infrastructurii imutabile
  • Furnizare cu Terraform și AWS CloudFormation
  • Gestionarea stării, modulelor și promovării mediilor

CI/CD și Strategii de Implementare

  • Proiectarea pipeline-urilor CI/CD pentru aplicații cloud-native
  • Implementări blue/green, canary și rolling
  • Automatizarea revenirii, verificărilor de sănătate și validării lansării

Monitorizare, Observabilitate și Alertare

  • Metrici, jurnale și urme: expediere, stocare și analiză
  • Utilizarea CloudWatch, X-Ray și unelte de observabilitate terțe
  • Definirea SLO-urilor/SLI-urilor, politici de alertă și practici de on-call

Securitate Operațională și Managementul Identităților

  • Cele mai bune practici IAM, privilegii minime și acces inter-cont
  • Managementul secretelor, KMS și depozite de parametri securizate
  • Securitate operațională: strategii de patch, scanare de vulnerabilități și urme de audit

Reziliență, Backup și Recuperare în Caz de Dezastru

  • Proiectare pentru toleranță la erori și disponibilitate ridicată
  • Strategii de backup, automatizare snapshot-uri și proceduri de restaurare
  • Planificarea recuperării în caz de dezastru și crearea runbook-urilor

Optimizare a Costurilor și Guvernanță

  • Vizibilitatea costurilor: facturare, tag-uri și strategii de alocare a costurilor
  • Redimensionare, instanțe rezervate/planuri de economii și controale de buget
  • Guvernanță: politici, bariere de protecție și automatizare pentru conformitate

Containere, Serverless și Operațiuni Runtime

  • Considerații operaționale pentru ECS, EKS și Lambda
  • Descoperirea serviciilor, scalare automată și limite de resurse
  • Jurnalizare, urmărire și depanare a sarcinilor de lucru containerizate

Răspuns la Incidente, Playbook-uri și Inginerie a Haosului

  • Răspuns la incidente bazat pe runbook-uri și practici de postmortem
  • Automatizarea remedierii și modele de auto-reparare
  • Introducere în experimentele de haos pentru validarea rezilienței

Atelier Practic: Operarea unei Sarcini de Lucru Exemplu

  • Implementarea unei aplicații exemplu folosind IaC și un pipeline CI/CD
  • Implementarea monitorizării, alertelor și a unui script de remediere automată
  • Simularea incidentelor și practicarea răspunsului bazat pe runbook-uri

Rezumat și Pași Următori

Cerințe

  • O înțelegere de bază a conceptelor de cloud și rețele
  • Familiaritate cu linia de comandă Linux și scripting
  • Experiență cu controlul versiunilor (Git) și concepte de bază CI/CD

Audiență

  • Ingineri de operațiuni cloud
  • SREs și ingineri de platforme
  • Ingineri DevOps și lideri de echipe tehnice
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite