Schița de curs

Fundamentele Operațiunilor în Cloud pe AWS

  • Roluri și responsabilități operaționale în cloud
  • Structura contului AWS, organizațiile și strategia multi-cont
  • Serviciile de bază operaționale: CloudWatch, CloudTrail, AWS Config

Infrastructura ca Cod și Alocarea

  • Principiile IaC și a infrastructurii imutabile
  • Alocarea cu Terraform și AWS CloudFormation
  • Gestionarea stării, modulelor și promovării mediilor

CI/CD și Strategii de Implementare

  • Proiectarea pipeleinelor CI/CD pentru aplicațiile cloud-native
  • Implementări blue/green, canary și rolling
  • Automatizarea rollback-ului, verificărilor de sănătate și validării lansărilor

Monitorizare, Observabilitate și Alerte

  • Metricile, jurnalele și traseele: transport, stocare și analiză
  • Utilizarea CloudWatch, X-Ray și uneltele de observabilitate de trece parte
  • Definirea SLO-uri/SLI-uri, politicilor de alertare și practicilor on-call

Securitatea Operațională și Managementul Identității

  • Cele mai bune practici IAM, privilegiu minim necesar și acces între conturi
  • Gestionarea secretelor, KMS și depozitele securizate de parametri
  • Securitatea operațională: strategii de actualizare, scanarea vulnerabilităților și istoricul audit-urilor

Reziliența, Backup-ul și Recuperarea după Dezastru

  • Proiectarea pentru toleranța la defecte și disponibilitatea ridicată
  • Strategii de backup, automatizarea snapshot-urilor și procedurile de restabilire
  • Planificarea recuperării după dezastru și crearea runbook-urilor

Optimizarea Costului și Gestionarea

  • Vizibilitatea costurilor: facturare, tagging și strategii de alocare a costurilor
  • Redimensionarea, instanțele rezervate/savings plans și controalele bugetare
  • Gestionarea: politici, parapete și automatizări pentru conformitate

Operațiunile cu Containere, Serverless și Runtime

  • Considerente operaționale pentru ECS, EKS și Lambda
  • Descoperirea serviciilor, autoscaling-ul și limitele resurselor
  • Jurnalizarea, trasearea și depanarea sarcinilor containerize

Răspuns la Incidente, Ghiduri de Lucru și Ingineria Haosului

  • Răspunsul la incidente bazat pe runbook-uri și practici de postmortem
  • Automatizarea remedierii și modelelor auto-sanative
  • Introducere la experimente cu haos pentru validarea rezilienței

Atelier Practic: Operațiunea unei Sarcini de Exemplu

  • Implementarea unei aplicații de exemplu folosind IaC și o pipeline CI/CD
  • Implementarea monitorizării, alertelor și a script-ului automatizat de remediere
  • Simularea incidentelor și practica răspunderii bazate pe runbook-uri

Rezumat și Pașii Următori

Cerințe

  • O înțelegere de bază a conceptelor cloud și ale rețelelor
  • Familiarizarea cu linia de comandă Linux și scripting-ul
  • Experiența cu controlul surselor (Git) și conceptele CI/CD de bază

Audientă

  • Ingineri operaționali cloud
  • SRE-uri și inginerii de platformă
  • Ingineri DevOps și liderii echipei tehnice
 21 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite