Schița de curs
Fundamentele operațiunilor în cloud pe AWS
- Roluri și responsabilități operaționale în cloud
- Structura contului AWS, organizații și strategie multi-cont
- Servicii operaționale de bază: CloudWatch, CloudTrail, AWS Config
Infrastructură ca Cod și Furnizare
- Principiile IaC și infrastructurii imutabile
- Furnizare cu Terraform și AWS CloudFormation
- Gestionarea stării, modulelor și promovării mediilor
CI/CD și Strategii de Implementare
- Proiectarea pipeline-urilor CI/CD pentru aplicații cloud-native
- Implementări blue/green, canary și rolling
- Automatizarea revenirii, verificărilor de sănătate și validării lansării
Monitorizare, Observabilitate și Alertare
- Metrici, jurnale și urme: expediere, stocare și analiză
- Utilizarea CloudWatch, X-Ray și unelte de observabilitate terțe
- Definirea SLO-urilor/SLI-urilor, politici de alertă și practici de on-call
Securitate Operațională și Managementul Identităților
- Cele mai bune practici IAM, privilegii minime și acces inter-cont
- Managementul secretelor, KMS și depozite de parametri securizate
- Securitate operațională: strategii de patch, scanare de vulnerabilități și urme de audit
Reziliență, Backup și Recuperare în Caz de Dezastru
- Proiectare pentru toleranță la erori și disponibilitate ridicată
- Strategii de backup, automatizare snapshot-uri și proceduri de restaurare
- Planificarea recuperării în caz de dezastru și crearea runbook-urilor
Optimizare a Costurilor și Guvernanță
- Vizibilitatea costurilor: facturare, tag-uri și strategii de alocare a costurilor
- Redimensionare, instanțe rezervate/planuri de economii și controale de buget
- Guvernanță: politici, bariere de protecție și automatizare pentru conformitate
Containere, Serverless și Operațiuni Runtime
- Considerații operaționale pentru ECS, EKS și Lambda
- Descoperirea serviciilor, scalare automată și limite de resurse
- Jurnalizare, urmărire și depanare a sarcinilor de lucru containerizate
Răspuns la Incidente, Playbook-uri și Inginerie a Haosului
- Răspuns la incidente bazat pe runbook-uri și practici de postmortem
- Automatizarea remedierii și modele de auto-reparare
- Introducere în experimentele de haos pentru validarea rezilienței
Atelier Practic: Operarea unei Sarcini de Lucru Exemplu
- Implementarea unei aplicații exemplu folosind IaC și un pipeline CI/CD
- Implementarea monitorizării, alertelor și a unui script de remediere automată
- Simularea incidentelor și practicarea răspunsului bazat pe runbook-uri
Rezumat și Pași Următori
Cerințe
- O înțelegere de bază a conceptelor de cloud și rețele
- Familiaritate cu linia de comandă Linux și scripting
- Experiență cu controlul versiunilor (Git) și concepte de bază CI/CD
Audiență
- Ingineri de operațiuni cloud
- SREs și ingineri de platforme
- Ingineri DevOps și lideri de echipe tehnice
Mărturii (5)
Formatorul avea o bună înțelegere a conceptelor
Josheel - Verizon Connect
Curs - Amazon Redshift
Tradus de catre o masina
Partea practică.
Radu - Ness Digital Engineering
Curs - AWS: A Hands-on Introduction to Cloud Computing
Tradus de catre o masina
Formarea a fost mai practică
Siphokazi Biyana - Vodacom SA
Curs - Kubernetes on AWS
Tradus de catre o masina
Instrutorul știa exact despre ce vorbea.
Madumetsa Msomi - BMW
Curs - AWS DevOps Engineers
Tradus de catre o masina
Toate bune, nu este nimic de îmbunătățit
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Curs - AWS Lambda for Developers
Tradus de catre o masina