Schița de curs
Introducere în Apache Iceberg
- Prezentare generală a Apache Iceberg
- Recapitulare a conceptelor de bază
Profundizare în Arhitectura Iceberg
- Analiză detaliată a formatului de tabel Iceberg
- Prezentare detaliată a arhitecturii, inclusiv metadate și structura fișierelor
- Detalii despre evoluția schemelor și partițiilor
Instalare și Configurare Avansată
- Configurarea Iceberg pentru performanță optimă în diferite medii
- Integrarea cu diverse motoare de procesare a datelor
- Configurare avansată: securitate, criptare și controale de acces
- Configurarea Iceberg într-un mediu distribuit
Operațiuni și Întreținere Avansată
- Gestionarea tabelelor Iceberg la scară largă
- Implementarea și gestionarea schimbărilor complexe de scheme
- Gestionarea evoluției partițiilor și a partițiilor ascunse
- Operațiuni CRUD avansate cu schimbări de scheme și partiții
Tehnici de Optimizare a Interogărilor
- Tehnici de reducere a latenței interogărilor
- Tăierea partițiilor și a fișierelor
- Strategii de caching și optimizare a metadatelor
- Implementarea și testarea tehnicilor de optimizare a interogărilor
Optimizarea Performanței pentru Seturi de Date Mari
- Optimizarea performanței pentru seturi de date la scară largă
- Utilizarea caracteristicilor încorporate ale Iceberg pentru optimizarea performanței
- Studii de caz despre optimizarea performanței în scenarii reale
- Optimizarea performanței pentru seturi de date la scară largă
Migrarea și Integrarea Avansată a Datelor
- Migrarea structurilor complexe de date din alte sisteme
- Integrarea Iceberg cu fluxuri de date în timp real
- Migrarea seturilor de date complexe și integrarea fluxurilor de date în timp real
Fiabilitate și Consistență
- Asigurarea consistenței și integrității datelor în medii distribuite
- Implementarea și gestionarea garanțiilor tranzacționale
- Gestionarea defecțiunilor și mecanismelor de recuperare
- Implementarea caracteristicilor de fiabilitate și consistență
Funcționalități Avansate și Personalizare
- Implementări personalizate de cataloage
- Extinderea Iceberg cu funcționalități personalizate
- Implementarea catalogului personalizat și extinderea funcționalităților Iceberg
Guvernanța și Conformitatea Datelor
- Implementarea politicilor de guvernanță a datelor
- Conformitatea cu reglementările privind datele
- Gestionarea urmelor de audit și a liniei de descendență a datelor
- Implementarea caracteristicilor de guvernanță și conformitate
Rezumat și Pași Următori
Cerințe
- Familiaritate cu conceptele de bază, operațiunile de bază și gestionarea tabelelor Iceberg
Publicul țintă
- Ingineri de date
- Arhitecți de date
- Analiști de date
- Dezvoltatori de software
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina