Schița de curs
Introducere în Apache Iceberg
- Prezentare generală a Apache Iceberg
- Importanța și cazurile de utilizare în arhitectura modernă de date
- Caracteristici și beneficii cheie
Concepte de bază
- Formatul și arhitectura tabelelor Iceberg
- Comparație cu alte formate de tabele
- Partiționarea și evoluția schemei
- Time travel și versionarea datelor
Configurarea Apache Iceberg
- Instalare și configurare
- Integrarea Iceberg cu diverse motoare de procesare a datelor
- Configurarea unui mediu Iceberg pe o mașină locală
Operațiuni de bază
- Crearea și gestionarea tabelelor Iceberg
- Scrierea și citirea din tabele Iceberg
- Operațiuni CRUD de bază
Migrarea și integrarea datelor
- Migrarea datelor din Hive și alte sisteme în Iceberg
- Integrarea cu instrumente BI
- Migrarea unui set de date de probă în Iceberg
Optimizarea performanței
- Tehnici de ajustare a performanței
- Optimizarea interogărilor și scanărilor de date
- Optimizarea performanței în Iceberg
Prezentarea caracteristicilor avansate
- Evoluția partiționării și partiționarea ascunsă
- Evoluția tabelelor și modificările schemei
- Caracteristicile de time travel și rollback
- Implementarea caracteristicilor avansate în Iceberg
Rezumat și pași următori
Cerințe
- Familiaritate cu concepte precum tabele, scheme, partiționare și ingestie de date
- Cunoștințe de bază de SQL
Publicul țintă
- Ingineri de date
- Arhitecți de date
- Analiști de date
- Dezvoltatori de software
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina