Schița de curs
Introducere în Apache Iceberg
- Prezentare generală a Apache Iceberg
- Importanța și cazurile de utilizare în arhitectura modernă a datelor
- Caracteristicile principale și beneficiile
Concepte fundamentale
- Formatul tabelului Iceberg și arhitectura sa
- Compararea cu alte formate de tabeluri
- Partiționare și evoluția schemei
- Călătorie în timp și versiunarea datelor
Configurarea Apache Iceberg
- Instalare și configurare
- Integrarea Iceberg cu diferite motoare de procesare a datelor
- Configurarea unui mediu Iceberg pe mașina locală
Operațiuni de bază
- Crearea și gestionarea tabelelor Iceberg
- Scrierea în și citirea din tabelele Iceberg
- Operațiuni de bază CRUD (Create, Read, Update, Delete)
Migrarea și integrarea datelor
- Migrarea datelor din Hive și alte sisteme în Iceberg
- Integrarea cu instrumente BI (Business Intelligence)
- Migrarea unui set de date de exemplu în Iceberg
Optimizarea performanței
- Tehnici de optimizare a performanței
- Optimizarea interogărilor și a scaneurilor de date
- Optimizarea performanței în Iceberg
Prezentare a funcțiilor avansate
- Evoluția partiției și partiționarea ascunsă
- Evoluția tabelelor și schimbările schemei
- Călătorie în timp și funcțiile de rollback (revenire la starea anterioară)
- Implementarea funcțiilor avansate în Iceberg
Rezumat și următoarele pași
Cerințe
- Cunoaștere a conceptelor precum tabele, scheme, partiții și ingheta datelor
- Cunoștințe de bază de SQL
Audiență
- Ingineri de date
- Arhitecți de date
- Analiști de date
- Dezvoltatori software
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina