Schița de curs
Fundațiile Depozitelor de Date
- Sens, componente și arhitectură a depozitului de date
- Data marts, depozite de date pentru întreprindere și modele lakehouse
- Fundețele OLTP vs OLAP și separarea sarcinilor de lucru
Modelare Dimensională
- Fapte, dimensiuni și granularitate
- Schemă stelară versus schemă zahăr de vis
- Tipuri și gestionarea Dimensiunilor cu Schimbări Lente
Procese ETL și ELT
- Strategii de extracție din OLTP și API-uri
- Transformări, curățare a datelor și conformitate
- Patrone de încarcare, orchestrate și gestionarea dependențelor
Calitatea Datelor și Gestionarea Metadatelor
- Profilarea datelor și reguli de validare
- Alinierea datelor principale și referințe
- Liniere, catalogue și documentare
Analiți și Performanță
- Concepte cub, agregate și vederi materializate
- Particionează, grupare și indexare pentru analize
- Gestionarea sarcinilor de lucru, cache și optimizare interogații
Securitate și Guvernanță
- Control acces, roluri și securitate pe nivel de linie
- Cerinte conformități și audit
- Backup-uri, recuperare și practici de fiabilitate
Arhitecturi Moderne
- Depozite cloud de date și elasticitate
- Ingesta în timp real și analize aproape în timp real
- Optimizare costuri și monitorizare
Cupola: De la Sursă la Schema Stelară
- Modelarea proceselor de afaceri în fapte și dimensiuni
- Construirea unui flux de lucru ETL sau ELT de la început până la sfârșit
- Publishing panouri de instrumente și validarea metricilor
Suntem pe Cale: Pasii Următori
Cerințe
- Înțelegerea bazei de date relaționale și a SQL
- Experiență în analiza sau raportarea datelor
- Cunoștințe de bază cu platformele cloud sau locale pentru date
PUBLICĂȚI
- Anaisti de date care se transformat în guraferă de date
- Dezvoltatori BI și ingineri ETL
- Arhitecți de date și lideri de echipă
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina