Schița de curs
Introducere
Prezentare generală a caracteristicilor și arhitecturii "Open Studio for Big Data"
Configurarea Open Studio for Big Data
Navigarea în interfața de utilizator
Înțelegerea componentelor și conectorilor pentru date mari
Conectarea la un cluster Hadoop
Citirea și scrierea datelor
Procesarea datelor cu Hive și MapReduce
Analizarea rezultatelor
Îmbunătățirea calității datelor mari
Construirea unui flux de date mari
Gestionarea utilizatorilor, grupurilor, rolurilor și proiectelor
Implementarea Open Studio în producție
Monitorizarea Open Studio
Depanarea
Rezumat și concluzii
Cerințe
- Înțelegerea bazelor de date relaționale
- Înțelegerea depozitelor de date
- Înțelegerea conceptelor ETL (Extract, Transform, Load)
Audiență
- Profesioniști în business intelligence
- Profesioniști în baze de date
- Dezvoltatori SQL
- Dezvoltatori ETL
- Arhitecți de soluții
- Arhitecți de date
- Profesioniști în depozite de date
- Administratori și integratiori de sisteme
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina