Schița de curs
Introducere
- De ce și cum adoptă echipele de proiect Hadoop
- Cum a început totul
- Rolul managerului de proiect în Hadoop proiecte
Înțelegerea arhitecturii Hadoop și a conceptelor cheie
- HDFS
- MapReduce
- Alte piese ale ecosistemului Hadoop.
Ce constituie Big Data?
Diferite abordări ale stocării Big Data
HDFS (Hadoop Sistem de fișiere distribuite) ca fundație
Cum este procesat Big Data.
- Puterea procesării distribuite
Prelucrarea datelor cu MapReduce
- Cum sunt separate datele pas cu pas
Rolul clusterizării în procesarea distribuită la scară largă
- Privire de ansamblu arhitecturală
- Abordări de grupare
Gruparea datelor și proceselor dvs. cu YARN
Rolul non-relațional Database în Big Data Stocare
Lucrul cu Hadoop non-relațional Database: HBase
Prezentare generală arhitecturală a depozitării datelor
Gestionați-vă Data Warehouse cu Hive
Rulează Hadoop din Shell-Scripts
Lucrul cu Hadoop Streaming
Alte Hadoop Instrumente și utilități
Noțiuni introductive pentru un proiect Hadoop.
- Demistificarea complexității
Migrarea unui proiect existent la Hadoop
- Considerente legate de infrastructură
- Extindere dincolo de resursele alocate
Hadoop Părțile interesate ale proiectului și seturile lor de instrumente
- Dezvoltatori, cercetători de date, analiști de afaceri și manageri de proiect
Hadoop ca fundație pentru noi tehnologii și abordări
Observații de încheiere
Cerințe
- O înțelegere generală a programării
- O înțelegere a bazelor de date
- Cunoștințe de bază de Linux .
Mărturii (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Curs - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Curs - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay