Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Prezentare generală a Big Data:
- Ce este Big Data
- De ce Big Data devine din ce în ce mai popular
- Studii de caz Big Data
- Caracteristicile Big Data
- Soluții pentru lucrul cu Big Data.
Hadoop și componentele sale:
- Ce este Hadoop și care sunt componentele sale.
- Arhitectura Hadoop și caracteristicile datelor pe care le poate procesa.
- Scurt istoric despre Hadoop, companiile care îl folosesc și de ce au început să-l folosească.
- Cadrul de lucru Hadoop și componentele sale - explicate în detaliu.
- Ce este HDFS și cum se citesc și scriu date în sistemul de fișiere distribuit Hadoop.
- Cum să configurezi un cluster Hadoop în diferite moduri - Stand-alone/Pseudo/Multi Node cluster.
(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurațiile de rețea care trebuie verificate cu atenție, rularea demonilor Hadoop și testarea clusterului).
- Ce este cadrul Map Reduce și cum funcționează.
- Rularea job-urilor Map Reduce pe un cluster Hadoop.
- Înțelegerea replicării, mirroring-ului și conștientizării rack-urilor în contextul clusterelor Hadoop.
Planificarea clusterului Hadoop:
- Cum să îți planifici clusterul Hadoop.
- Înțelegerea hardware-ului și software-ului pentru planificarea clusterului Hadoop.
- Înțelegerea sarcinilor de lucru și planificarea clusterului pentru a evita defecțiunile și a obține performanța optimă.
Ce este MapR și de ce MapR:
- Prezentare generală a MapR și arhitectura sa.
- Înțelegerea și funcționarea sistemului de control MapR, volumele MapR, snapshot-uri și mirroring.
- Planificarea unui cluster în contextul MapR.
- Comparația MapR cu alte distribuții și Apache Hadoop.
- Instalarea MapR și implementarea clusterului.
Configurarea și administrarea clusterului:
- Gestionarea serviciilor, nodurilor, snapshot-urilor, volumelor mirror și clusterelor remote.
- Înțelegerea și gestionarea nodurilor.
- Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
- Accesarea datelor pe cluster, inclusiv prin NFS. Gestionarea serviciilor și nodurilor.
- Gestionarea datelor folosind volume, gestionarea utilizatorilor și grupurilor, gestionarea și atribuirea rolurilor nodurilor, comisionarea și decomisionarea nodurilor, administrarea clusterului și monitorizarea performanței, configurarea/analizarea și monitorizarea metricilor pentru monitorizarea performanței, configurarea și administrarea securității MapR.
- Înțelegerea și lucrul cu M7 - Stocare nativă pentru tabelele MapR.
- Configurarea și optimizarea clusterului pentru performanță optimă.
Actualizarea clusterului și integrarea cu alte setări:
- Actualizarea versiunii software MapR și tipurile de actualizare.
- Configurarea clusterului MapR pentru a accesa clusterul HDFS.
- Configurarea clusterului MapR pe Amazon Elastic Mapreduce.
Toate aceste subiecte includ demonstrații și sesiuni practice pentru ca participanții să aibă o experiență practică a tehnologiei.
Cerințe
- Cunoștințe de bază despre sistemul de fișiere Linux
- Cunoștințe de bază de Java
- Cunoștințe despre Apache Hadoop (recomandat)
28 Ore
Mărturii (1)
aspecte practice de lucru, precum și teoria au fost prezentate bine de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina