Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Big Data Overview:
- Ce este Big Data
- De ce Big Data devine popular
- Studii de caz pentru Big Data
- Caracteristicile Big Data
- Soluții pentru a lucra cu Big Data.
Hadoop și componente:
- Ce este Hadoop și care sunt componentele sale.
- Arhitectura Hadoop și caracteristicile de date pe care le poate procesa.
- Scurt istoric al lui Hadoop, companiile care o folosesc și de ce au început să o utilizeze.
- Cadru-ul Hadoop și componentele sale - explicații detaliate.
- Ce este HDFS și citirea/scrierea în sistemul distribuit de fișiere al lui Hadoop.
- Cum să setezi un cluster Hadoop în moduri diferite - stand-alone/pseudo/multi-node.
(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurările de rețea care trebuie urmărite cu atenție, rularea demonilor Hadoop și testarea clusterului).
- Ce este cadru-ul Map Reduce și cum funcționează.
- Rularea sarcinilor Map Reduce pe un cluster Hadoop.
- Înțelegerea replicării, mirroring-ului și a conștientizării rack în contextul clusterelor Hadoop.
Planificarea clusterului Hadoop:
- Cum să planifiți un cluster Hadoop.
- Înțelegerea hardware-ului și software-ului pentru a planifica clusterul Hadoop.
- Înțelegerea sarcinilor de lucru și planificarea clusterului pentru a evita greșeli și a realiza performanța optimală.
Ce este MapR și de ce MapR :
- Prezentare generală a lui MapR și arhitecturii sale.
- Înțelegerea și funcționarea sistemului de control MapR, volumelor MapR, snapshot-uri și mirroring.
- Planificarea unui cluster în contextul lui MapR.
- Compararea lui MapR cu alte distribuții și cu Apache Hadoop.
- Instalarea și deplasarea clusterului MapR.
Configurarea și administrarea clusterului:
- Administrarea serviciilor, noduri, snapshot-uri, volumuri de mirroring și clustere remote.
- Înțelegerea și administrarea nodurilor.
- Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
- Încarcarea datelor pe cluster, inclusiv prin NFS. Administrarea serviciilor și nodurilor.
- Administrarea datelor folosind volume-uri, administrarea utilizatorilor și grupurilor, administrarea și atribuirea rolurilor nodurilor, comisionarea și de-comissionarea nodurilor, administrarea clusterului și monitorizarea performanței, configurarea/anализăriи și monitorizarea metricilor pentru monitorizarea performanței, configurarea și administrarea securității MapR.
- Înțelegerea și utilizarea lui M7- stocare native pentru tabele MapR.
- Configurarea și calibrarea clusterului pentru performanța optimală.
Actualizarea și integrarea cu alte setări:
- Actualizarea versiunii software a lui MapR și tipurile de actualizare.
- Configurarea clusterului Mapr pentru accesul la clusterul HDFS.
- Setarea clusterei MapR pe Amazon Elastic Mapreduce.
Toate temele menționate mai sus includ demonstrații și sesiuni practice pentru a oferi explicații detaliate și experiență practică cu tehnologia.
Cerințe
- Cunoștințe de bază despre Linux FS
- Cunoștințe de bază în Java
- Cunoașterea administrării Apache Hadoop (recomandat)
28 ore
Mărturii (1)
Translate this From: en To: ro lucruri practice de făcut, precum și teorie bine prezentată de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina