Schița de curs

Prezentare generală a Big Data:

  • Ce este Big Data
  • De ce Big Data devine din ce în ce mai popular
  • Studii de caz Big Data
  • Caracteristicile Big Data
  • Soluții pentru lucrul cu Big Data.

Hadoop și componentele sale:

  • Ce este Hadoop și care sunt componentele sale.
  • Arhitectura Hadoop și caracteristicile datelor pe care le poate procesa.
  • Scurt istoric despre Hadoop, companiile care îl folosesc și de ce au început să-l folosească.
  • Cadrul de lucru Hadoop și componentele sale - explicate în detaliu.
  • Ce este HDFS și cum se citesc și scriu date în sistemul de fișiere distribuit Hadoop.
  • Cum să configurezi un cluster Hadoop în diferite moduri - Stand-alone/Pseudo/Multi Node cluster.

(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurațiile de rețea care trebuie verificate cu atenție, rularea demonilor Hadoop și testarea clusterului).

  • Ce este cadrul Map Reduce și cum funcționează.
  • Rularea job-urilor Map Reduce pe un cluster Hadoop.
  • Înțelegerea replicării, mirroring-ului și conștientizării rack-urilor în contextul clusterelor Hadoop.

Planificarea clusterului Hadoop:

  • Cum să îți planifici clusterul Hadoop.
  • Înțelegerea hardware-ului și software-ului pentru planificarea clusterului Hadoop.
  • Înțelegerea sarcinilor de lucru și planificarea clusterului pentru a evita defecțiunile și a obține performanța optimă.

Ce este MapR și de ce MapR:

  • Prezentare generală a MapR și arhitectura sa.
  • Înțelegerea și funcționarea sistemului de control MapR, volumele MapR, snapshot-uri și mirroring.
  • Planificarea unui cluster în contextul MapR.
  • Comparația MapR cu alte distribuții și Apache Hadoop.
  • Instalarea MapR și implementarea clusterului.

Configurarea și administrarea clusterului:

  • Gestionarea serviciilor, nodurilor, snapshot-urilor, volumelor mirror și clusterelor remote.
  • Înțelegerea și gestionarea nodurilor.
  • Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
  • Accesarea datelor pe cluster, inclusiv prin NFS. Gestionarea serviciilor și nodurilor.
  • Gestionarea datelor folosind volume, gestionarea utilizatorilor și grupurilor, gestionarea și atribuirea rolurilor nodurilor, comisionarea și decomisionarea nodurilor, administrarea clusterului și monitorizarea performanței, configurarea/analizarea și monitorizarea metricilor pentru monitorizarea performanței, configurarea și administrarea securității MapR.
  • Înțelegerea și lucrul cu M7 - Stocare nativă pentru tabelele MapR.
  • Configurarea și optimizarea clusterului pentru performanță optimă.

Actualizarea clusterului și integrarea cu alte setări:

  • Actualizarea versiunii software MapR și tipurile de actualizare.
  • Configurarea clusterului MapR pentru a accesa clusterul HDFS.
  • Configurarea clusterului MapR pe Amazon Elastic Mapreduce.

Toate aceste subiecte includ demonstrații și sesiuni practice pentru ca participanții să aibă o experiență practică a tehnologiei.

Cerințe

  • Cunoștințe de bază despre sistemul de fișiere Linux
  • Cunoștințe de bază de Java
  • Cunoștințe despre Apache Hadoop (recomandat)
 28 Ore

Numărul de participanți


Pret per participant

Mărturii (1)

Cursuri viitoare

Categorii înrudite