Schița de curs

Big Data Overview:

  • Ce este Big Data
  • De ce Big Data devine popular
  • Studii de caz pentru Big Data
  • Caracteristicile Big Data
  • Soluții pentru a lucra cu Big Data.

Hadoop și componente:

  • Ce este Hadoop și care sunt componentele sale.
  • Arhitectura Hadoop și caracteristicile de date pe care le poate procesa.
  • Scurt istoric al lui Hadoop, companiile care o folosesc și de ce au început să o utilizeze.
  • Cadru-ul Hadoop și componentele sale - explicații detaliate.
  • Ce este HDFS și citirea/scrierea în sistemul distribuit de fișiere al lui Hadoop.
  • Cum să setezi un cluster Hadoop în moduri diferite - stand-alone/pseudo/multi-node.

(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurările de rețea care trebuie urmărite cu atenție, rularea demonilor Hadoop și testarea clusterului).

  • Ce este cadru-ul Map Reduce și cum funcționează.
  • Rularea sarcinilor Map Reduce pe un cluster Hadoop.
  • Înțelegerea replicării, mirroring-ului și a conștientizării rack în contextul clusterelor Hadoop.

Planificarea clusterului Hadoop:

  • Cum să planifiți un cluster Hadoop.
  • Înțelegerea hardware-ului și software-ului pentru a planifica clusterul Hadoop.
  • Înțelegerea sarcinilor de lucru și planificarea clusterului pentru a evita greșeli și a realiza performanța optimală.

Ce este MapR și de ce MapR :

  • Prezentare generală a lui MapR și arhitecturii sale.
  • Înțelegerea și funcționarea sistemului de control MapR, volumelor MapR, snapshot-uri și mirroring.
  • Planificarea unui cluster în contextul lui MapR.
  • Compararea lui MapR cu alte distribuții și cu Apache Hadoop.
  • Instalarea și deplasarea clusterului MapR.

Configurarea și administrarea clusterului:

  • Administrarea serviciilor, noduri, snapshot-uri, volumuri de mirroring și clustere remote.
  • Înțelegerea și administrarea nodurilor.
  • Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
  • Încarcarea datelor pe cluster, inclusiv prin NFS. Administrarea serviciilor și nodurilor.
  • Administrarea datelor folosind volume-uri, administrarea utilizatorilor și grupurilor, administrarea și atribuirea rolurilor nodurilor, comisionarea și de-comissionarea nodurilor, administrarea clusterului și monitorizarea performanței, configurarea/anализăriи și monitorizarea metricilor pentru monitorizarea performanței, configurarea și administrarea securității MapR.
  • Înțelegerea și utilizarea lui M7- stocare native pentru tabele MapR.
  • Configurarea și calibrarea clusterului pentru performanța optimală.

Actualizarea și integrarea cu alte setări:

  • Actualizarea versiunii software a lui MapR și tipurile de actualizare.
  • Configurarea clusterului Mapr pentru accesul la clusterul HDFS.
  • Setarea clusterei MapR pe Amazon Elastic Mapreduce.

Toate temele menționate mai sus includ demonstrații și sesiuni practice pentru a oferi explicații detaliate și experiență practică cu tehnologia.

Cerințe

  • Cunoștințe de bază despre Linux FS
  • Cunoștințe de bază în Java
  • Cunoașterea administrării Apache Hadoop (recomandat)
 28 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Upcoming Courses

Categorii înrudite