Schița de curs

[1. Prezentare generală:

  • Ce este Big Data
  • De ce Big Data câștigă popularitate
  • Big Data Studii de caz
  • Big Data Caracteristici
  • Soluții pentru a lucra Big Data.

Hadoop și componentele sale:

  • Ce este Hadoop și care sunt componentele sale.
  • Hadoop Arhitectura și caracteristicile sale de date pe care le poate gestiona/procesează.
  • Scurt despre Hadoop Istorie, companii care îl folosesc și de ce au început să îl folosească.
  • Hadoop Cadrul și componentele sale - explicate în detaliu.
  • Ce este HDFS și citește -Scrie în Hadoop Sistemul de fișiere distribuit.
  • Cum se configurează Hadoop Cluster în diferite moduri- Cluster Stand-alone/Pseudo/Multi Node.

(Acest lucru include configurarea unui Hadoop cluster în VirtualBox/KVM/VMware, configurații de rețea care trebuie analizate cu atenție, rularea Hadoop Daemons și testarea clusterului).

  • Ce este Map Reduce Framework și cum funcționează.
  • Rularea sarcinilor Map Reduce pe cluster Hadoop.
  • Înțelegerea conștientizării replicare, oglindire și rack în contextul Hadoop clustere.

Hadoop Planificarea grupurilor:

  • Cum să vă planificați clusterul Hadoop.
  • Înțelegerea hardware-ului software pentru a vă planifica clusterul Hadoop.
  • Înțelegerea sarcinilor de lucru și planificarea clusterului pentru a evita eșecurile și a performa optim.

Ce este MapR și de ce MapR:

  • Prezentare generală a MapR și a arhitecturii sale.
  • Înțelegerea și funcționarea sistemului de control MapR, volumele MapR, instantaneele și oglinzile.
  • Planificarea unui cluster în contextul MapR.
  • Comparația MapR cu alte distribuții și Apache Hadoop.
  • Instalarea MapR și implementarea clusterului.

Configurarea și administrarea clusterului:

  • Gestionarea serviciilor, nodurilor, instantaneelor, volumelor oglindă și clusterelor la distanță.
  • Înțelegerea și gestionarea nodurilor.
  • Înțelegerea Hadoop componentelor, Instalarea Hadoop componentelor împreună cu MapR Services.
  • Accessgând date pe cluster, inclusiv prin intermediul serviciilor și nodurilor de gestionare NFS.
  • Gestionarea datelor prin utilizarea volumelor, gestionarea utilizatorilor și a grupurilor, gestionarea și atribuirea de roluri nodurilor, punerea în funcțiune a dezafectării nodurilor, administrarea clusterului și monitorizarea performanței, configurarea/analizarea și monitorizarea metricilor pentru a monitoriza performanța, configurarea și administrarea securității MapR.
  • Înțelegerea și lucrul cu M7- Stocare nativă pentru tabelele MapR.
  • Configurare și reglare cluster pentru performanțe optime.

Actualizarea clusterului și integrarea cu alte setări:

  • Actualizarea versiunii software a MapR și a tipurilor de upgrade.
  • Configurarea clusterului Mapr pentru a accesa clusterul HDFS.
  • Configurarea clusterului MapR pe Amazon Elastic Mapreduce.

Toate subiectele de mai sus includ demonstrații și sesiuni de practică pentru ca cursanții să aibă experiență practică a tehnologiei.

Cerințe

  • Cunoștințe de bază de Linux FS
  • Cunoștințe de bază de Java
  • Cunoștințe de Apache Hadoop (recomandat)
  • .
 28 ore

Numărul de participanți



Pret per participant

Mărturii (1)

Cursuri înrudite

Categorii înrudite