Acasa
Big Data Formare
Hadoop Formare
Cursuri de pregatire Hadoop pentru Dezvoltatori (4 zile)

Cursuri de pregatire Hadoop pentru Dezvoltatori (4 zile)

Apache Hadoop este cel mai popular framework pentru procesarea de Big Data pe clustere de servere. Acest curs îi va prezenta unui dezvoltator diverse componente (HDFS, MapReduce, Pig, Hive și HBase) ale ecosistemului Hadoop.

Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.

Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.

Schița de curs

Secțiunea 1: Introducere în Hadoop

Istoricul și conceptele Hadoop
ecosistem
distribuții
arhitectură de nivel înalt
mituri despre Hadoop
provocări Hadoop
hardware / software
laborator: primul contact cu Hadoop

Secțiunea 2: HDFS

Proiectare și arhitectură
concepte (scalare orizontală, replicare, localizarea datelor, conștientizarea rack-urilor)
Daemons: Namenode, Secondary namenode, Data node
comunicări / heart-beats
integritatea datelor
calea de citire / scriere
Namenode High Availability (HA), Federation
laborator: Interacțiune cu HDFS

Secțiunea 3: Map Reduce

concepte și arhitectură
daemons (MRV1): jobtracker / tasktracker
faze: driver, mapper, shuffle/sort, reducer
Map Reduce Versiunea 1 și Versiunea 2 (YARN)
Interiorul Map Reduce
Introducere în programul Java Map Reduce
laborator: Rularea unui program MapReduce de exemplu

Secțiunea 4: Pig

pig vs java map reduce
fluxul de lucru Pig
limbajul Pig Latin
ETL cu Pig
Transformări & Îmbinări
Funcții definite de utilizator (UDF)
laborator: scrierea de scripturi Pig pentru analiza datelor

Secțiunea 5: Hive

arhitectură și proiectare
tipuri de date
suport SQL în Hive
Crearea de tabele Hive și interogare
partiții
îmbinări
procesarea textului
laborator: diverse exerciții de procesare a datelor cu Hive

Secțiunea 6: HBase

concepte și arhitectură
HBase vs RDBMS vs Cassandra
API Java HBase
Date de tip serie temporală în HBase
proiectarea schemei
laborator: Interacțiune cu HBase folosind shell; programare în API Java HBase; Exercițiu de proiectare a schemei

Cerințe

cunoștințe solide ale limbajului de programare Java (majoritatea exercițiilor de programare sunt în Java)
familiarizat cu mediul Linux (să fie capabil să navigheze în linia de comandă Linux, să editeze fișiere folosind vi / nano)

Mediu de laborator

Zero Install : Nu este nevoie să instalați software Hadoop pe mașinile studenților! Un cluster Hadoop funcțional va fi pus la dispoziția studenților.

Studenții vor avea nevoie de următoarele

un client SSH (Linux și Mac au deja clienți ssh, pentru Windows se recomandă Putty)
un browser pentru a accesa clusterul, se recomandă Firefox

28 Ore

Numărul de participanți

(Online (Distanță))

Sală de clasă

Selectati Locatia

Vă rugăm să selectați un loc

Pret per participant

Cursurile publice necesita 5+ participanti

Cursuri de pregatire Hadoop pentru Dezvoltatori (4 zile) - Rezervare

Nume Prenume *

E-mail *

Telefon *

Numele jobului

Numele companiei

Adresa 1 *

Orasul *

Oras / Judet

Tara *

Cod Postal *

Data de inceput

ID Tax

Datale sunt supuse disponibilității și au loc între 09:30 și 16:30.

Metoda de plata *

Transfer Bancar (Factura, PO)

Credit / Debit Card

Comentarii

Termeni și Condiții *

Sunt un reprezentant autorizat al clientului menționat mai sus și doresc să rezerv cursurile sau serviciile de mai sus în conformitate cu Termenii și condițiile NobleProg și cu Politica de confidențialitate.

Informeaza-ma de discount-uri si promotii.

Vă rugăm să citiți Politica de confidențialitate pentru a afla cum folosim datele dumneavoastră.

Cursuri de pregatire Hadoop pentru Dezvoltatori (4 zile) - Solicitare

Nume Prenume *

E-mail *

Telefon *

Numărul de participanți

Numele companiei

Adresa Companiei

Cum vrei să urmezi cursul?

Locatia clientului

Online (Remote)

Sală de clasă

Comentarii

Informeaza-ma de discount-uri si promotii.

Vă rugăm să citiți Politica de confidențialitate pentru a afla cum folosim datele dumneavoastră.

Hadoop pentru Dezvoltatori (4 zile) - Cerere de consultanta

Nume Prenume *

Telefon *

E-mail *

Numele companiei

Subiectul de consultanta *

Scopul consultantei

Cu cine va colabora/lucra consultantul?

Urgenta *

Comentarii

Informeaza-ma de discount-uri si promotii.

Vă rugăm să citiți Politica de confidențialitate pentru a afla cum folosim datele dumneavoastră.

Mărturii (1)

Exerciții practice. Clasa ar fi trebuit să dureze 5 zile, dar cele 3 zile au ajutat la clarificarea multor întrebări pe care le aveam din cauza lucrului cu NiFi.

James - BHG Financial

Curs - Apache NiFi for Administrators

1305 EUR (Online (Remote))

2105 EUR (Sală de clasă)

Cursuri înrudite

Formare pentru Administratori Apache Hadoop

35 Ore

Publicul țintă:

Cursul este destinat specialiștilor IT care caută o soluție pentru stocarea și procesarea seturilor mari de date într-un mediu de sistem distribuit

Obiectiv:

Dobândirea de cunoștințe aprofundate despre administrarea clusterelor Hadoop.

Citește mai mult...

Analiza Big Data în Sănătate

21 Ore

Analiza Big Data implică procesul de examinare a unor cantități mari de seturi de date variate pentru a descoperi corelații, modele ascunse și alte informații utile.

Industria sănătății dispune de volume uriașe de date medicale și clinice complexe și eterogene. Aplicarea analizei Big Data pe datele din domeniul sănătății prezintă un potențial enorm în obținerea de informații pentru îmbunătățirea furnizării de servicii medicale. Cu toate acestea, amploarea acestor seturi de date aduce mari provocări în analize și aplicații practice într-un mediu clinic.

În acest training condus de un instructor, live (la distanță), participanții vor învăța cum să efectueze analize Big Data în domeniul sănătății, parcurgând o serie de exerciții practice în laborator.

La sfârșitul acestui training, participanții vor putea:

Instala și configura instrumente de analiză Big Data, cum ar fi Hadoop MapReduce și Spark
Înțelege caracteristicile datelor medicale
Aplica tehnici Big Data pentru a gestiona date medicale
Studia sisteme și algoritmi Big Data în contextul aplicațiilor din sănătate

Publicul țintă

Dezvoltatori
Specialiști în Știința Datelor

Formatul cursului

Parte teoretică, parte discuții, exerciții și practică intensivă.

Notă

Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.

Citește mai mult...

Hadoop pentru Administratori

21 Ore

Apache Hadoop este cel mai popular cadru pentru procesarea Big Data pe clustere de servere. În acest curs de trei (opțional, patru) zile, participanții vor învăța despre beneficiile și cazurile de utilizare ale Hadoop și ale ecosistemului său, cum să planifice implementarea și creșterea clusterului, cum să instaleze, să întrețină, să monitorizeze, să depaneze și să optimizeze Hadoop. De asemenea, vor exersa încărcarea masivă de date în cluster, se vor familiariza cu diverse distribuții Hadoop și vor exersa instalarea și gestionarea instrumentelor din ecosistemul Hadoop. Cursul se încheie cu o discuție despre securizarea clusterului cu Kerberos.

“…Materialele au fost foarte bine pregătite și acoperite pe larg. Laboratorul a fost foarte util și bine organizat”
— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising

Audiență

Administratori Hadoop

Format

Prelegeri și laboratoare practice, echilibru aproximativ 60% prelegeri, 40% laboratoare.

Citește mai mult...

Hadoop Avansat pentru Dezvoltatori

21 Ore

Apache Hadoop este unul dintre cele mai populare framework-uri pentru procesarea Big Data pe clustere de servere. Acest curs explorează gestionarea datelor în HDFS, precum și aspecte avansate ale Pig, Hive și HBase. Aceste tehnici avansate de programare vor fi benefice pentru dezvoltatorii experimentați de Hadoop.

Public țintă: dezvoltatori

Durata: trei zile

Format: prelegeri (50%) și laboratoare practice (50%).

Citește mai mult...

Administrarea Hadoop pe MapR

28 Ore

Publicul țintă:

Acest curs are ca scop să demistifice tehnologia big data/hadoop și să arate că nu este greu de înțeles.

Citește mai mult...

Hadoop și Spark pentru Administratori

35 Ore

Acest training condus de un instructor, live în România (online sau la fața locului) este destinat administratorilor de sistem care doresc să învețe cum să configureze, să implementeze și să gestioneze clustere Hadoop în organizația lor.

La finalul acestui training, participanții vor putea:

Instala și configura Apache Hadoop.
Înțelege cele patru componente majore ale ecosistemului Hadoop: HDFS, MapReduce, YARN și Hadoop Common.
Utiliza Hadoop Distributed File System (HDFS) pentru a scala un cluster la sute sau mii de noduri.
Configura HDFS să funcționeze ca motor de stocare pentru implementările Spark on-premise.
Configura Spark pentru a accesa soluții alternative de stocare, cum ar fi Amazon S3 și sisteme de baze de date NoSQL precum Redis, Elasticsearch, Couchbase, Aerospike, etc.
Efectua sarcini administrative, cum ar fi provizionarea, gestionarea, monitorizarea și securizarea unui cluster Apache Hadoop.

Citește mai mult...

HBase pentru Dezvoltatori

21 Ore

Acest curs introduce HBase – un magazin NoSQL pe baza Hadoop. Cursul este destinat dezvoltatorilor care vor folosi HBase pentru a dezvolta aplicații și administratorilor care vor gestiona clustere HBase.

Vom ghida un dezvoltator prin arhitectura HBase, modelarea datelor și dezvoltarea aplicațiilor pe HBase. De asemenea, vom discuta despre utilizarea MapReduce cu HBase și câteva subiecte de administrare legate de optimizarea performanței. Cursul este foarte practic, cu multe exerciții de laborator.

Durata: 3 zile

Public țintă: Dezvoltatori și Administratori

Citește mai mult...

Apache NiFi pentru Administratori

21 Ore

Apache NiFi este o platformă open-source, bazată pe flux, pentru integrarea datelor și procesarea evenimentelor. Permite rutarea, transformarea și medierea automată a datelor în timp real între sisteme disparate, cu o interfață web și control detaliat.

Această instruire condusă de un instructor, în format live (pe fața locului sau la distanță), este destinată administratorilor și inginerilor de nivel intermediar care doresc să implementeze, să gestioneze, să securizeze și să optimizeze fluxurile de date NiFi în medii de producție.

La finalul acestei instruiri, participanții vor putea:

Să instaleze, să configureze și să întrețină clustere Apache NiFi.
Să proiecteze și să gestioneze fluxuri de date din surse și destinații variate.
Să implementeze automatizarea fluxurilor, rutarea și logica de transformare.
Să optimizeze performanța, să monitorizeze operațiunile și să depaneze probleme.

Formatul Cursului

Prezentare interactivă cu discuții despre arhitecturi din lumea reală.
Laboratoare practice: construirea, implementarea și gestionarea fluxurilor.
Exerciții bazate pe scenarii într-un mediu de laborator live.

Opțiuni de Personalizare a Cursului

Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.

Citește mai mult...

Apache NiFi pentru Dezvoltatori

7 Ore

În acest training condus de un instructor, participanții vor învăța elementele de bază ale programării bazate pe fluxuri, dezvoltând o serie de extensii demo, componente și procesoare folosind Apache NiFi.

La sfârșitul acestui training, participanții vor putea:

Să înțeleagă arhitectura NiFi și conceptele de flux de date.
Să dezvolte extensii folosind NiFi și API-uri ale terților.
Să dezvolte propriul procesor Apache NiFi.
Să ingere și să proceseze date în timp real din formate de fișiere și surse de date diverse și neobișnuite.

Citește mai mult...

Python, Spark și Hadoop pentru Big Data

21 Ore

Acest training condus de un instructor, live în România (online sau la fața locului) este destinat dezvoltatorilor care doresc să utilizeze și să integreze Spark, Hadoop și Python pentru a procesa, analiza și transforma seturi de date mari și complexe.

La sfârșitul acestui training, participanții vor putea:

Să configureze mediul necesar pentru a începe procesarea datelor mari cu Spark, Hadoop și Python.
Să înțeleagă caracteristicile, componentele de bază și arhitectura Spark și Hadoop.
Să învețe cum să integreze Spark, Hadoop și Python pentru procesarea datelor mari.
Să exploreze instrumentele din ecosistemul Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka și Flume).
Să construiască sisteme de recomandare bazate pe filtrare colaborativă asemănătoare cu cele de la Netflix, YouTube, Amazon, Spotify și Google.
Să utilizeze Apache Mahout pentru a scala algoritmii de învățare automată.

Citește mai mult...

Cursuri de pregatire Hadoop pentru Dezvoltatori (4 zile)

Schița de curs

Secțiunea 1: Introducere în Hadoop

Secțiunea 2: HDFS

Secțiunea 3: Map Reduce

Secțiunea 4: Pig

Secțiunea 5: Hive

Secțiunea 6: HBase

Cerințe

Mediu de laborator

Mărturii (1)

James - BHG Financial

Curs - Apache NiFi for Administrators

Cursuri viitoare

Hadoop pentru Dezvoltatori (4 zile)

Hadoop pentru Dezvoltatori (4 zile)

Hadoop pentru Dezvoltatori (4 zile)

Hadoop pentru Dezvoltatori (4 zile)

Hadoop pentru Dezvoltatori (4 zile)

Categorii înrudite

Această site în alte țări/regiuni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites