Schița de curs

  1. Fundamentele Big Data
    • Big Data și rolul său în lumea corporativă
    • Fazele dezvoltării unei strategii Big Data în cadrul unei corporații
    • Explicați rațiunea care stă la baza abordării holistice a Big Data
    • Componentele necesare într-o platformă Big Data.
    • Soluție de stocare a datelor mari
    • Limitele tehnologiilor tradiționale
    • Prezentare generală a tipurilor de baze de date
    • Cele patru dimensiuni ale Big Data
  2. Impactul datelor mari asupra afacerii
    • Business importanța Big Data
    • Provocări ale extragerii de date utile
    • Integrarea Big Data cu datele tradiționale
  3. Tehnologii de stocare a datelor mari
    • Prezentare generală a tehnologiilor de date mari
      • Modele de stocare a datelor
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Alegerea tehnologiei potrivite pentru Big Data
  4. Prelucrarea datelor mari
    • Conectarea și extragerea datelor din baza de date
    • Transformarea și pregătirea datelor pentru prelucrare
    • Folosind Hadoop MapReduce pentru procesarea datelor distribuite
    • Monitorizarea și executarea Hadoop joburi MapReduce
    • Hadoop blocuri de construcție ale sistemului de fișiere distribuite
    • Mapreduce și Yarn
    • Gestionarea datelor în flux cu Spark
  5. Instrumente și tehnologii de analiză a datelor mari
    • Programming Hadoop cu limba latină porc
    • Interogarea datelor mari cu Hive
    • Exploatarea datelor cu Mahout
    • Instrumente de vizualizare și raportare
  6. Big data în afaceri
    • Gestionarea și stabilirea Big Data nevoilor
    • Business importanța Big Data
    • Selectarea instrumentelor de big data potrivite pentru problemă

Concepte de depozitare a datelor

  • Ce este Data Ware House?
  • Diferența dintre OLTP și Data Ware Housing
  • Achizitie de date
  • Extragerea datelor
  • Transformarea datelor.
  • Încărcarea datelor
  • Data Marts
  • Date dependente vs independente Mart
  • Proiectarea bazei de date

Concepte de testare ETL:

  • Introducere.
  • Ciclul de viață al dezvoltării software.
  • Metodologii de testare.
  • Procesul fluxului de lucru de testare ETL.
  • Responsabilități de testare ETL în etapa de date.

Fundamentele Big Data

  • Big Data și rolul său în lumea corporativă
  • Fazele dezvoltării unei strategii Big Data în cadrul unei corporații
  • Explicați rațiunea care stă la baza abordării holistice a Big Data
  • Componentele necesare într-o platformă Big Data.
  • Soluție de stocare a datelor mari
  • Limitele tehnologiilor tradiționale
  • Prezentare generală a tipurilor de baze de date

NoSQL Databases

Hadoop

Reducere hartă

Apache Spark

Cerințe

Delegații ar trebui să cunoască și să aibă o anumită experiență în ceea ce privește instrumentele de stocare și să știe să manipuleze seturi mari de date.

 14 ore

Numărul de participanți



Pret per participant

Mărturii (4)

Cursuri înrudite

Unified Batch and Stream Processing with Apache Beam

14 ore

Categorii înrudite