Schița de curs

  1. Fundamentele Big Data
    • Big Data și rolul său în lumea corporativă
    • Fazele dezvoltării unei strategii Big Data în cadrul unei corporații
    • Explicați rațiunea care stă la baza abordării holistice a Big Data
    • Componentele necesare într-o platformă Big Data.
    • Soluție de stocare a datelor mari
    • Limitele tehnologiilor tradiționale
    • Prezentare generală a tipurilor de baze de date
    • Cele patru dimensiuni ale Big Data
  2. Impactul datelor mari asupra afacerii
    • Business importanța Big Data
    • Provocări ale extragerii de date utile
    • Integrarea Big Data cu datele tradiționale
  3. Tehnologii de stocare a datelor mari
    • Prezentare generală a tehnologiilor de date mari
      • Modele de stocare a datelor
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Alegerea tehnologiei potrivite pentru Big Data
  4. Prelucrarea datelor mari
    • Conectarea și extragerea datelor din baza de date
    • Transformarea și pregătirea datelor pentru prelucrare
    • Folosind Hadoop MapReduce pentru procesarea datelor distribuite
    • Monitorizarea și executarea Hadoop joburi MapReduce
    • Hadoop blocuri de construcție ale sistemului de fișiere distribuite
    • Mapreduce și Yarn
    • Gestionarea datelor în flux cu Spark
  5. Instrumente și tehnologii de analiză a datelor mari
    • Programming Hadoop cu limba latină porc
    • Interogarea datelor mari cu Hive
    • Exploatarea datelor cu Mahout
    • Instrumente de vizualizare și raportare
  6. Big data în afaceri
    • Gestionarea și stabilirea Big Data nevoilor
    • Business importanța Big Data
    • Selectarea instrumentelor de big data potrivite pentru problemă

Concepte de depozitare a datelor

  • Ce este Data Ware House?
  • Diferența dintre OLTP și Data Ware Housing
  • Achizitie de date
  • Extragerea datelor
  • Transformarea datelor.
  • Încărcarea datelor
  • Data Marts
  • Date dependente vs independente Mart
  • Proiectarea bazei de date

Concepte de testare ETL:

  • Introducere.
  • Ciclul de viață al dezvoltării software.
  • Metodologii de testare.
  • Procesul fluxului de lucru de testare ETL.
  • Responsabilități de testare ETL în etapa de date.

Fundamentele Big Data

  • Big Data și rolul său în lumea corporativă
  • Fazele dezvoltării unei strategii Big Data în cadrul unei corporații
  • Explicați rațiunea care stă la baza abordării holistice a Big Data
  • Componentele necesare într-o platformă Big Data.
  • Soluție de stocare a datelor mari
  • Limitele tehnologiilor tradiționale
  • Prezentare generală a tipurilor de baze de date

NoSQL Databases

Hadoop

Reducere hartă

Apache Spark

Cerințe

Delegații ar trebui să cunoască și să aibă o anumită experiență în ceea ce privește instrumentele de stocare și să știe să manipuleze seturi mari de date.

  14 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Mărturii (4)

Cursuri înrudite

Unified Batch and Stream Processing with Apache Beam

  14 ore

Categorii înrudite