Schița de curs

Introducere

  • Baze de date grafice și biblioteci

Înțelegerea datelor grafice

  • Graful ca structură de date
  • Utilizarea vârfurilor (punctelor) și a marginilor (liniilor) pentru a modela scenarii din lumea reală

Utilizarea grafurilor Database pentru modelarea, persistența și procesarea datelor grafice

  • Algoritmi/traversări locale ale grafurilor
  • neo4j, OrientDB și Titan

Exercițiu: Modelarea datelor grafice cu neo4j

  • Modelarea datelor pe tablă albă

Dincolo de graf Databases: Graph Computing

  • Înțelegerea graficului de proprietăți
  • Modelarea grafică a diferitelor scenarii (graf software, graf de discuții, graf conceptual)

Rezolvarea problemelor din lumea reală cu ajutorul traversărilor

  • Parcurgerea algoritmică/direcționată a grafului
  • Determinarea dependențelor circulare

Studiu de caz: Clasificarea contribuitorilor la discuții

  • Clasificare în funcție de numărul și profunzimea discuțiilor la care s-a contribuit
  • O notă privind analiza sentimentelor și a conceptelor

Graph Computing: Seturi de instrumente grafice locale, în memorie

  • Analiza și vizualizarea grafurilor
  • JUNG, NetworkX și iGraph

Exercițiu: Modelarea datelor grafice cu NetworkX

  • Utilizarea NetworkX pentru a modela un sistem complex

Graph Computing: Cadre de procesare pe loturi a grafurilor

  • Utilizarea Hadoop pentru stocare (HDFS) și procesare (MapReduce)
  • Prezentare generală a algoritmilor iterativi
  • Hama, Giraph și GraphLab

Graph Computing: Calcularea grafică paralelă

  • Unificarea ETL, analiza exploratorie și calculul iterativ al grafurilor într-un singur sistem
  • GraphX

Configurare și instalare

  • Hadoop și Spark

GraphX Operatori

  • Proprietate, structural, join, agregare vecinătate, caching și uncaching

Iterarea cu API Pregel

  • Transmiterea de argumente pentru trimitere, primire și calcul

Construirea unui graf

  • Utilizarea vârfurilor și marginilor într-un RDD sau pe disc

Proiectarea Scalable Algoritmi

  • GraphX Optimizare

Accessing Algoritmi suplimentari

  • PageRank, componente conectate, numărarea triunghiurilor

Exercițiu: Page Rank și utilizatori de top

  • Construirea și procesarea datelor grafice folosind fișiere text ca intrare

Implementarea în producție

Observații finale

Cerințe

  • O înțelegere a Java programării și a cadrelor
  • O înțelegere generală a Python este utilă, dar nu obligatorie
  • O înțelegere generală a conceptelor de baze de date

Audiență

  • Dezvoltatori
 28 ore

Numărul de participanți


Pret per participant

Mărturii (2)

Upcoming Courses

Categorii înrudite