Schița de curs

Introducere

  • Baze de date grafice și biblioteci

Înțelegerea datelor grafice

  • Graficul ca structură de date
  • Folosind vârfuri (puncte) și margini (linii) pentru a modela scenarii din lumea reală

Utilizarea graficului Databases pentru a modela, a persista și a procesa datele grafice

  • Algoritmi/traversari grafice locale
  • neo4j, OrientDB și Titan

Exercițiu: Modelarea datelor grafice cu neo4j

  • Modelarea datelor cu tablă albă

Dincolo de grafic Databases: Graph Computing

  • Înțelegerea graficului proprietăților
  • Modelarea grafică a diferitelor scenarii (grafic software, grafic de discuție, grafic conceptual)

Rezolvarea problemelor din lumea reală cu traversări

  • Plimbare algoritmică/dirijată peste grafic
  • Determinarea dependențelor circulare

Studiu de caz: Clasificarea colaboratorilor la discuții

  • Clasamentul după număr și profunzime a discuțiilor contribuite
  • O notă despre sentimentul și analiza conceptului

Graph Computing: Seturi de instrumente locale, grafice în memorie

  • Analiză și vizualizare grafică
  • JUNG, NetworkX și iGraph

Exercițiu: Modelarea datelor grafice cu NetworkX

  • Utilizarea NetworkX pentru a modela un sistem complex

Graph Computing: Cadre grafice de procesare în loturi

  • Utilizarea Hadoop pentru stocare (HDFS) și procesare (MapReduce)
  • Prezentare generală a algoritmilor iterativi
  • Hama, Giraph și GraphLab

Graph Computing: Calcul grafic-paralel

  • Unificarea ETL, analiza exploratorie și calculul grafic iterativ într-un singur sistem
  • GraphX

Configurare și instalare

  • Hadoop și Spark

GraphX Operatori

  • Proprietate, structurală, unire, agregare de vecinătate, caching și uncaching

Iterarea cu API-ul Pregel

  • Transmiterea argumentelor pentru trimitere, primire și calcul

Construirea unui grafic

  • Utilizarea vârfurilor și marginilor într-un RDD sau pe disc

Proiectarea Scalaalgoritmilor

  • GraphX Optimizare

Accessing Algoritmi suplimentari

  • PageRank, componente conectate, numărare triunghi

Exerciții: Page Rank și Top Users

  • Construirea și procesarea datelor grafice folosind fișiere text ca intrare

Implementarea în producție

Observații de încheiere

Cerințe

  • O înțelegere a programării Java și a framework-urilor
  • O înțelegere generală a Python este utilă, dar nu este necesară
  • O înțelegere generală a conceptelor de baze de date

Audiență

  • Dezvoltatorii
  28 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Mărturii (2)

Cursuri înrudite

Categorii înrudite