Schița de curs

Introducere

Instalarea și configurarea Dataiku Data Science Studio (DSS)

  • Cerințe de sistem pentru Dataiku DSS
  • Configurarea integrărilor Apache Hadoop și Apache Spark
  • Configurarea Dataiku DSS cu proxy-uri web
  • Migrarea de la alte platforme la Dataiku DSS

Prezentare generală a caracteristicilor și arhitecturii Dataiku DSS

  • Obiecte și grafice de bază care stau la baza Dataiku DSS
  • Ce este o rețetă în Dataiku DSS?
  • Tipuri de seturi de date acceptate de Dataiku DSS

Crearea unui proiect Dataiku DSS

Definirea seturilor de date pentru conectarea la resursele de date în Dataiku DSS

  • Lucrul cu conectorii DSS și cu formatele de fișiere
  • Formatele DSS standard v.s. Hadoop - formate specifice
  • Încărcarea fișierelor pentru un proiect Dataiku DSS

Prezentare generală a sistemului de fișiere server în Dataiku DSS

Crearea și utilizarea folderelor gestionate

  • Rețeta Dataiku DSS pentru dosarul de fuziune
  • Dosare gestionate local vs. nelocal

Construirea unui set de date de sistem de fișiere utilizând conținutul dosarelor gestionate

  • Efectuarea curățeniei cu o rețetă de cod DSS

Lucrul cu setul de date Metrics și setul de date Internal Stats

Implementarea rețetei de descărcare DSS pentru setul de date HTTP

Relocalizarea seturilor de date SQL și a seturilor de date HDFS utilizând DSS

Ordonarea seturilor de date în Dataiku DSS

  • Ordonarea Writer vs. ordonarea în timp de citire

Explorarea și pregătirea imaginilor de date pentru un proiect Dataiku DSS

Prezentare generală a schemelor Dataiku, a tipurilor de stocare și a semnificațiilor

Efectuarea de scripturi de curățare, normalizare și îmbogățire a datelor în Dataiku DSS

Lucrul cu interfața Dataiku DSS Charts și tipurile de agregări vizuale

Utilizarea caracteristicii interactive Statistics a DSS

  • Analiza univariată vs. analiza bivariată
  • Utilizarea instrumentului DSS de analiză a componentelor principale (PCA)

Prezentare generală a Machine Learning cu Dataiku DSS

  • ML supravegheat vs. ML nesupravegheat
  • Referințe pentru DSS ML Algoritmi și tratarea caracteristicilor
  • Deep Learning cu Dataiku DSS

Prezentare generală a fluxului derivat din seturile de date și rețetele DSS

Transformarea seturilor de date existente în DSS cu ajutorul rețetelor vizuale

Utilizarea rețetelor DSS bazate pe codul definit de utilizator

Optimizarea explorării și experimentării codului cu notebook-urile de cod DSS

Scrierea de vizualizări DSS avansate și funcții frontale personalizate cu Webapps

Lucrul cu caracteristica Dataiku DSS Code Reports Feature

Împărtășirea proiectelor de date Element și familiarizarea cu tabloul de bord DSS

Proiectarea și împachetarea unui proiect Dataiku DSS ca aplicație reutilizabilă

Prezentare generală a metodelor avansate din Dataiku DSS

  • Implementarea partiționării optimizate a seturilor de date utilizând DSS
  • Executarea unor părți specifice de procesare DSS prin calcule în containere Kubernetes.

Prezentare generală a Collaboration și controlul versiunilor în Dataiku DSS

Implementarea scenariilor de automatizare, a parametrilor și verificărilor pentru testarea proiectelor DSS

Implementarea și actualizarea unui proiect cu nodul de automatizare DSS și cu pachetele de module

Lucrul cu API-uri în timp real în Dataiku DSS

  • API-uri suplimentare și API-uri Rest în DSS

Analiza și Forecasting Dataiku DSS Dataiku DSS Time Series

Securizarea unui proiect în Dataiku DSS

  • Gestionarea permisiunilor de proiect și a autorizațiilor pentru tabloul de bord
  • Implementarea opțiunilor avansate de securitate

Integrarea Dataiku DSS cu Cloud-ul

Depanare

Rezumat și concluzii

Cerințe

  • Experiență cu limbajele de programare Python, SQL, și R
  • Cunoștințe de bază privind prelucrarea datelor cu Apache Hadoop și Spark
  • Comprehensiunea conceptelor de machine learning și a modelelor de date
  • Cunoștințe de bază în analize statistice și concepte de știință a datelor
  • Experiență în vizualizarea și comunicarea datelor
  • .

Audiență

  • Inginerii
  • Cercetători de date
  • Analiști de date
 21 ore

Numărul de participanți



Pret per participant

Cursuri înrudite

Categorii înrudite