Cursuri Big Data

Cursuri Big Data

Cursurile de instruire a cursanților locali, instruiți de instructori, încep cu o introducere la conceptele elementare ale Big Data, apoi progresul în limbile de programare și metodologiile utilizate pentru a efectua analiza datelor. Instrumentele și infrastructura pentru a permite stocarea datelor mari, procesarea distribuită și scalabilitatea sunt discutate, comparate și implementate în sesiuni de practică demo. Ansamblul de formare a datelor este disponibil ca "formare live la fața locului" sau "formare live la distanță". Training-ul live la fața locului poate fi efectuat la fața locului la sediul clientului România sau în centrele de formare corporativa NobleProg din România România . Instruirea live la distanță este realizată printr-un desktop interactiv, la distanță. NobleProg - Furnizorul dvs. de formare locală

Marturii

★★★★★
★★★★★

Schita de curs

CodNumeDuratăRezumat
smtwebintSemantic Web Overview7 oreWebul Semantic este o mișcare de colaborare condusă de Consorțiul World Wide Web (W3C) care promovează formate comune pentru datele de pe World Wide Web. Webul Semantic oferă un cadru comun care permite partajarea și reutilizarea datelor în cadrul granițelor aplicațiilor, întreprinderii și comunității.
ApacheIgniteApache Ignite: Improve Speed, Scale and Availability with In-Memory Computing14 oreApache Ignite is an in-memory computing platform that sits between the application and data layer to improve speed, scale, and availability.

In this instructor-led, live training, participants will learn the principles behind persistent and pure in-memory storage as they step through the creation of a sample in-memory computing project.

By the end of this training, participants will be able to:

- Use Ignite for in-memory, on-disk persistence as well as a purely distributed in-memory database.
- Achieve persistence without syncing data back to a relational database.
- Use Ignite to carry out SQL and distributed joins.
- Improve performance by moving data closer to the CPU, using RAM as a storage.
- Spread data sets across a cluster to achieve horizontal scalability.
- Integrate Ignite with RDBMS, NoSQL, Hadoop and machine learning processors.

Audience

- Developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
graphcomputingIntroduction to Graph Computing28 oreUn număr mare de probleme ale lumii reale pot fi descrise în termeni de grafice De exemplu, graficul Web, graficul rețelei sociale, graficul rețelei de tren și graficul de limbă Aceste grafice tind să fie extrem de mari; prelucrarea acestora necesită un set specializat de instrumente și procese, aceste instrumente și procese pot fi denumite Graph Computing (cunoscut și sub numele de Graph Analytics) În acest training instruit, participanții vor învăța despre ofertele de tehnologie și abordările de implementare pentru prelucrarea datelor grafice Scopul este de a identifica obiectele din lumea reală, de caracteristicile și relațiile lor, apoi de a modela aceste relații și de a le procesa ca date folosind o abordare grafică de calcul Începem cu o privire de ansamblu largă și se restrânge instrumentele specifice pe măsură ce trecem printr-o serie de studii de caz, exerciții de manevră și implementări live Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți modul în care datele grafice persistă și traversează Selectați cel mai bun cadru pentru o anumită sarcină (de la baze de date grafice la cadre de procesare în bloc) Implementați Hadoop, Spark, GraphX ​​și Pregel pentru a efectua calcul grafic în mai multe mașini în paralel Vizualizați problemele mari de date realworld din punct de vedere al graficelor, proceselor și traverselor Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
matlabpredanalyticsMatlab for Predictive Analytics21 oreAnaliza predictivă este procesul de utilizare a analizelor de date pentru a face predicții despre viitor Acest proces utilizează date împreună cu tehnicile de extragere a datelor, statistici și tehnici de învățare a mașinilor pentru a crea un model predictiv pentru prognoza evenimentelor viitoare În acest training instruit, participanții vor învăța cum să utilizeze Matlab pentru a construi modele predictive și pentru a le aplica seturilor mari de date pentru a prezice evenimentele viitoare pe baza datelor Până la sfârșitul acestui curs, participanții vor putea: Creați modele predictive pentru a analiza modelele din datele istorice și tranzacționale Utilizați modelarea predictivă pentru a identifica riscurile și oportunitățile Construiți modele matematice care captează tendințe importante Utilizați datele de la dispozitive și sisteme de afaceri pentru a reduce deșeurile, a economisi timp sau a reduce costurile Public Dezvoltatori Ingineri Experți în domeniu Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
nifidevApache NiFi for Developers7 oreApache NiFi (Hortonworks DataFlow) este o logistică integrată a datelor integrate în timp real și o platformă de procesare simplă a evenimentelor, care permite mișcarea, urmărirea și automatizarea datelor între sisteme Acesta este scris folosind programarea în flux și oferă o interfață de utilizator bazată pe web pentru a gestiona fluxurile de date în timp real În acest training instruit, participanții vor învăța fundamentele programării bazate pe flux, pe măsură ce dezvoltă o serie de extensii demo, componente și procesoare care utilizează Apache NiFi Până la sfârșitul acestui curs, participanții vor putea: Înțelege conceptele de arhitectură și fluxuri de date ale NiFi Dezvoltați extensii utilizând API-uri NiFi și API de la terți Custom dezvolta propriul procesor Apache Nifi Ingerați și procesați date în timp real din formate de fișiere și surse de date, disparate și mai puțin frecvente Public Dezvoltatori Ingineri de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
nifiApache NiFi for Administrators21 oreApache NiFi (Hortonworks DataFlow) este o logistică integrată a datelor integrate în timp real și o platformă de procesare simplă a evenimentelor, care permite mișcarea, urmărirea și automatizarea datelor între sisteme Acesta este scris folosind programarea în flux și oferă o interfață de utilizator bazată pe web pentru a gestiona fluxurile de date în timp real În acest training instruit, participanții vor învăța cum să implementeze și să gestioneze Apache NiFi într-un mediu de laborator live Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Apachi NiFi Sursă, transformă și gestionează datele din surse de date disparate, distribuite, inclusiv baze de date și lacuri de date mari Automatiza fluxurile de date Activați analizele de streaming Aplicați diverse abordări pentru ingerarea datelor Transformați datele mari și aflați-le în detaliu Public Administratorii de sistem Ingineri de date Dezvoltatori DevOps Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
solrcloudSolrCloud14 oreApache SolrCloud este un motor distribuit de procesare a datelor care facilitează căutarea și indexarea fișierelor într-o rețea distribuită În acest training instruit, participanții vor învăța cum să înființeze o instanță SolrCloud pe Amazon AWS Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți caracteristicile SolCloud și cum se compară cu cele ale clusterelor convenționale de master Configurați un cluster centralizat SolCloud Automatizați procesele, cum ar fi comunicarea cu fragmente, adăugarea de documente la cioburi, etc Utilizați Zookeeper împreună cu SolrCloud pentru a automatiza procesele Utilizați interfața pentru a gestiona raportarea erorilor Load balance (Balanță de încărcare) o instalare SolrCloud Configurați SolrCloud pentru procesare continuă și failover Public Dezvoltatori Solr Manageri de proiect Administratorii de sistem Analiști de căutare Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
datavaultData Vault: Building a Scalable Data Warehouse28 oreModelul de sablare a datelor este o tehnică de modelare a bazelor de date care asigură stocarea istorică pe termen lung a datelor care provin din mai multe surse Un seif de date stochează o singură versiune a faptelor sau "toate datele, tot timpul" Designul său flexibil, scalabil, consistent și adaptabil cuprinde cele mai bune aspecte ale formulei 3D (3NF) și al stelei În acest training instruit, participanții vor învăța cum să construiască un Seif de date Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți conceptele de arhitectură și design din spatele Data Vault 20 și interacțiunea cu Big Data, NoSQL și AI Utilizați tehnici de trecere a datelor pentru a permite auditarea, urmărirea și inspectarea datelor istorice dintr-un antrepozit de date Elaborați un proces ETL (extracție, transformare, încărcare) consecventă și repetabilă Construiți și desfășurați depozite foarte scalabile și repetabile Public Modelatori de date Specialist în domeniul depozitării datelor Specialiști în Business Intelligence Ingineri de date Administratorii de baze de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
datameerDatameer for Data Analysts14 oreDatameer este o platformă de business intelligence și de analiză construită pe Hadoop Permite enduserilor să acceseze, să exploreze și să coreleze datele de mari dimensiuni, structurate, semistructurate și nestructurate într-o manieră simplă În această instruire instruită, participanții vor învăța cum să folosească Datameer pentru a depăși curba de învățare abruptă a lui Hadoop, deoarece ei parcurg configurarea și analiza unei serii de mari surse de date Până la sfârșitul acestui curs, participanții vor putea: Creați, curățați și explorați interactiv un lac de date pentru întreprinderi Accesați depozite de date de business intelligence, baze de date tranzacționale și alte magazine analitice Utilizați o interfață de utilizator a foii de calcul pentru a proiecta conducte de procesare a datelor endtoend Accesați funcțiile pre-construite pentru a explora relații complexe de date Utilizați vrăjitoare draganddrop pentru a vizualiza date și a crea tablouri de bord Utilizați tabele, grafice, grafice și hărți pentru a analiza rezultatele interogării Public Analiști de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
tigonTigon: Real-time Streaming for the Real World14 oreTigon este o sursă open source, în timp real, lowlatency, highthroughput, YARN nativ, cadru de procesare a fluxului care se află pe partea de sus a HDFS și HBase pentru persistență Aplicațiile Tigon abordează cazuri de utilizare, cum ar fi detectarea și analiza intruziunilor în rețea, analiza pieței sociale media, analiza locației și recomandările utilizatorilor în timp real Această instruire live instrucționată introduce abordarea lui Tigon de a combina procesul de procesare în timp real și lot, pe măsură ce participanții merg prin crearea unei exemple de aplicații Până la sfârșitul acestui curs, participanții vor putea: Creați aplicații puternice de procesare a fluxului pentru a gestiona volume mari de date Procesați surse de flux, cum ar fi jurnalele Twitter și Webserver Utilizați Tigon pentru conectarea rapidă, filtrarea și agregarea fluxurilor Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
vespaVespa: Serving Large-Scale Data in Real-Time14 oreVespa un motor de prelucrare și servire a datelor de mare capacitate creat de Yahoo Acesta este folosit pentru a răspunde la întrebările utilizatorilor, pentru a face recomandări și pentru a oferi conținut personalizat și reclame în timp real Instruirea live instruitã introduce provocãrile de a servi date largi de date ºi plãteºte participanþii prin crearea unei aplicaþii care poate calcula rãspunsurile la cererile utilizatorilor, pe seturi mari de date în timp real Până la sfârșitul acestui curs, participanții vor putea: Utilizați Vespa pentru a calcula rapid datele (stocare, căutare, rang, organizare) la timpul de servire în timp ce un utilizator așteaptă Implementați Vespa în aplicații existente care implică căutarea, recomandările și personalizarea Integrați și desfășurați Vespa cu sistemele de date mari existente, cum ar fi Hadoop și Storm Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
bigdatabicriminalBig Data Business Intelligence for Criminal Intelligence Analysis35 oreAvansurile în tehnologii și creșterea cantității de informații transformă modul în care se realizează aplicarea legii Provocările date de Big Data sunt aproape la fel de deranjante ca promisiunea Big Data Stocarea eficientă a datelor este una dintre aceste provocări; analizând în mod eficient aceasta este o alta În acest training instruit, participanții vor învăța mentalitatea cu care să se apropie de tehnologiile Big Data, să evalueze impactul acestora asupra proceselor și politicilor existente și să implementeze aceste tehnologii în scopul identificării activității criminale și prevenirii criminalității Studiile de caz de la organismele de aplicare a legii din întreaga lume vor fi examinate pentru a obține o perspectivă asupra adoptării abordărilor, provocărilor și rezultatelor Până la sfârșitul acestui curs, participanții vor putea: Combinați tehnologia Big Data cu procesele tradiționale de colectare a datelor pentru a crea o poveste în timpul unei investigații Implementați soluții industriale de stocare și prelucrare a datelor pentru analiza datelor Pregătirea unei propuneri pentru adoptarea celor mai adecvate instrumente și procese pentru a permite o abordare cu caracter dat a investigației penale Public Specialiști în aplicarea legii cu un background tehnic Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
apexApache Apex: Processing Big Data-in-Motion21 oreApache Apex este o platformă YARNnative care unifică procesarea fluxului și loturilor Ea procesează dateinmotion mare într-un mod care este scalabil, performant, faulttolerant, stateful, sigur, distribuit și ușor de operat Această instruire live, instruită, introduce arhitectura unificată de procesare a fluxurilor Apache Apex și participanții merg prin crearea unei aplicații distribuite, folosind Apex pe Hadoop Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți conceptele conductei de prelucrare a datelor, cum ar fi conectori pentru surse și chiuvete, transformări comune de date etc Construiți, scalați și optimizați o aplicație Apex Procesați fluxurile de date în timp real și cu o latență minimă Utilizați Apex Core și biblioteca Apex Malhar pentru a permite dezvoltarea rapidă a aplicațiilor Utilizați API-ul Apex pentru a scrie și reutiliza codul Java existent Integrați Apex în alte aplicații ca motor de procesare Tuneți, testați și scalați aplicațiile Apex Public Dezvoltatori Întreprinderi arhitecți Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
alluxioAlluxio: Unifying Disparate Storage Systems7 oreAlexio este un sistem de stocare virtual distribuit care deschide un sistem unificat care unifică sisteme de stocare disparate și permite aplicațiilor să interacționeze cu datele la viteza de memorie Este utilizat de companii precum Intel, Baidu și Alibaba În acest training instruit, participanții vor învăța cum să folosească Alexio pentru a lega diferite cadre de calcul cu sistemele de stocare și pentru a gestiona în mod eficient datele de la scară multipeabyte pe măsură ce parcurg crearea unei aplicații cu Alluxio Până la sfârșitul acestui curs, participanții vor putea: Dezvoltați o aplicație cu Alluxio Conectați sistemele mari de date și aplicațiile în timp ce păstrați un spațiu de nume Efectiv extrage valoarea din datele mari în orice format de stocare Îmbunătățiți performanța încărcării de lucru Implementați și gestionați Alluxio independent sau clustered Public Cercetător de date Dezvoltator Administrator de sistem Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
flinkFlink for Scalable Stream and Batch Data Processing28 oreApache Flink este un framework open source pentru procesarea scalabilă a fluxurilor și a datelor lotului Această instruire live instrucționată introduce principiile și abordările din spatele procesării fluxului distribuit și al procesării datelor în lot și participanții merg prin crearea unei aplicații de streaming de date în timp real Până la sfârșitul acestui curs, participanții vor putea: Creați un mediu pentru dezvoltarea aplicațiilor de analiză a datelor Pachete, execută și monitorizează aplicații de streaming bazate pe Flink, faulttolerant, de date Gestionați diverse sarcini de lucru Efectuați analize avansate utilizând Flink ML Creați un cluster Flink multinod Măsurați și optimizați performanța Integrați Flink cu diferite sisteme de date mari Comparați capabilitățile Flink cu cele ale altor cadre mari de procesare a datelor Public Dezvoltatori Arhitecti Ingineri de date Profesioniștii din Analytics Directori tehnici Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
samzaSamza for Stream Processing14 oreApache Samza este o rețea opensource nearrealtime, un cadru de calcul asincron pentru procesarea fluxului Utilizează Apache Kafka pentru mesagerie și Apache Hadoop YARN pentru toleranța la erori, izolarea procesoarelor, securitatea și gestionarea resurselor Instruirea live instructorată introduce principiile din spatele sistemelor de mesagerie și de procesare distribuită a fluxurilor, în timp ce participanții la cursă se deplasează prin crearea unui proiect Samzabased și executarea unui loc de muncă Până la sfârșitul acestui curs, participanții vor putea: Utilizați Samza pentru a simplifica codul necesar pentru a produce și a consuma mesaje Decuplați manipularea mesajelor dintr-o aplicație Utilizați Samza pentru a implementa calculul asincron nearrealtime Utilizați procesarea fluxului pentru a oferi un nivel mai ridicat de abstractizare peste sistemele de mesagerie Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
zeppelinZeppelin for Interactive Data Analytics14 oreApache Zeppelin este un notebook webbased pentru captarea, explorarea, vizualizarea și partajarea datelor bazate pe Hadoop și Spark Această instruire live instrucționată introduce conceptele din spatele analizei interactive a datelor și participanții umblă prin implementarea și utilizarea Zeppelin într-un singur mediu sau într-un mediu cu mai mulți utilizatori Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Zeppelin Dezvoltați, organizați, executați și partajați date într-o interfață bazată pe browser Vizualizați rezultatele fără a se referi la linia de comandă sau detaliile clusterului Executați și colaborați pe fluxuri de lucru lungi Lucrați cu un număr de limbi plugin / backend de procesare a datelor, cum ar fi Scala (cu Apache Spark), Python (cu Apache Spark), Spark SQL, JDBC, Markdown și Shell Integrați Zeppelin cu Spark, Flink și Map Reduce Secure mai multe cazuri de utilizare a Zeppelin cu Apache Shiro Public Ingineri de date Analiști de date Cercetătorii de date Dezvoltatori de software Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
magellanMagellan: Geospatial Analytics on Spark14 oreMagellan este un motor de execuție distribuit pentru analize geospațiale pe date mari Implementat pe Apache Spark, acesta extinde Spark SQL și oferă o abstractizare relațională pentru analizele geospațiale Instruirea live instructorizată introduce conceptele și abordările pentru implementarea analizei geospațiale și participanții merg prin crearea unei aplicații de analiză predictivă folosind Magellan pe Spark Până la sfârșitul acestui curs, participanții vor putea: Efectuați interogări eficiente, analizați și introduceți seturi de date geospațiale la scară Implementați date geospațiale în aplicațiile de analiză de afaceri și de analiză predictivă Utilizați contextul spațial pentru a extinde capabilitățile dispozitivelor mobile, senzorilor, jurnalelor și dispozitivelor de uzură Public Dezvoltatori de aplicații Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
hdpHortonworks Data Platform (HDP) for Administrators21 orePlatforma de date Hortonworks este o platformă de suport Apache Hadoop care oferă o bază stabilă pentru dezvoltarea unor soluții de date de mare amploare privind ecosistemul Apache Hadoop Această instruire live instructoră lansează Hortonworks și umblă cu participanții prin implementarea soluției Spark + Hadoop Până la sfârșitul acestui curs, participanții vor putea: Utilizați Hortonworks pentru a rula fiabil Hadoop la scară largă Unificați capabilitățile de securitate, guvernanță și operațiuni ale lui Hadoop cu fluxurile de lucru agile analiști ale Spark Utilizați Hortonworks pentru a investiga, valida, certifica și susține fiecare componentă dintr-un proiect Spark Procesați diferite tipuri de date, inclusiv structurate, nestructurate, inmoționale și atrase Public Administratorii Hadoop Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
PentahoDIPentaho Data Integration Fundamentals21 orePentaho Data Integration este un instrument de integrare a datelor din surse opționale pentru definirea locurilor de muncă și a transformărilor de date În acest training instruit, participanții vor învăța cum să utilizeze capabilitățile puternice ETL ale Pentaho Data Integration și GUI-ul bogat pentru a gestiona întregul ciclu de viață mare, maximizând valoarea organizațiilor Până la sfârșitul acestui curs, participanții vor putea: Creați, previzualizați și executați transformări de date de bază care conțin pași și hamei Configurați și securizați Pentaho Enterprise Repository Utilizați sursele disparate de date și generați o singură versiune unică a adevărului într-un format analitic Oferiți rezultate aplicațiilor din partea terților pentru prelucrare ulterioară Public Analist de date Dezvoltatori ETL Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
BDATRBig Data Analytics for Telecom Regulators16 orePentru a respecta conformitatea autorităților de reglementare, CSP-urile (furnizorii de servicii de comunicații) pot accesa Big Analiza datelor, care nu numai că îi ajută să respecte conformitatea, dar și în ce privește domeniul de aplicare pot crește satisfacția clienților și, prin urmare, pot reduce șocul De fapt, din moment conformitatea este legată de calitatea serviciului legat de un contract, de orice inițiativă în vederea îndeplinirii va îmbunătăți "avantajul competitiv" al CSP-urilor Prin urmare, este important ca Autoritățile de reglementare ar trebui să poată consilia / îndruma un set de practici analitice Big Data pentru CSP-uri care vor să fie de avantaj reciproc între autoritățile de reglementare și CSP 2 zile de curs: 8 module, 2 ore fiecare = 16 ore .
sparkpythonPython and Spark for Big Data (PySpark)21 orePython este un limbaj de programare de nivel înalt renumit pentru sintaxa clară și citirea codului Spark este un motor de procesare a datelor utilizat în interogarea, analizarea și transformarea datelor de mare amploare PySpark permite utilizatorilor să intercaleze Spark cu Python În această instruire instruită, participanții vor învăța cum să utilizeze împreună Python și Spark pentru a analiza datele mari pe măsură ce lucrează la exerciții de manevră Până la sfârșitul acestui curs, participanții vor putea: Aflați cum să utilizați Spark cu Python pentru a analiza datele mari Lucrați pe exerciții care imită circumstanțele lumii reale Folosiți diferite instrumente și tehnici pentru analiza datelor cu ajutorul PySpark Public Dezvoltatori Profesioniști IT Cercetătorii de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
kylinApache Kylin: From Classic OLAP to Real-Time Data Warehouse14 oreApache Kylin este un motor de analiză extrem de distribuit pentru date mari În acest training live instructor, participanții vor învăța cum să folosească Apache Kylin pentru a configura un depozit de date în timp real Până la sfârșitul acestui curs, participanții vor putea: Consumați date streaming în timp real folosind Kylin Utilizați caracteristicile puternice ale Apache Kylin, inclusiv suport pentru schema de zăpadă, o interfață SQL bogată, cubare cu scânteie și latență de interogare secundară Notă Folosim ultima versiune de Kylin (din această scriere, Apache Kylin v20) Public Ingineri de date mari Analiștii Big Data Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
foundrFoundation R7 oreObiectivul cursului este acela de a permite participanților să dobândească o stăpânire a fundamentelor R și cum să lucreze cu datele .
sparkcloudApache Spark in the Cloud21 oreApache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
bigdataanahealthBig Data Analytics in Health21 oreAnalizele de date mari implică procesul de examinare a unor cantități mari de seturi de date variate pentru a descoperi corelațiile, modelele ascunse și alte informații utile Industria de sănătate are cantități masive de date medicale și clinice eterogene complexe Aplicarea unor analize de date de mare amploare privind datele de sănătate prezintă un potențial uriaș în obținerea de informații despre îmbunătățirea furnizării asistenței medicale Cu toate acestea, enormitatea acestor seturi de date prezintă mari provocări în analizele și aplicațiile practice într-un mediu clinic În acest training instruit (la distanță), participanții vor învăța cum să efectueze analize de date mari în domeniul sănătății, pe măsură ce parcurg o serie de exerciții livelab livelab Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați instrumente de analiză a datelor, cum ar fi Hadoop MapReduce și Spark Înțelegerea caracteristicilor datelor medicale Aplicați tehnici de date mari pentru a trata datele medicale Studiați sisteme și algoritmi de date mari în contextul aplicațiilor de sănătate Public Dezvoltatori Cercetătorii de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră Notă Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja .
sqoopMoving Data from MySQL to Hadoop with Sqoop14 oreSqoop este un instrument software open source pentru transferul de date intre Hadoop si baze de date relationale sau mainframe Acesta poate fi folosit pentru a importa date din sistemul de gestionare a bazelor de date relaționale (RDBMS), cum ar fi MySQL sau Oracle sau un mainframe, în sistemul de distribuire a fișierelor Hadoop (HDFS) Ulterior, datele pot fi transformate în Hadoop MapReduce și apoi reexportate înapoi într-o RDBMS În acest training instruit, participanții vor învăța cum să utilizeze Sqoop pentru a importa date dintr-o bază de date relațională tradițională în Hadoop de stocare, cum ar fi HDFS sau Hive și invers Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Sqoop Importați date din MySQL în HDFS și stup Importați date din HDFS și Hive în MySQL Public Administratorii de sistem Ingineri de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră Notă Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja .
beamUnified Batch and Stream Processing with Apache Beam14 oreApache Beam este un model de programare unificat, deschis, pentru definirea și executarea conductelor de procesare paralelă Puterea constă în capacitatea sa de a rula conducte atât în ​​lot, cât și în flux, executarea fiind executată de către unul dintre Beads pentru procesarea distribuită: Apache Apex, Apache Flink, Apache Spark și Google Cloud Dataflow Apache Beam este util pentru sarcini ETL (extragere, transformare și încărcare), cum ar fi mutarea datelor între diferite medii de stocare și surse de date, transformarea datelor într-un format mai de dorit și încărcarea datelor pe un nou sistem În cadrul acestei instruiri live (la fața locului sau la distanță), participanții vor învăța cum să implementeze SDK-urile Apache Beam într-o aplicație Java sau Python care definește o conductă de procesare a datelor pentru a descompune un set mare de date în bucăți mai mici pentru procesare paralelă independentă Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Apache Beam Utilizați un singur model de programare pentru a efectua atât procesarea lotului, cât și a fluxului de date cu ajutorul aplicației lor Java sau Python Executați conductele în mai multe medii Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră Notă Acest curs va fi disponibil Scala în viitor Vă rugăm să ne contactați pentru a aranja .
pentahoPentaho Open Source BI Suite Community Edition (CE)28 orePentaho Open Source BI Suite Community Edition (CE) este un pachet de business intelligence care oferă integrare de date, raportare, tablouri de bord și capacități de încărcare În acest training instruit, participanții vor învăța cum să maximizeze caracteristicile Pentaho Open Source BI Suite Community Edition (CE) Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Pentaho Open Source BI Suite Community Edition (CE) Înțelegeți fundamentele instrumentelor Pentaho CE și caracteristicile acestora Creați rapoarte utilizând Pentaho CE Integrați datele terțelor părți în Pentaho CE Lucrați cu date și analize mari în Pentaho CE Public Programatorii Dezvoltatorii BI Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră Notă Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja .
amazonredshiftAmazon Redshift21 oreAmazon Redshift este un serviciu de stocare de date pe bază de date pe bază de date pe bază de date pe bază de cloud în AWS În acest training instruit, participanții vor învăța fundamentele Amazon Redshift Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Redshift Amazon Încărcați, configurați, implementați, interogați și vizualizați date cu Amazon Redshift Public Dezvoltatori Profesioniști IT Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră Notă Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja .

Upcoming Courses

CursData cursuluiPretul cursului [Tele - Clasa]
Big Data Architect - Iasi, Piata UniriiLun, 2018-12-31 09:307500EUR / 8700EUR
Big Data Architect - Constanta, Str. Mircea cel BatranLun, 2018-12-31 09:307500EUR / 8700EUR
Big Data Architect - Timisoara, Boulevard Iosif BulbucaLun, 2018-12-31 09:307500EUR / 8700EUR
Big Data Architect - Bucuresti, Centru NordLun, 2019-02-11 09:307500EUR / 8700EUR
Big Data Architect - Cluj-Napoca, Strada PiteștiLun, 2019-02-11 09:307500EUR / 8700EUR
Sfarsit de saptamana Big Data Cursuri, Seara Big Data Training, Big Data Camp, Big Data Cu instructor, Sfarsit de saptamana Big Data Training, Seara Big Data Cursuri, Big Data Coaching, Big Data Instructor, Big Data Trainer, Big Data Cursuri, Big Data Clase, Big Data Pe pagina, Big Data curs privat, Big Data one on one training

Discounts pentru curs

CursLoculData cursuluiPretul cursului [Tele - Clasa]
IoT ( Internet of Things) for Entrepreneurs, Managers and InvestorsBucuresti, Centru NordMar, 2019-02-05 09:30N/A / 5525EUR
Data analysis with TableauConstanta, Str. Mircea cel BatranMar, 2019-02-19 09:303150EUR / 3750EUR
Algebra for Machine LearningConstanta, Str. Mircea cel BatranJoi, 2019-04-11 09:303150EUR / 3750EUR
Signavio Process ManagerIasi, Piata UniriiMar, 2019-04-30 09:301575EUR / 1975EUR
Neural computing – Data scienceIasi, Piata UniriiMar, 2019-05-28 09:303500EUR / 4100EUR

Newsletter Oferte Cursuri

Respectăm confidențialitatea adresei Dvs de email. Nu vom transmite sau vinde adresa altor părți. Puteți să schimbați preferințele sau să v-ă dezabonați complet oricand.

Unii din clientii nostri

is growing fast!

We are looking to expand our presence in Romania!

As a Business Development Manager you will:

  • expand business in Romania
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!