Cursuri Big Data

Cursuri Big Data

Cursurile de instruire a cursanților locali, instruiți de instructori, încep cu o introducere la conceptele elementare ale Big Data, apoi progresul în limbile de programare și metodologiile utilizate pentru a efectua analiza datelor. Instrumentele și infrastructura pentru a permite stocarea datelor mari, procesarea distribuită și scalabilitatea sunt discutate, comparate și implementate în sesiuni de practică demo. Ansamblul de formare a datelor este disponibil ca "formare live la fața locului" sau "formare live la distanță". Training-ul live la fața locului poate fi efectuat la fața locului la sediul clientului România sau în centrele de formare corporativa NobleProg din România România . Instruirea live la distanță este realizată printr-un desktop interactiv, la distanță. NobleProg - Furnizorul dvs. de formare locală

Machine Translated

Mărturii

★★★★★
★★★★★

Schita de curs

Title
Durata
Sinoptic
Title
Durata
Sinoptic
14 hours
Sinoptic
Go al:

Învățați să lucrați cu SPSS la nivelul independenței

Destinatarii:

Analiști, cercetători, oameni de știință, studenți și toți cei care doresc să dobândească capacitatea de a utiliza pachetul SPSS și de a învăța tehnici populare de exploatare a datelor.
7 hours
Sinoptic
Apache NiFi (Hortonworks DataFlow) este o platformă de logistică integrată în timp real a datelor și o simplă platformă de procesare a evenimentelor care permite mutarea, urmărirea și automatizarea datelor între sisteme. Este scris folosind o programare bazată pe fluxuri și oferă o interfață de utilizator bazată pe web pentru a gestiona fluxurile de date în timp real.

În cadrul acestui training, instruit în direct, participanții vor învăța fundamentele programării bazate pe fluxuri, deoarece dezvoltă o serie de extensii demo, componente și procesoare care folosesc Apache NiFi .

Până la sfârșitul acestui antrenament, participanții vor putea:

- Înțelegeți arhitectura NiFi și conceptele fluxului de date.
- Dezvoltați extensii folosind API-uri NiFi și terțe părți.
- Personalizate dezvoltă propriul procesor Apache Nifi.
- Ingerați și prelucrați datele în timp real din formate de fișiere și surse de date diferite și neobișnuite.

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
21 hours
Sinoptic
Apache Drill este un motor de interogare SQL în coloane schemafree, distribuit, inmemory pentru Hadoop, NoSQL și alte sisteme de stocare a informațiilor din cloud și fișiere Puterea aplicației Apache Drill constă în capacitatea sa de a se alătura datelor din mai multe magazine de date folosind o singură interogare Apache Drill suportă numeroase baze de date NoSQL și sisteme de fișiere, inclusiv HBase, MongoDB, MapRDB, HDFS, MapRFS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS și fișierele locale Apache Drill este versiunea open source a sistemului Google Dremel, disponibil ca serviciu de infrastructură numit Google BigQuery În această instruire instruită, participanții vor învăța bazele Apache Drill, apoi vor folosi puterea și comoditatea SQL pentru a interoga interactiv datele mari din mai multe surse de date, fără a scrie cod Participanții vor învăța, de asemenea, cum să optimizeze interogările Drill pentru execuția SQL distribuită Până la sfârșitul acestui curs, participanții vor putea: Efectuați explorări "auto-servicii" pe date structurate și semistructurate despre Hadoop Interogare cunoscute, precum și date necunoscute, folosind interogări SQL Înțelegeți modul în care Apache Drills primește și execută interogări Scrieți interogări SQL pentru a analiza diferite tipuri de date, inclusiv date structurate în Hive, date semistructurate în tabelele HBase sau MapRDB și date salvate în fișiere precum Parquet și JSON Utilizați Apache Drill pentru a efectua descoperirea schemei onthefly, ocolind nevoia de operații complexe ETL și schema Integrați aplicația Apache Drill cu BI (Business Intelligence), cum ar fi Tableau, Qlikview, MicroStrategy și Excel Public Analiști de date Cercetătorii de date Programatori SQL Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
28 hours
Sinoptic
MonetDB este o bază de date open source care a pionierat abordarea tehnologiei storalelor În acest training instruit, participanții vor învăța cum să folosească MonetDB și cum să obțină cea mai mare valoare din acesta Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți MonetDB și caracteristicile acestuia Instalați și începeți cu MonetDB Explorați și efectuați diferite funcții și sarcini în MonetDB Accelerați livrarea proiectului prin maximizarea capacităților MonetDB Public Dezvoltatori Experți tehnici Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
28 hours
Sinoptic
Mem SQL este un sistem de gestionare a bazelor de date SQL distribuit în memorie, pentru cloud și local. Este un depozit de date în timp real, care oferă informații despre date live și istorice.

În acest training, instruit în direct, instruit, participanții vor învăța esențialele Mem SQL pentru dezvoltare și administrare.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Înțelegeți conceptele și caracteristicile cheie ale Mem SQL
- Instalează, proiectează, întreține și operează Mem SQL
- Optimizați schemele în Mem SQL
- Îmbunătățiți interogările în Mem SQL
- Performanța de referință în Mem SQL
- Creați aplicații de date în timp real folosind Mem SQL

Public

- Dezvoltatori
- Administratorii
- Ingineri de funcționare

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice
28 hours
Sinoptic
Hadoop este un cadru popular de prelucrare a datelor Python este un limbaj de programare de nivel înalt renumit pentru sintaxa clară și citirea codului În acest training instruit, participanții vor învăța cum să lucreze cu Hadoop, MapReduce, Pig și Spark utilizând Python, deoarece parcurg exemple și cazuri multiple Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți conceptele de bază din spatele lui Hadoop, MapReduce, Pig și Spark Utilizați Python cu Hadoop Distributed File System (HDFS), MapReduce, Porc și Spark Utilizați Snakebite pentru a accesa în mod programatic HDFS în Python Utilizați mrjob pentru a scrie sarcini MapReduce în Python Scrie programele Spark cu Python Extindeți funcționalitatea porcului utilizând UDF-urile Python Gestionați lucrările MapReduce și scripturile Pig folosind Luigi Public Dezvoltatori Profesioniști IT Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Python este un limbaj de programare la nivel înalt, renumit pentru sintaxa și lizibilitatea codurilor sale. Spark este un motor de procesare a datelor utilizat în interogare, analiză și transformare de date mari. PySpark permite utilizatorilor să interfețe Spark cu Python .

În cadrul acestui antrenament, instruit în direct, participanții vor învăța cum să folosească împreună Python și Spark pentru a analiza datele mari pe măsură ce lucrează la exerciții practice.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Aflați cum să utilizați Spark cu Python pentru a analiza Big Data .
- Lucrați la exerciții care imită circumstanțele din lumea reală.
- Utilizați diferite instrumente și tehnici pentru analiza datelor mari utilizând PySpark .

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice
35 hours
Sinoptic
Avansurile în tehnologii și creșterea cantității de informații transformă modul în care se realizează aplicarea legii Provocările date de Big Data sunt aproape la fel de deranjante ca promisiunea Big Data Stocarea eficientă a datelor este una dintre aceste provocări; analizând în mod eficient aceasta este o alta În acest training instruit, participanții vor învăța mentalitatea cu care să se apropie de tehnologiile Big Data, să evalueze impactul acestora asupra proceselor și politicilor existente și să implementeze aceste tehnologii în scopul identificării activității criminale și prevenirii criminalității Studiile de caz de la organismele de aplicare a legii din întreaga lume vor fi examinate pentru a obține o perspectivă asupra adoptării abordărilor, provocărilor și rezultatelor Până la sfârșitul acestui curs, participanții vor putea: Combinați tehnologia Big Data cu procesele tradiționale de colectare a datelor pentru a crea o poveste în timpul unei investigații Implementați soluții industriale de stocare și prelucrare a datelor pentru analiza datelor Pregătirea unei propuneri pentru adoptarea celor mai adecvate instrumente și procese pentru a permite o abordare cu caracter dat a investigației penale Public Specialiști în aplicarea legii cu un background tehnic Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
14 hours
Sinoptic
Pentru a respecta conformitatea reglementatorilor, CSP-urile (furnizorii de servicii de Communication ) pot apela la Big Data Analytics, care nu numai că îi ajută să îndeplinească conformitatea, dar, în cadrul aceluiași proiect, pot crește satisfacția clienților și astfel pot reduce puterea. De fapt, întrucât conformitatea este legată de Calitatea serviciului legată de un contract, orice inițiativă în vederea respectării conformității va îmbunătăți „avantajul competitiv” al CSP-urilor. Prin urmare, este important ca autoritățile de reglementare să fie în măsură să consilieze / să ghideze un set de practici analitice Big Data pentru CSP-uri care vor avea un beneficiu reciproc între autoritățile de reglementare și CSP-uri.

Cursul este format din 8 module (4 în ziua 1 și 4 în ziua 2)
28 hours
Sinoptic
Un număr mare de probleme ale lumii reale pot fi descrise în termeni de grafice De exemplu, graficul Web, graficul rețelei sociale, graficul rețelei de tren și graficul de limbă Aceste grafice tind să fie extrem de mari; prelucrarea acestora necesită un set specializat de instrumente și procese, aceste instrumente și procese pot fi denumite Graph Computing (cunoscut și sub numele de Graph Analytics) În acest training instruit, participanții vor învăța despre ofertele de tehnologie și abordările de implementare pentru prelucrarea datelor grafice Scopul este de a identifica obiectele din lumea reală, de caracteristicile și relațiile lor, apoi de a modela aceste relații și de a le procesa ca date folosind o abordare grafică de calcul Începem cu o privire de ansamblu largă și se restrânge instrumentele specifice pe măsură ce trecem printr-o serie de studii de caz, exerciții de manevră și implementări live Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți modul în care datele grafice persistă și traversează Selectați cel mai bun cadru pentru o anumită sarcină (de la baze de date grafice la cadre de procesare în bloc) Implementați Hadoop, Spark, GraphX ​​și Pregel pentru a efectua calcul grafic în mai multe mașini în paralel Vizualizați problemele mari de date realworld din punct de vedere al graficelor, proceselor și traverselor Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Analiza predictivă este procesul de utilizare a analizelor de date pentru a face predicții despre viitor Acest proces utilizează date împreună cu tehnicile de extragere a datelor, statistici și tehnici de învățare a mașinilor pentru a crea un model predictiv pentru prognoza evenimentelor viitoare În acest training instruit, participanții vor învăța cum să utilizeze Matlab pentru a construi modele predictive și pentru a le aplica seturilor mari de date pentru a prezice evenimentele viitoare pe baza datelor Până la sfârșitul acestui curs, participanții vor putea: Creați modele predictive pentru a analiza modelele din datele istorice și tranzacționale Utilizați modelarea predictivă pentru a identifica riscurile și oportunitățile Construiți modele matematice care captează tendințe importante Utilizați datele de la dispozitive și sisteme de afaceri pentru a reduce deșeurile, a economisi timp sau a reduce costurile Public Dezvoltatori Ingineri Experți în domeniu Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Apache NiFi (Hortonworks DataFlow) este o platformă de logistică integrată în timp real a datelor și o simplă platformă de procesare a evenimentelor care permite mutarea, urmărirea și automatizarea datelor între sisteme. Este scris folosind o programare bazată pe fluxuri și oferă o interfață de utilizator bazată pe web pentru a gestiona fluxurile de date în timp real.

În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să se implementeze și să gestioneze Apache NiFi într-un mediu de laborator live.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați Apachi NiFi.
- Sursa, transformarea și gestionarea datelor din surse de date disparate, distribuite, inclusiv baze de date și lacuri de date mari.
- Automatizarea fluxurilor de date.
- Activați analizele de streaming.
- Aplicați diverse abordări pentru ingestia de date.
- Transformați Big Data și în perspective de afaceri.

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
7 hours
Sinoptic
În cadrul acestui training, instruit în direct, participanții vor învăța conceptele de bază din spatele Arhitecturii Stream MapR pe măsură ce dezvoltă o aplicație de streaming în timp real.

Până la sfârșitul acestei formări, participanții vor putea construi aplicații pentru producători și consumatori pentru procesarea datelor în flux în timp real.

Public

- Dezvoltatori
- Administratorii

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice

Notă

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
14 hours
Sinoptic
Apache SolrCloud este un motor distribuit de procesare a datelor care facilitează căutarea și indexarea fișierelor într-o rețea distribuită În acest training instruit, participanții vor învăța cum să înființeze o instanță SolrCloud pe Amazon AWS Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți caracteristicile SolCloud și cum se compară cu cele ale clusterelor convenționale de master Configurați un cluster centralizat SolCloud Automatizați procesele, cum ar fi comunicarea cu fragmente, adăugarea de documente la cioburi, etc Utilizați Zookeeper împreună cu SolrCloud pentru a automatiza procesele Utilizați interfața pentru a gestiona raportarea erorilor Load balance (Balanță de încărcare) o instalare SolrCloud Configurați SolrCloud pentru procesare continuă și failover Public Dezvoltatori Solr Manageri de proiect Administratorii de sistem Analiști de căutare Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
28 hours
Sinoptic
Modelul de sablare a datelor este o tehnică de modelare a bazelor de date care asigură stocarea istorică pe termen lung a datelor care provin din mai multe surse Un seif de date stochează o singură versiune a faptelor sau "toate datele, tot timpul" Designul său flexibil, scalabil, consistent și adaptabil cuprinde cele mai bune aspecte ale formulei 3D (3NF) și al stelei În acest training instruit, participanții vor învăța cum să construiască un Seif de date Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți conceptele de arhitectură și design din spatele Data Vault 20 și interacțiunea cu Big Data, NoSQL și AI Utilizați tehnici de trecere a datelor pentru a permite auditarea, urmărirea și inspectarea datelor istorice dintr-un antrepozit de date Elaborați un proces ETL (extracție, transformare, încărcare) consecventă și repetabilă Construiți și desfășurați depozite foarte scalabile și repetabile Public Modelatori de date Specialist în domeniul depozitării datelor Specialiști în Business Intelligence Ingineri de date Administratorii de baze de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
14 hours
Sinoptic
Datameer este o platformă de business intelligence și de analiză construită pe Hadoop Permite enduserilor să acceseze, să exploreze și să coreleze datele de mari dimensiuni, structurate, semistructurate și nestructurate într-o manieră simplă În această instruire instruită, participanții vor învăța cum să folosească Datameer pentru a depăși curba de învățare abruptă a lui Hadoop, deoarece ei parcurg configurarea și analiza unei serii de mari surse de date Până la sfârșitul acestui curs, participanții vor putea: Creați, curățați și explorați interactiv un lac de date pentru întreprinderi Accesați depozite de date de business intelligence, baze de date tranzacționale și alte magazine analitice Utilizați o interfață de utilizator a foii de calcul pentru a proiecta conducte de procesare a datelor endtoend Accesați funcțiile pre-construite pentru a explora relații complexe de date Utilizați vrăjitoare draganddrop pentru a vizualiza date și a crea tablouri de bord Utilizați tabele, grafice, grafice și hărți pentru a analiza rezultatele interogării Public Analiști de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
14 hours
Sinoptic
Tigon este o sursă open source, în timp real, lowlatency, highthroughput, YARN nativ, cadru de procesare a fluxului care se află pe partea de sus a HDFS și HBase pentru persistență Aplicațiile Tigon abordează cazuri de utilizare, cum ar fi detectarea și analiza intruziunilor în rețea, analiza pieței sociale media, analiza locației și recomandările utilizatorilor în timp real Această instruire live instrucționată introduce abordarea lui Tigon de a combina procesul de procesare în timp real și lot, pe măsură ce participanții merg prin crearea unei exemple de aplicații Până la sfârșitul acestui curs, participanții vor putea: Creați aplicații puternice de procesare a fluxului pentru a gestiona volume mari de date Procesați surse de flux, cum ar fi jurnalele Twitter și Webserver Utilizați Tigon pentru conectarea rapidă, filtrarea și agregarea fluxurilor Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
14 hours
Sinoptic
Apache Ignite este o platformă de calcul în memorie care se află între stratul de aplicație și de date pentru a îmbunătăți viteza, scala și disponibilitatea.

În cadrul acestui antrenament, instruit în direct, participanții vor învăța principiile din spatele stocării persistente și pure în memorie în timp ce pășesc prin crearea unui proiect de calcul de memorie în memorie.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Utilizați Ignite pentru persistență pe memorie, pe disc, precum și o bază de date în memorie pur distribuită.
- Obțineți persistență fără a sincroniza datele înapoi la o bază de date relațională.
- Utilizați Ignite pentru a efectua uniri SQL și distribuite.
- Îmbunătățirea performanței prin apropierea de date de procesor, utilizând memoria RAM ca stocare.
- Difuzați seturi de date într-un cluster pentru a obține scalabilitatea orizontală.
- Integrați aprinderea cu RDBMS, Fără procesoare SQL , Hadoop și mașină.

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
14 hours
Sinoptic
Vespa un motor de prelucrare și servire a datelor de mare capacitate creat de Yahoo Acesta este folosit pentru a răspunde la întrebările utilizatorilor, pentru a face recomandări și pentru a oferi conținut personalizat și reclame în timp real Instruirea live instruitã introduce provocãrile de a servi date largi de date ºi plãteºte participanþii prin crearea unei aplicaþii care poate calcula rãspunsurile la cererile utilizatorilor, pe seturi mari de date în timp real Până la sfârșitul acestui curs, participanții vor putea: Utilizați Vespa pentru a calcula rapid datele (stocare, căutare, rang, organizare) la timpul de servire în timp ce un utilizator așteaptă Implementați Vespa în aplicații existente care implică căutarea, recomandările și personalizarea Integrați și desfășurați Vespa cu sistemele de date mari existente, cum ar fi Hadoop și Storm Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Apache Apex este o platformă nativă YARN care unifică procesarea fluxurilor și loturilor. Procesează date mari în mișcare într-un mod care poate fi scalabil, performant, tolerant la erori, statistic, sigur, distribuit și ușor operabil.

Această instruire în direct, dirijată de instructor, introduce arhitectura de procesare a fluxurilor unificate de Apache Apex și parcurge participanții prin crearea unei aplicații distribuite folosind Apex pe Hadoop .

Până la sfârșitul acestui antrenament, participanții vor putea:

- Înțelegeți conceptele conductelor de procesare a datelor, cum ar fi conectori pentru surse și chiuvete, transformări comune de date etc.
- Construiți, scalați și optimizați o aplicație Apex
- Procesați fluxuri de date în timp real în mod fiabil și cu latență minimă
- Utilizați Apex Core și biblioteca Apex Malhar pentru a permite dezvoltarea rapidă a aplicației
- Utilizați API-ul Apex pentru a scrie și reutiliza codul Java existent
- Integrați Apex în alte aplicații ca motor de procesare
- Reglarea, testarea și scalarea aplicațiilor Apex

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
7 hours
Sinoptic
Alexio este un sistem de stocare virtual distribuit care deschide un sistem unificat care unifică sisteme de stocare disparate și permite aplicațiilor să interacționeze cu datele la viteza de memorie Este utilizat de companii precum Intel, Baidu și Alibaba În acest training instruit, participanții vor învăța cum să folosească Alexio pentru a lega diferite cadre de calcul cu sistemele de stocare și pentru a gestiona în mod eficient datele de la scară multipeabyte pe măsură ce parcurg crearea unei aplicații cu Alluxio Până la sfârșitul acestui curs, participanții vor putea: Dezvoltați o aplicație cu Alluxio Conectați sistemele mari de date și aplicațiile în timp ce păstrați un spațiu de nume Efectiv extrage valoarea din datele mari în orice format de stocare Îmbunătățiți performanța încărcării de lucru Implementați și gestionați Alluxio independent sau clustered Public Cercetător de date Dezvoltator Administrator de sistem Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
28 hours
Sinoptic
Apache flink este un cadru open-source pentru flux scalabil și procesarea datelor batch.

acest instructor-condus, în direct de formare introduce principiile și abordări în spatele distribuite flux și lot de prelucrare a datelor, și plimbări participanți prin crearea unei în timp real, de date de streaming de aplicare în Apache flink.

până la sfârșitul acestei instruiri, participanții vor putea:

- configurați un mediu pentru dezvoltarea aplicațiilor de analiză a datelor.
- Package, executa, și monitoriza bazate pe flink, toleranța la erori, date de streaming aplicații.
- Gestionați diverse sarcini de lucru.
- efectuați analize avansate folosind flink ML.
- configurați un cluster flink multi-nod.
- measure și a optimiza performance.
- integrați flink cu diferite sisteme Big data.
- Comparați capacitățile flink cu cele ale altor cadre mari de procesare a datelor.

format al cursului

- part prelegere, parte de discuții, exerciții și grele hands-on practică
14 hours
Sinoptic
AI este o colecție de tehnologii pentru a construi sisteme inteligente capabile să înțeleagă datele și activitățile din jurul datelor pentru a lua "decizii inteligente" Pentru furnizorii de servicii de telecomunicații, construirea de aplicații și servicii care utilizează AI ar putea deschide ușa pentru operațiuni îmbunătățite și service în domenii precum întreținerea și optimizarea rețelei În acest curs vom examina diferitele tehnologii care alcătuiesc AI și seturile de competențe necesare pentru a le folosi De-a lungul cursului, analizăm aplicațiile specifice ale AI în cadrul industriei de telecomunicații Public Inginerii de rețea Personalul de operațiuni de rețea Directori tehnici de telecomunicații Formatul cursului Prelegere parte, discuție parțială, exerciții manuale .
7 hours
Sinoptic
Apache Drill este un motor de interogare SQL în coloane schemafree, distribuit, inmemory pentru Hadoop, NoSQL și alte sisteme de stocare a informațiilor din cloud și fișiere Puterea aplicației Apache Drill constă în capacitatea sa de a se alătura datelor din mai multe magazine de date folosind o singură interogare Apache Drill suportă numeroase baze de date NoSQL și sisteme de fișiere, inclusiv HBase, MongoDB, MapRDB, HDFS, MapRFS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS și fișierele locale Apache Drill este versiunea open source a sistemului Google Dremel, disponibil ca serviciu de infrastructură numit Google BigQuery În această instruire live, participanții vor învăța cum să optimizeze și să depaneze Apache Drill pentru a îmbunătăți performanța interogărilor pe seturi de date foarte mari Cursul începe cu o imagine de ansamblu arhitecturală și o comparare a caracteristicilor dintre Apache Drill și alte instrumente interactive de analiză a datelor Participanții apoi parcurg o serie de sesiuni interactive practice, care includ instalarea, configurarea, evaluarea performanței, optimizarea interogărilor, partiționarea datelor și depanarea unei instanțe Apache Drill într-un mediu de laborator live Până la sfârșitul acestui curs, participanții vor putea: Instalați și configurați Apache Drill Înțelegeți arhitectura și caracteristicile Apache Drill Înțelegeți modul în care Apache Drills primește și execută interogări Optimizați interogările Drill pentru execuția SQL distribuită Debug Apache Drill Public Dezvoltatori Administratori de sisteme Analiști de date Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră notițe Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja .
14 hours
Sinoptic
Apache Zeppelin este un caiet bazat pe web pentru captarea, explorarea, vizualizarea și partajarea datelor bazate pe Hadoop și Spark.

Acest instruire live, condus de instructor, introduce conceptele din spatele analizelor interactive de date și parcurge participanții prin implementarea și utilizarea Zeppelin într-un mediu cu un singur utilizator sau multi-utilizator.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați Zeppelin
- Dezvoltați, organizați, executați și partajați datele într-o interfață bazată pe browser
- Vizualizați rezultatele fără a vă referi la linia de comandă sau la detaliile clusterului
- Executați și colaborați pe fluxuri lungi de lucru
- Lucrați cu oricare dintre un număr de plug-in-uri / prelucrări de date-backend-uri, precum Scala (cu Apache Spark ), Python (cu Apache Spark ), Spark SQL , JDBC, Markdown și Shell.
- Integrați Zeppelin cu Spark, Flink și Reduceți Harta
- Securizați instanțe cu mai mulți utilizatori de Zeppelin cu Apache Shiro

Public

- Ingineri de date
- Analiști de date
- Cercetătorii de date
- Dezvoltatori de software

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice
14 hours
Sinoptic
Apache Arrow este un cadru de procesare a datelor în memorie open-source. Este adesea utilizat împreună cu alte instrumente de știință a datelor pentru accesarea depozitelor de date diferite pentru analiză. Se integrează bine cu alte tehnologii precum baze de date GPU , biblioteci și instrumente de învățare automată, motoare de execuție și cadre de vizualizare a datelor.

În acest training instruit în direct, instruit în direct, participanții vor învăța cum să integreze Apache Arrow cu diverse cadre de Data Science pentru a accesa date din surse de date disparate.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați Apache Arrow într-un mediu distribuit grupat
- Utilizați Apache Arrow pentru a accesa date din surse de date diferite
- Utilizați Apache Arrow pentru a evita necesitatea construirii și menținerii conductelor ETL complexe
- Analizați datele pe surse de date diferite, fără a fi necesar să le consolidați într-un depozit centralizat

Public

- Cercetătorii de date
- Ingineri de date

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice

Notă

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
7 hours
Sinoptic
This instructor-led, live training (onsite or remote) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 hours
Sinoptic
Teradata is a popular Relational Database Management System for building large scale data warehousing applications. Teradata achieves this by way of parallelism.

This instructor-led, live training (onsite or remote) is aimed at application developers and engineers who wish to master more sophisticated usages of the Teradata database.

By the end of this training, participants will be able to:

- Manage Teradata space.
- Protect and distribute data in Teradata.
- Read Explain Plan.
- Improve SQL proficiency.
- Use main utilities of Teradata.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 hours
Sinoptic
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 hours
Sinoptic
Pivotal Greenplum is a Massively Parallel Processing (MPP) Data Warehouse platform based on PostgreSQL.

This instructor-led, live training (onsite or remote) is aimed at developers who wish to set up a multi-node Greenplum database.

By the end of this training, participants will be able to:

- Install and configure Pivotal Greenplum.
- Model data in accordance to current needs and future expansion plans.
- Carry out different techniques for distributing data across multiple nodes.
- Improve database performance through tuning.
- Monitor and troubleshoot a Greenplum database.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
Sfarsit de saptamana Big Data Cursuri, Seara Big Data Training, Big Data Camp, Big Data Cu instructor, Sfarsit de saptamana Big Data Training, Seara Big Data Cursuri, Big Data Coaching, Big Data Instructor, Big Data Trainer, Big Data Cursuri, Big Data Clase, Big Data Pe pagina, Big Data curs privat, Big Data one on one training

Reduceri pentru cursuri

Newsletter Oferte Cursuri

Respectăm confidențialitatea adresei dvs. de email. Nu vom transmite sau vinde adresa altor părți. Puteți să schimbați preferințele sau să vă dezabonați complet în orice moment.

Câțiva dintre clienții noștri

is growing fast!

We are looking to expand our presence in Romania!

As a Business Development Manager you will:

  • expand business in Romania
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!