Cursuri de pregatire Data Mining with R
R este un limbaj de programare liber-sursă pentru calculul statistic, analiza datelor și grafica. R este utilizat de un număr tot mai mare de manageri și analiști de date din cadrul corporațiilor și al mediului academic. R are o mare varietate de pachete de date mining.
Schița de curs
Sursele metodelor
- Inteligenţă artificială
- Învățare automată
- Statistics
- Surse de date
Preprocesarea datelor
- Import/Export de date
- Explorarea și vizualizarea datelor
- Reducerea dimensionalității
- Confruntarea cu valorile lipsă
- Pachete R
Principalele sarcini de extragere a datelor
- Analiza automată sau semi-automată a unor cantități mari de date
- Extragerea modelelor interesante necunoscute anterior
- grupuri de înregistrări de date (analiza cluster)
- înregistrări neobișnuite (detecția anomaliilor)
- dependențe (minarea regulilor de asociere)
Exploatarea datelor
- Detectarea anomaliilor (detecție anormal/modificare/abatere)
- Învățarea regulilor de asociere (modelarea dependenței)
- Clustering
- Clasificare
- Regresia
- Rezumat
- Exploatarea frecventă a modelelor
- Text Mining
- Arbori de decizie
- Regresia
- Neural Networks
- Exploatarea secvenței
- Exploatarea frecventă a modelelor
Dragaj de date, pescuit de date, snooping de date
Cerințe
Bune cunoștințe de R.
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Data Mining with R - Rezervare
Cursuri de pregatire Data Mining with R - Solicita Oferta
Data Mining with R - Cerere de consultanta
Mărturii (1)
Very tailored to needs.
Yashan Wang
Curs - Data Mining with R
Upcoming Courses
Cursuri înrudite
Knowledge Discovery in Databases (KDD)
21 oreDescoperirea cunoștințelor în baze de date (KDD) este procesul de descoperire a cunoștințelor utile dintr-o colecție de date. Aplicațiile de viață reală pentru această tehnică de minerit de date includ marketing, detectarea fraudelor, telecomunicații și fabricarea.
În acest curs de instruire, live, introducem procesele implicate în KDD și efectuăm o serie de exerciții pentru a practica implementarea acestor procese.
Audienţă
- Analiștii de date sau oricine este interesat să învețe cum să interpreteze datele pentru a rezolva problemele
Formatul cursului
- După o dezbatere teoretică a KDD, instructorul va prezenta cazuri de viață reală care solicită aplicarea KDD pentru a rezolva o problemă. Participanții vor pregăti, selecta și curăța seturile de date de eșantion și vor folosi cunoștințele lor anterioare cu privire la datele pentru a propune soluții bazate pe rezultatele observațiilor lor.
Introduction to Data Visualization with Tidyverse and R
7 oreTidyverse este o colecție de pachete R versatile pentru curățarea, procesarea, modelarea și vizualizarea datelor. Unele dintre pachetele incluse sunt: ggplot2, dplyr, tidyr, readr, purrr și tibble.
În cadrul acestui instruire, instruit în direct, participanții vor învăța cum să manipuleze și să vizualizeze datele folosind instrumentele incluse în Tidyverse .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Efectuați analiza datelor și creați vizualizări atrăgătoare
- Obțineți concluzii utile din diverse seturi de date cu date de probă
- Filtrați, sortați și rezumați datele pentru a răspunde la întrebări exploratorii
- Transformați datele procesate în linii informative, loturi de bare, histograme
- Importați și filtrați date din diverse surse de date, inclusiv Excel , CSV și SPSS
Public
- Începători în limba R
- Începători pentru analiza și vizualizarea datelor
Formatul cursului
- Partea de prelegere, o discuție parțială, exerciții și practici practice
Statistics with SPSS Predictive Analytics Software
14 oreGo al:
Învățați să lucrați cu SPSS la nivelul independenței
Destinatarii:
Analiști, cercetători, oameni de știință, studenți și toți cei care doresc să dobândească capacitatea de a utiliza pachetul SPSS și de a învăța tehnici populare de exploatare a datelor.
Data Mining
21 oreCursul poate fi furnizat cu orice unelte, inclusiv software gratuit și aplicații gratuite de exploatare a datelor cu sursă deschisă
From Data to Decision with Big Data and Predictive Analytics
21 orePublic
Dacă încercați să înțelegeți din datele pe care aveți acces la sau doriți să analizați datele nestructurate disponibile pe net (cum ar fi Twitter, Linked in, etc ...), acest curs este pentru dvs.
Se adresează în special factorilor de decizie și persoanelor care au nevoie să aleagă ce date merită să fie colectate și ce merită analizat.
Nu este destinat persoanelor care configurează soluția, dar acești oameni vor beneficia de imaginea de ansamblu.
Modul de livrare
În timpul cursului, delegații vor fi prezentați cu exemple de lucru ale tehnologiilor cu sursă în mare parte.
Prelegerile scurte vor fi urmate de prezentări și de exerciții simple de către participanți
Conținutul și software-ul folosit
Tot software-ul folosit este actualizat de fiecare dată când cursul este rulat, așa că verificăm cele mai noi versiuni posibile.
Acesta acoperă procesul de obținere, formatare, prelucrare și analiză a datelor, pentru a explica modul de automatizare a procesului de luare a deciziilor cu învățarea în mașină.
Oracle SQL Intermediate - Data Extraction
14 oreObiectivul cursului este de a permite participanților să dobândească o stăpânire a modului de lucru cu limbajul SQL în baza de date Oracle pentru extragerea datelor la nivel intermediar.
Data Mining and Analysis
28 oreIntroductory R for Biologists
28 oreR este un limbaj de programare liber-sursă pentru calculul statistic, analiza datelor și grafica. R este utilizat de un număr tot mai mare de manageri și analiști de date din cadrul corporațiilor și al mediului academic. R a găsit, de asemenea, adepți printre statisticienii, inginerii și oamenii de știință, fără abilități de programare pe calculator, care le găsesc ușor de folosit. Popularitatea sa se datorează utilizării din ce în ce mai mari a activităților de exploatare a datelor pentru diverse scopuri, cum ar fi stabilirea prețurilor anunțurilor, găsirea de noi medicamente mai rapid sau ajustarea modelelor financiare. R are o mare varietate de pachete de date mining.
Data Mining & Machine Learning with R
14 oreR este un limbaj de programare open-source gratuit pentru calcul statistic, analiză de date și grafică. R este utilizat de un număr tot mai mare de manageri și analiști de date din cadrul corporațiilor și mediului academic. R are o mare varietate de pachete pentru extragerea datelor.
Data Visualization
28 oreAcest curs este destinat inginerilor și factorilor de decizie care lucrează în domeniul exploatării datelor și în cunoașterea cunoștințelor.
Veți învăța cum să creați parcele și modalități eficiente de prezentare și reprezentare a datelor într-un mod care să apeleze la factorii de decizie și să îi ajute să înțeleagă informațiile ascunse.
Data Science for Big Data Analytics
35 oreDatele mari sunt seturi de date atât de voluminoase și complexe încât softurile tradiționale de aplicații de prelucrare a datelor nu sunt adecvate pentru a le trata. Provocările de date mari includ captarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.
Process Mining
21 oreprocesul de minerit, sau automatizate Business Process Discovery (ABPD), este o tehnica care se aplică algoritmi pentru jurnalele de evenimente, în scopul de a analiza proceselor de afaceri. Procesul de minerit depășește stocarea datelor și analiza datelor; Acesta poduri de date cu procese și oferă intuiții în tendințele și modelele care afectează eficiența procesului.
format al cursului
- cursul începe cu o imagine de ansamblu a tehnicilor cele mai frecvent utilizate pentru procesul de minerit. Vom discuta despre diferitele algoritmi de descoperire a proceselor și instrumente utilizate pentru descoperirea și modelarea proceselor bazate pe date de eveniment brut. Studiile de caz din viața reală sunt examinate, iar Seturile de date sunt analizate folosind cadrul open-source al balului.
Data Vault: Building a Scalable Data Warehouse
28 oreÎn acest training live, condus de un instructor în România, participanții vor învăța cum să construiască un Data Vault.
La sfârșitul acestui curs de formare, participanții vor fi capabili să:
- Înțelegeți arhitectura și conceptele de design din spatele Data Vault 2.0, precum și interacțiunea sa cu Big Data, NoSQL și AI. .
- Utilizați tehnicile de data vaulting pentru a permite auditarea, urmărirea și inspectarea datelor istorice într-un depozit de date. .
- Dezvoltați un proces ETL (Extract, Transform, Load) consistent și repetabil. .
- Construiți și implementați depozite foarte scalabile și repetabile. .
MonetDB
28 oreFoundation R
7 oreObiectivul cursului este de a permite participanților să dobândească o stăpânire a elementelor fundamentale ale R și modul de lucru cu datele.