Cursuri de pregatire Data Science for Big Data Analytics

Datele mari sunt seturi de date atât de voluminoase și complexe încât softurile tradiționale de aplicații de prelucrare a datelor nu sunt adecvate pentru a le trata. Provocările de date mari includ captarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.

Cursuri de pregatire Data Science for Big Data Analytics

Schița de curs

Introducere în Data Science for Big Data Analytics

Introducere în ciclul de viață Data Analytics

Din acest punct, cea mai mare parte a timpului de instruire (80%) va fi alocat pe exemple și exerciții în R și tehnologia Big Data aferentă.

Începeți cu R

Noțiuni introductive cu Hadoop

Integrarea R și Hadoop cu RHadoop

Preprocesarea și pregătirea datelor

Metode exploratorii de analiză a datelor în R

Data Visualizations

Regresie (Estimarea valorilor viitoare)

Clasificare

Evaluarea performanței și selecția modelului

Metode de ansamblu

Sprijină mașini vectoriale pentru clasificare și regresie

Concepte de analiză a legăturilor Metrici pentru analiza rețelelor Algoritmul Pagerank Subiect indus de hiperlink Search Exerciții de predicție a legăturilor și studiu de caz

Înțelegerea sistemelor de recomandare Tehnicile de extragere a datelor utilizate în sistemele de recomandare Sisteme de recomandare cu pachetul recommenderlab Evaluarea sistemelor de recomandare Recomandări cu RHadoop Exercițiu: Construirea motorului de recomandare

Pașii analizei textului Colectarea textului brut Pungă de cuvinte Frecvența termenilor – Frecvența inversă a documentului Determinarea sentimentelor Exerciții și studiu de caz

Mărturii (2)

Marija Hornis Dmitrovic - Marija Hornis

Curs - Data Science for Big Data Analytics

Teboho Makenete

Curs - Data Science for Big Data Analytics

Cursuri înrudite

Kaggle

Accelerating Python Pandas Workflows with Modin

GPU Data Science with NVIDIA RAPIDS

Anaconda Ecosystem for Data Scientists

Data Vault: Building a Scalable Data Warehouse

Spark Streaming with Python and Kafka

Confluent KSQL

Apache Ignite for Developers

Unified Batch and Stream Processing with Apache Beam

Apache Apex: Processing Big Data-in-Motion

Apache Storm

Apache NiFi for Administrators

Apache NiFi for Developers

Apache Flink Fundamentals

Python and Spark for Big Data (PySpark)

Categorii înrudite

Big Data

Data Mining

Data Science

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites