Schița de curs
Defalcarea subiectelor zilnic: (Fiecare sesiune este de 2 ore)
Ziua 1: Sesiunea -1: Business Prezentare generală a motivului Big Data Business Inteligența în Telco.
- Studii de caz de la T-Mobile, Verizon etc.
 - Big Data rata de adaptare în telecomunicații nord-americane și modul în care își aliniază viitorul model de afaceri și operațiunile în jurul Big Data BI
 - Zona de aplicare la scară largă
 - Managementul rețelelor și serviciilor
 - Renunțare la clienți Management
 - Data Integration și Vizualizare tablou de bord
 - Managementul fraudei
 - Business Generarea regulilor
 - Profilarea clienților
 - Impingerea anunțurilor localizate
 
Ziua 1: Sesiunea-2: Introducere a Big Data-1
- Principalele caracteristici ale Big Data-volum, varietate, viteză și veridicitate. Arhitectură MPP pentru volum.
 - Data Warehouses – schemă statică, set de date care evoluează lent
 - MPP Database precum Greenplum, Exadata, Teradata, Netezza, Vertica etc.
 - Hadoop Soluții bazate – nu există condiții privind structura setului de date.
 - Model tipic: HDFS, MapReduce (crunch), preluare din HDFS
 - Lot - potrivit pentru analitice/non-interactive
 - Volum: date în flux CEP
 - Alegeri tipice – produse CEP (de exemplu, Infostreams, Apama, MarkLogic etc.)
 - Mai puțin gata de producție – Storm/S4
 - NoSQL Databases – (columnar și cheie-valoare): Cel mai potrivit ca adjuvant analitic la depozitul de date/baza de date
 
Ziua-1: Sesiunea -3: Introducere în Big Data-2
NoSQL soluții
- KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
 - KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
 - Magazin KV (ierarhic) - GT.m, Cache
 - Magazin KV (comandat) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
 - KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
 - Magazin Tuple - Gigaspaces, Coord, Apache River
 - Obiect Database - ZopeDB, DB40, Shoal
 - Magazin de documente - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
 - Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
 
Varietăți de date: Introducere la Data Cleaning problema în Big Data
- RDBMS – structură/schemă statică, nu promovează mediul agil, explorator.
 - NoSQL – semistructurat, structură suficientă pentru a stoca date fără schema exactă înainte de stocarea datelor
 - Probleme de curățare a datelor
 
Ziua-1: Sesiunea-4: Big Data Introducere-3: Hadoop
- Când să selectați Hadoop?
 - STRUCTURAT - Depozitele/bazele de date ale întreprinderii pot stoca date masive (cu un cost), dar impun o structură (nu este bună pentru explorarea activă)
 - Date SEMI STRUCTURATE – greu de făcut cu soluțiile tradiționale (DW/DB)
 - Datele de depozitare = efort URIAȘ și statice chiar și după implementare
 - Pentru varietate și volum de date, bazate pe hardware-ul de bază – HADOOP
 - H/W mărfurilor necesare pentru a crea un Hadoop Cluster
 
Introducere în Map Reduce /HDFS
- MapReduce – distribuiți calcularea pe mai multe servere
 - HDFS – pune datele disponibile local pentru procesul de calcul (cu redundanță)
 - Date – pot fi nestructurate/fără schemă (spre deosebire de RDBMS)
 - Responsabilitatea dezvoltatorului de a da sens datelor
 - Programming MapReduce = lucrul cu Java (pro/contra), încărcarea manuală a datelor în HDFS
 
Ziua 2: Sesiunea-1.1: Spark: În baza de date distribuită în memorie
- Ce este procesarea „În memorie”?
 - Spark SQL
 - Spark SDK
 - Spark API
 - RDD
 - Spark Lib
 - Hanna
 - Cum să migrați un sistem Hadoop existent la Spark
 
Ziua 2 Sesiunea -1.2: Furtuna -Procesare în timp real în Big Data
- Fluxuri
 - Germeni
 - Șuruburi
 - Topologii
 
Ziua 2: Sesiunea 2: Big Data Management Sistem
- Piese în mișcare, nodurile de calcul pornesc/eșuează :ZooKeeper - Pentru servicii de configurare/coordonare/denumire
 - Conductă/flux de lucru complex: Oozie – gestionați fluxul de lucru, dependențele, lanțul în margaretă
 - Implementează, configura, gestionează cluster, upgrade etc (administrator de sistem): Ambari
 - În cloud: Whirr
 - Evoluție Big Data instrumente de platformă pentru urmărire
 - Probleme de aplicare a stratului ETL
 
Ziua 2: Sesiunea 3: Analiza predictivă în Business Inteligență -1: Tehnici fundamentale și BI bazat pe învățarea automată:
- Introducere în învățarea automată
 - Învățarea tehnicilor de clasificare
 - Fișier de antrenament de pregătire Bayesian Prediction
 - Câmp aleatoriu Markov
 - Învățare supravegheată și nesupravegheată
 - Extragerea caracteristicilor
 - Suport Vector Machine
 - Retea neurala
 - Consolidarea învățării
 - Big Data problemă cu variabile mari - Pădure aleatoare (RF)
 - Învățarea reprezentării
 - Invatare profunda
 - Big Data Problemă de automatizare – Ansamblu multimodel RF
 - Automatizare prin Soft10-M
 - LDA și modelarea subiectelor
 - Agile învăţare
 - Învățare bazată pe agenți - Exemplu din operațiunea Telco
 - Învățare distribuită – Exemplu de operare Telco
 - Introducere în instrumente open source pentru analiză predictivă: R, Rapidminer, Mahut
 - Laborator mai scalabil analitic-Apache Hama, Spark și CMU Graph
 
Ziua-2: Sesiunea-4 Ecosistemul de analiză predictivă-2: Probleme comune de analiză predictivă în Telecom
- Insight analitic
 - Analiza vizualizării
 - Analitică predictivă structurată
 - Analiză predictivă nestructurată
 - Profilarea clienților
 - Motor de recomandare
 - Detectarea modelelor
 - Descoperirea regulilor/scenariului – eșec, fraudă, optimizare
 - Descoperirea cauzei fundamentale
 - Analiza sentimentelor
 - CRM analitic
 - Analiza rețelei
 - Analiza textului
 - Analiza asistată de tehnologie
 - Analiza fraudelor
 - Analitică în timp real
 
Ziua 3: Sesiunea 1: Analiza operațiunii rețelei - analiza cauzei principale a defecțiunilor rețelei, întreruperea serviciului din metadate, IPDR și CRM:
- Utilizarea CPU
 - Folosirea memoriei
 - Utilizarea cozii QoS
 - Temperatura dispozitivului
 - Eroare de interfață
 - versiuni IoS
 - Rutarea evenimentelor
 - Variații de latență
 - Analiza Syslog
 - Pierdere de pachete
 - Simulare de încărcare
 - Inferența topologică
 - Pragul de performanță
 - Capcane pentru dispozitive
 - Colectarea și procesarea IPDR (înregistrare detaliată IP).
 - Utilizarea datelor IPDR pentru consumul de lățime de bandă a abonaților, utilizarea interfeței de rețea, starea modemului și diagnosticare
 - informații HFC
 
Ziua 3: Sesiunea 2: Instrumente pentru analiza defecțiunilor serviciului de rețea:
- Tabloul de bord cu rezumatul rețelei: monitorizați implementările generale ale rețelei și urmăriți indicatorii cheie de performanță ai organizației dvs
 - Tabloul de bord pentru analiza perioadei de vârf: înțelegeți tendințele aplicațiilor și ale abonaților care conduc la utilizarea maximă, cu granularitate specifică locației
 - Tabloul de bord al eficienței de rutare: controlați costurile rețelei și construiți cazuri de afaceri pentru proiectele de capital, cu o înțelegere completă a relațiilor de interconectare și tranzit
 - Tabloul de bord pentru divertisment în timp real: accesați valorile care contează, inclusiv vizionările video, durata și calitatea experienței video (QoE)
 - Tabloul de bord pentru tranziția IPv6: investigați adoptarea în curs de desfășurare a IPv6 în rețeaua dvs. și obțineți informații despre aplicațiile și dispozitivele care conduc tendințele
 - Studiu de caz-1: Minerul de date Alcatel-Lucent Big Network Analytics (BNA).
 - Inteligență mobilă multidimensională (m.IQ6)
 
Ziua 3: Sesiunea 3: Big Data BI pentru Marketing/Vânzări – Înțelegerea vânzărilor/marketingului din datele de vânzări: (Toate acestea vor fi afișate cu o demonstrație analitică predictivă live)
- Pentru a identifica clienții cu cea mai mare viteză
 - Pentru a identifica clienții pentru un anumit produs
 - Pentru a identifica setul potrivit de produse pentru un client (Recommendation Engine)
 - Tehnica segmentării pieței
 - Tehnica de vânzare încrucișată și upsale
 - Tehnica de segmentare a clienților
 - Tehnica de prognoză a veniturilor din vânzări
 
Ziua 3: Sesiunea 4: BI necesară pentru biroul Telco CFO:
- Prezentare generală a Business Analytics funcționează necesare într-un birou CFO
 - Analiza de risc la investiții noi
 - Venituri, prognoza profitului
 - Prognoza de achizitie de clienti noi
 - Prognoza pierderilor
 - Analiza fraudelor în domeniul financiar ( detalii sesiunea următoare )
 
Ziua 4: Sesiunea 1: BI pentru prevenirea fraudei de la Big Data în analitica Telco-Fraud:
- Scurgeri de lățime de bandă / fraudă de lățime de bandă
 - Frauda de la furnizor/supra taxare pentru proiecte
 - Fraude de rambursare/revendicare client
 - Fraude de rambursare de călătorie
 
Ziua 4: Sesiunea 2: De la Predicția de renuntare la Prevenirea renunțării:
- 3 tipuri de abandon: activ/deliberat, rotațional/incident, pasiv involuntar
 - 3 clasificare a clienților renunțăți: total, ascuns, parțial
 - Înțelegerea variabilelor CRM pentru abandon
 - Colectarea datelor despre comportamentul clienților
 - Colectarea datelor despre percepția clienților
 - Colectarea datelor demografice ale clienților
 - Curățarea datelor CRM
 - Date CRM nestructurate (apelul clientului, bilete, e-mailuri) și conversia acestora în date structurate pentru analiza Churn
 - Social Media CRM-noua modalitate de a extrage indicele de satisfacție a clienților
 - Studiu de caz-1: T-Mobile SUA: Reducere a pierderii cu 50%
 
Ziua 4: Sesiunea 3: Cum să utilizați analiza predictivă pentru analiza cauzei principale a nemulțumirii clienților:
- Studiu de caz -1: Legarea nemulțumirii cu probleme – Contabilitate, Eșecuri de inginerie cum ar fi întreruperea serviciului, serviciul de lățime de bandă slabă
 - Studiu de caz-2: Big Data Tabloul de bord QA pentru a urmări indicele de satisfacție a clienților din diverși parametri, cum ar fi escaladarea apelurilor, criticitatea problemelor, evenimentele de întrerupere a serviciului în așteptare etc.
 
Ziua 4: Sesiunea 4: Big Data Tabloul de bord pentru acces rapid la diverse date și afișare:
- Integrarea platformei de aplicații existente cu Big Data Dashboard
 - Big Data management
 - Studiu de caz pentru Big Data Tabloul de bord: Tableau și Pentaho
 - Folosiți aplicația Big Data pentru a transmite reclame bazate pe locație
 - Sistem de urmărire și management
 
Ziua 5: Sesiunea 1: Cum se justifică Big Data implementarea BI în cadrul unei organizații:
- Definirea ROI pentru implementarea Big Data.
 - Studii de caz pentru economisirea timpului analistului pentru colectarea și pregătirea datelor – creșterea creșterii productivității
 - Studii de caz privind câștigul de venituri din retragerea clienților
 - Câștig de venituri din anunțuri bazate pe locație și alte anunțuri direcționate
 - O abordare integrată a foii de calcul pentru a calcula cca. Cheltuieli vs. Câștig/economii de venituri din implementarea Big Data.
 
Ziua-5: Sesiunea-2: Procedura pas cu pas pentru a înlocui sistemul de date vechi cu Big Data Sistem:
- Înțelegerea practicii Big Data Foaia de parcurs pentru migrație
 - Care sunt informațiile importante necesare înainte de a proiecta o implementare Big Data.
 - Care sunt diferitele moduri de a calcula volumul, viteza, varietatea și veridicitatea datelor
 - Cum se estimează creșterea datelor
 - Studii de caz în 2 Telco
 
Ziua 5: Sesiunea 3 și 4: Revizuirea Big Data furnizorilor și revizuirea produselor lor. Sesiune Q/A:
- AccentureAlcatel-Lucent
 - Amazon – A9
 - APTEAN (fost CDC Software)
 - Cisco Sisteme
 - Cloudera
 - Dell
 - EMC
 - GoodData Corporation
 - Guavus
 - Hitachi Data Systems
 - Hortonworks
 - Huawei
 - HP
 - IBM
 - Informatica
 - Intel
 - Jaspersoft
 - Microsoft
 - MongoDB (Anterior 10Gen)
 - MU Sigma
 - Netapp
 - Opera Solutions
 - Oracle
 - Pentaho
 - Platfora
 - Qliktech
 - Cuantic
 - Rackspace
 - Revoluție Analytics
 - Salesforce
 - SAP
 - SAS Institutul
 - Sisense
 - Software AG/Terracotta
 - Soft10 Automation
 - Splunk
 - Sqrrl
 - Supermicro
 - Tableau Software
 - Teradata
 - Gândiți-vă la Big Analytics
 - Sisteme Tidemark
 - VMware (parte a EMC)
 
Cerințe
- Ar trebui să aibă cunoștințe de bază despre funcționarea afacerii și sistemele de date în Telecom în domeniul lor .
 - Trebuie să aibă cunoștințe de bază despre SQL/Oracle sau baze de date relaționale
 - Cunoașterea de bază a statisticilor (la nivel de Excel) .
 
Mărturii (3)
Toate exemplele folosite și stilul de predare erau perfect adaptați chiar pentru un începător, fiind capabil să înțeleg, iar instruirea a fost atât de pașnică cât și tot timpul dispusă să facă milea extra atunci când aveam nevoie de ajutor.
Mathipa Chepape - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina
Toate exemplele folosite și stilul de predare erau perfect chiar pentru un începător. Am reușit să înțeleg și instruirea a fost atât de pașnică, întotdeauna dispusă să facă milea extra atunci când aveam nevoie de ajutor.
Mathipa Chepape - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina
Comprehanderea mai bine a datelor mari
Shaune Dennis - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina