Schița de curs

Defalcarea subiectelor zilnic: (Fiecare sesiune este de 2 ore)

Ziua 1: Sesiunea -1: Business Prezentare generală a motivului Big Data Business Inteligența în Telco.

  • Studii de caz de la T-Mobile, Verizon etc.
  • Big Data rata de adaptare în telecomunicații nord-americane și modul în care își aliniază viitorul model de afaceri și operațiunile în jurul Big Data BI
  • Zona de aplicare la scară largă
  • Managementul rețelelor și serviciilor
  • Renunțare la clienți Management
  • Data Integration și Vizualizare tablou de bord
  • Managementul fraudei
  • Business Generarea regulilor
  • Profilarea clienților
  • Impingerea anunțurilor localizate

Ziua 1: Sesiunea-2: Introducere a Big Data-1

  • Principalele caracteristici ale Big Data-volum, varietate, viteză și veridicitate. Arhitectură MPP pentru volum.
  • Data Warehouses – schemă statică, set de date care evoluează lent
  • MPP Database precum Greenplum, Exadata, Teradata, Netezza, Vertica etc.
  • Hadoop Soluții bazate – nu există condiții privind structura setului de date.
  • Model tipic: HDFS, MapReduce (crunch), preluare din HDFS
  • Lot - potrivit pentru analitice/non-interactive
  • Volum: date în flux CEP
  • Alegeri tipice – produse CEP (de exemplu, Infostreams, Apama, MarkLogic etc.)
  • Mai puțin gata de producție – Storm/S4
  • NoSQL Databases – (columnar și cheie-valoare): Cel mai potrivit ca adjuvant analitic la depozitul de date/baza de date

Ziua-1: Sesiunea -3: Introducere în Big Data-2

NoSQL soluții

  • KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • Magazin KV (ierarhic) - GT.m, Cache
  • Magazin KV (comandat) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
  • KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
  • Magazin Tuple - Gigaspaces, Coord, Apache River
  • Obiect Database - ZopeDB, DB40, Shoal
  • Magazin de documente - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Varietăți de date: Introducere la Data Cleaning problema în Big Data

  • RDBMS – structură/schemă statică, nu promovează mediul agil, explorator.
  • NoSQL – semistructurat, structură suficientă pentru a stoca date fără schema exactă înainte de stocarea datelor
  • Probleme de curățare a datelor

Ziua-1: Sesiunea-4: Big Data Introducere-3: Hadoop

  • Când să selectați Hadoop?
  • STRUCTURAT - Depozitele/bazele de date ale întreprinderii pot stoca date masive (cu un cost), dar impun o structură (nu este bună pentru explorarea activă)
  • Date SEMI STRUCTURATE – greu de făcut cu soluțiile tradiționale (DW/DB)
  • Datele de depozitare = efort URIAȘ și statice chiar și după implementare
  • Pentru varietate și volum de date, bazate pe hardware-ul de bază – HADOOP
  • H/W mărfurilor necesare pentru a crea un Hadoop Cluster

Introducere în Map Reduce /HDFS

  • MapReduce – distribuiți calcularea pe mai multe servere
  • HDFS – pune datele disponibile local pentru procesul de calcul (cu redundanță)
  • Date – pot fi nestructurate/fără schemă (spre deosebire de RDBMS)
  • Responsabilitatea dezvoltatorului de a da sens datelor
  • Programming MapReduce = lucrul cu Java (pro/contra), încărcarea manuală a datelor în HDFS

Ziua 2: Sesiunea-1.1: Spark: În baza de date distribuită în memorie

  • Ce este procesarea „În memorie”?
  • Spark SQL
  • Spark SDK
  • Spark API
  • RDD
  • Spark Lib
  • Hanna
  • Cum să migrați un sistem Hadoop existent la Spark

Ziua 2 Sesiunea -1.2: Furtuna -Procesare în timp real în Big Data

  • Fluxuri
  • Germeni
  • Șuruburi
  • Topologii

Ziua 2: Sesiunea 2: Big Data Management Sistem

  • Piese în mișcare, nodurile de calcul pornesc/eșuează :ZooKeeper - Pentru servicii de configurare/coordonare/denumire
  • Conductă/flux de lucru complex: Oozie – gestionați fluxul de lucru, dependențele, lanțul în margaretă
  • Implementează, configura, gestionează cluster, upgrade etc (administrator de sistem): Ambari
  • În cloud: Whirr
  • Evoluție Big Data instrumente de platformă pentru urmărire
  • Probleme de aplicare a stratului ETL

Ziua 2: Sesiunea 3: Analiza predictivă în Business Inteligență -1: Tehnici fundamentale și BI bazat pe învățarea automată:

  • Introducere în învățarea automată
  • Învățarea tehnicilor de clasificare
  • Fișier de antrenament de pregătire Bayesian Prediction
  • Câmp aleatoriu Markov
  • Învățare supravegheată și nesupravegheată
  • Extragerea caracteristicilor
  • Suport Vector Machine
  • Retea neurala
  • Consolidarea învățării
  • Big Data problemă cu variabile mari - Pădure aleatoare (RF)
  • Învățarea reprezentării
  • Invatare profunda
  • Big Data Problemă de automatizare – Ansamblu multimodel RF
  • Automatizare prin Soft10-M
  • LDA și modelarea subiectelor
  • Agile învăţare
  • Învățare bazată pe agenți - Exemplu din operațiunea Telco
  • Învățare distribuită – Exemplu de operare Telco
  • Introducere în instrumente open source pentru analiză predictivă: R, Rapidminer, Mahut
  • Laborator mai scalabil analitic-Apache Hama, Spark și CMU Graph

Ziua-2: Sesiunea-4 Ecosistemul de analiză predictivă-2: Probleme comune de analiză predictivă în Telecom

  • Insight analitic
  • Analiza vizualizării
  • Analitică predictivă structurată
  • Analiză predictivă nestructurată
  • Profilarea clienților
  • Motor de recomandare
  • Detectarea modelelor
  • Descoperirea regulilor/scenariului – eșec, fraudă, optimizare
  • Descoperirea cauzei fundamentale
  • Analiza sentimentelor
  • CRM analitic
  • Analiza rețelei
  • Analiza textului
  • Analiza asistată de tehnologie
  • Analiza fraudelor
  • Analitică în timp real

Ziua 3: Sesiunea 1: Analiza operațiunii rețelei - analiza cauzei principale a defecțiunilor rețelei, întreruperea serviciului din metadate, IPDR și CRM:

  • Utilizarea CPU
  • Folosirea memoriei
  • Utilizarea cozii QoS
  • Temperatura dispozitivului
  • Eroare de interfață
  • versiuni IoS
  • Rutarea evenimentelor
  • Variații de latență
  • Analiza Syslog
  • Pierdere de pachete
  • Simulare de încărcare
  • Inferența topologică
  • Pragul de performanță
  • Capcane pentru dispozitive
  • Colectarea și procesarea IPDR (înregistrare detaliată IP).
  • Utilizarea datelor IPDR pentru consumul de lățime de bandă a abonaților, utilizarea interfeței de rețea, starea modemului și diagnosticare
  • informații HFC

Ziua 3: Sesiunea 2: Instrumente pentru analiza defecțiunilor serviciului de rețea:

  • Tabloul de bord cu rezumatul rețelei: monitorizați implementările generale ale rețelei și urmăriți indicatorii cheie de performanță ai organizației dvs
  • Tabloul de bord pentru analiza perioadei de vârf: înțelegeți tendințele aplicațiilor și ale abonaților care conduc la utilizarea maximă, cu granularitate specifică locației
  • Tabloul de bord al eficienței de rutare: controlați costurile rețelei și construiți cazuri de afaceri pentru proiectele de capital, cu o înțelegere completă a relațiilor de interconectare și tranzit
  • Tabloul de bord pentru divertisment în timp real: accesați valorile care contează, inclusiv vizionările video, durata și calitatea experienței video (QoE)
  • Tabloul de bord pentru tranziția IPv6: investigați adoptarea în curs de desfășurare a IPv6 în rețeaua dvs. și obțineți informații despre aplicațiile și dispozitivele care conduc tendințele
  • Studiu de caz-1: Minerul de date Alcatel-Lucent Big Network Analytics (BNA).
  • Inteligență mobilă multidimensională (m.IQ6)

Ziua 3: Sesiunea 3: Big Data BI pentru Marketing/Vânzări – Înțelegerea vânzărilor/marketingului din datele de vânzări: (Toate acestea vor fi afișate cu o demonstrație analitică predictivă live)

  • Pentru a identifica clienții cu cea mai mare viteză
  • Pentru a identifica clienții pentru un anumit produs
  • Pentru a identifica setul potrivit de produse pentru un client (Recommendation Engine)
  • Tehnica segmentării pieței
  • Tehnica de vânzare încrucișată și upsale
  • Tehnica de segmentare a clienților
  • Tehnica de prognoză a veniturilor din vânzări

Ziua 3: Sesiunea 4: BI necesară pentru biroul Telco CFO:

  • Prezentare generală a Business Analytics funcționează necesare într-un birou CFO
  • Analiza de risc la investiții noi
  • Venituri, prognoza profitului
  • Prognoza de achizitie de clienti noi
  • Prognoza pierderilor
  • Analiza fraudelor în domeniul financiar ( detalii sesiunea următoare )

Ziua 4: Sesiunea 1: BI pentru prevenirea fraudei de la Big Data în analitica Telco-Fraud:

  • Scurgeri de lățime de bandă / fraudă de lățime de bandă
  • Frauda de la furnizor/supra taxare pentru proiecte
  • Fraude de rambursare/revendicare client
  • Fraude de rambursare de călătorie

Ziua 4: Sesiunea 2: De la Predicția de renuntare la Prevenirea renunțării:

  • 3 tipuri de abandon: activ/deliberat, rotațional/incident, pasiv involuntar
  • 3 clasificare a clienților renunțăți: total, ascuns, parțial
  • Înțelegerea variabilelor CRM pentru abandon
  • Colectarea datelor despre comportamentul clienților
  • Colectarea datelor despre percepția clienților
  • Colectarea datelor demografice ale clienților
  • Curățarea datelor CRM
  • Date CRM nestructurate (apelul clientului, bilete, e-mailuri) și conversia acestora în date structurate pentru analiza Churn
  • Social Media CRM-noua modalitate de a extrage indicele de satisfacție a clienților
  • Studiu de caz-1: T-Mobile SUA: Reducere a pierderii cu 50%

Ziua 4: Sesiunea 3: Cum să utilizați analiza predictivă pentru analiza cauzei principale a nemulțumirii clienților:

  • Studiu de caz -1: Legarea nemulțumirii cu probleme – Contabilitate, Eșecuri de inginerie cum ar fi întreruperea serviciului, serviciul de lățime de bandă slabă
  • Studiu de caz-2: Big Data Tabloul de bord QA pentru a urmări indicele de satisfacție a clienților din diverși parametri, cum ar fi escaladarea apelurilor, criticitatea problemelor, evenimentele de întrerupere a serviciului în așteptare etc.

Ziua 4: Sesiunea 4: Big Data Tabloul de bord pentru acces rapid la diverse date și afișare:

  • Integrarea platformei de aplicații existente cu Big Data Dashboard
  • Big Data management
  • Studiu de caz pentru Big Data Tabloul de bord: Tableau și Pentaho
  • Folosiți aplicația Big Data pentru a transmite reclame bazate pe locație
  • Sistem de urmărire și management

Ziua 5: Sesiunea 1: Cum se justifică Big Data implementarea BI în cadrul unei organizații:

  • Definirea ROI pentru implementarea Big Data.
  • Studii de caz pentru economisirea timpului analistului pentru colectarea și pregătirea datelor – creșterea creșterii productivității
  • Studii de caz privind câștigul de venituri din retragerea clienților
  • Câștig de venituri din anunțuri bazate pe locație și alte anunțuri direcționate
  • O abordare integrată a foii de calcul pentru a calcula cca. Cheltuieli vs. Câștig/economii de venituri din implementarea Big Data.

Ziua-5: Sesiunea-2: Procedura pas cu pas pentru a înlocui sistemul de date vechi cu Big Data Sistem:

  • Înțelegerea practicii Big Data Foaia de parcurs pentru migrație
  • Care sunt informațiile importante necesare înainte de a proiecta o implementare Big Data.
  • Care sunt diferitele moduri de a calcula volumul, viteza, varietatea și veridicitatea datelor
  • Cum se estimează creșterea datelor
  • Studii de caz în 2 Telco

Ziua 5: Sesiunea 3 și 4: Revizuirea Big Data furnizorilor și revizuirea produselor lor. Sesiune Q/A:

  • AccentureAlcatel-Lucent
  • Amazon – A9
  • APTEAN (fost CDC Software)
  • Cisco Sisteme
  • Cloudera
  • Dell
  • EMC
  • GoodData Corporation
  • Guavus
  • Hitachi Data Systems
  • Hortonworks
  • Huawei
  • HP
  • IBM
  • Informatica
  • Intel
  • Jaspersoft
  • Microsoft
  • MongoDB (Anterior 10Gen)
  • MU Sigma
  • Netapp
  • Opera Solutions
  • Oracle
  • Pentaho
  • Platfora
  • Qliktech
  • Cuantic
  • Rackspace
  • Revoluție Analytics
  • Salesforce
  • SAP
  • SAS Institutul
  • Sisense
  • Software AG/Terracotta
  • Soft10 Automation
  • Splunk
  • Sqrrl
  • Supermicro
  • Tableau Software
  • Teradata
  • Gândiți-vă la Big Analytics
  • Sisteme Tidemark
  • VMware (parte a EMC)

Cerințe

  • Ar trebui să aibă cunoștințe de bază despre funcționarea afacerii și sistemele de date în Telecom în domeniul lor
  • .
  • Trebuie să aibă cunoștințe de bază despre SQL/Oracle sau baze de date relaționale
  • Cunoașterea de bază a statisticilor (la nivel de Excel)
  • .
 35 ore

Numărul de participanți



Pret per participant

Mărturii (2)

Categorii înrudite