Schița de curs

Ziua 1

Introducere și preliminarii

  • Facerea lui R mai prietenos, R și interfețele grafice disponibile
  • Rstudio
  • Software și documentație conexe
  • R și statistica
  • Utilizarea interactivă a lui R
  • O sesiune introductivă
  • Obținerea de ajutor pentru funcții și caracteristici
  • Comenzi R, sensibilitatea la majuscule, etc.
  • Reamintire și corectare a comenzilor anterioare
  • Executarea comenzilor din sau redirecționarea rezultatelor către un fișier
  • Permanența datelor și eliminarea obiectelor

Manipulări simple; numere și vectori

  • Vectori și atribuire
  • Aritmetica vectorilor
  • Generarea de secvențe regulate
  • Vectori logici
  • Valori lipsă
  • Vectori de caractere
  • Vectori de index; selectarea și modificarea subseturilor unui set de date
  • Alte tipuri de obiecte

Obiecte, modurile și atributele lor

  • Atribute intrinseci: mod și lungime
  • Schimbarea lungimii unui obiect
  • Obținerea și setarea atributelor
  • Clasa unui obiect

Factori ordonați și neordonați

  • Un exemplu specific
  • Funcția tapply() și array-uri neuniforme
  • Factori ordonați

Array-uri și matrici

  • Array-uri
  • Indexarea array-urilor. Subsecțiuni ale unui array
  • Matrici de index
  • Funcția array()
    • Aritmetica mixtă vector și array. Regula de reciclare
  • Produsul exterior a două array-uri
  • Transpunerea generalizată a unui array
  • Facilități pentru matrici
    • Înmulțirea matricelor
    • Ecuații liniare și inversare
    • Valori proprii și vectori proprii
    • Descompunerea singulară și determinanții
    • Ajustarea celor mai mici pătrate și descompunerea QR
  • Formarea matricelor partitionate, cbind() și rbind()
  • Funcția de concatenare, (), cu array-uri
  • Tabele de frecvență din factori

Ziua 2

Liste și cadre de date

  • Liste
  • Construirea și modificarea listelor
    • Concatenarea listelor
  • Cadre de date
    • Crearea cadrelor de date
    • attach() și detach()
    • Lucrul cu cadre de date
    • Atasarea listelor arbitrare
    • Gestionarea căii de căutare

Manipularea datelor

  • Selectarea, subsetarea observațiilor și variabilelor          
  • Filtrarea, gruparea
  • Recodificare, transformări
  • Agregare, combinarea seturilor de date
  • Manipularea caracterelor, pachetul stringr

Citirea datelor

  • Fișiere txt
  • Fișiere CSV
  • Fișiere XLS, XLSX
  • Date în formate SPSS, SAS, Stata,… și alte formate
  • Exportul datelor în txt, csv și alte formate
  • Accesarea datelor din baze de date folosind limbajul SQL

Distribuții de probabilitate

  • R ca un set de tabele statistice
  • Examinarea distribuției unui set de date
  • Teste pe un eșantion și două eșantioane

Grupare, bucle și execuție condiționată

  • Expresii grupate
  • Instrucțiuni de control
    • Execuție condiționată: instrucțiuni if
    • Execuție repetitivă: bucle for, repeat și while

Ziua 3

Scrierea propriilor funcții

  • Exemple simple
  • Definirea de operatori binari noi
  • Argumente numite și valori implicite
  • Argumentul '...'
  • Atribuiri în interiorul funcțiilor
  • Exemple mai avansate
    • Factori de eficiență în proiectele de bloc
    • Eliminarea tuturor numelor într-un array tipărit
    • Integrare numerică recursivă
  • Domeniul de aplicare
  • Personalizarea mediului
  • Clase, funcții generice și orientarea pe obiecte

Analiza statistică în R

  • Modele de regresie liniară
  • Funcții generice pentru extragerea informațiilor despre modele
  • Actualizarea modelelor ajustate
  • Modele liniare generalizate
    • Familii
    • Funcția glm()
  • Clasificare
    • Regresie logistică
    • Analiza discriminantă liniară
  • Învățare nesupervizată
    • Analiza componentelor principale
    • Metode de clustering (k-means, clustering ierarhic, k-medoids)
  • Analiza de supraviețuire
    • Obiecte de supraviețuire în r
    • Estimarea Kaplan-Meier
    • Benzi de încredere
    • Modele Cox PH, covariante constante
    • Modele Cox PH, covariante dependente de timp

Proceduri grafice

  • Comenzi de reprezentare grafică de nivel înalt
    • Funcția plot()
    • Afisarea datelor multivariate
    • Afisarea graficelor
    • Argumente pentru funcțiile de reprezentare grafică de nivel înalt
  • Grafice de bază de vizualizare
  • Relații multivariate cu pachetele lattice și ggplot
  • Utilizarea parametrilor grafice
  • Lista parametrilor grafice

Raportare automată și interactivă

  • Combinarea rezultatelor din R cu text
  • Crearea de documente html, pdf

Cerințe

Înțelegere bună a statisticii.

 21 Ore

Numărul de participanți


Pret per participant

Mărturii (3)

Cursuri viitoare

Categorii înrudite