Analisi dati con R

Siete interessati alla visualizzazione o all’analisi di dati sanitari, per fini di ricerca o gestionali? E magari lo fate già, in Excel, Stata o SPSS?

Consiglio vivamente di mettere da parte un po’ di tempo per imparare a usare R, un linguaggio di programmazione gratuito e open source specializzato nella statistica e nella scienza dei dati.

R è vastamente superiore a Stata e SPSS in termini di gestione dei dati e grafici, è in grado di effettuare le stesse analisi statistiche. Ha anche moltissime estensioni che consentono di fare di tutto: analisi di sopravvivenza, modelli lineari generalizzati con effetti misti, analisi di megadati. Contrariamente a Stata e SPSS, è gratuito. Per tutti questi motivi, è sempre piú usato nella ricerca medica ed epidemiologica. SPSS è davvero démodé… Non faccio neanche paragoni con Excel perché sarebbero imbarazzanti (smettete di fare grafici a torta!)

È anche usato in statistica economica e in generale per la visualizzazione dati – per esempio, la BBC produce tutti i suoi grafici in R.

Se siete interessati, ho preparato del materiale per un corso autoesplicativo in cinque sessioni, in inglese, che potreste svolgere da soli. Copre questi argomenti: l’interfaccia utente, l’importazione dei dati e la loro pulizia, la visualizzazione grafica, la sintesi, la manipolazione e l’esportazione, in un contesto di ricerca medica/epidemiologica; non tratta di analisi statistica. Lo trovate sul mio GitHub.

Passi necessari per usare questo materiale:

  1. Scaricare e installare R
  2. Scaricare e installare RStudio, nella sua versione gratuita
  3. Scaricare la repository (cartella, contenente codice e dati) dal mio GitHub
  4. Iniziare con intRo1 basics.Rmd.

Se lo usate e avete dubbi o commenti, scrivetemi pure qui oppure su GitHub.