1.5 Paràmetres de dispersió
Els paràmetres de dispersió mesuren la separació entre les dades i la seva concentració al voltant dels paràmetres centrals. Només són aplicables a les variables numèriques. Són:
* El rang interquartíl·lic és la diferència entre el tercer quartil i el primer quartil.
Les dades que s'allunyen del primer quartil i del tercer quartil en més de 1,5 vegades el rang interquartíl·lic s'anomenen dades anòmales.
Si un conjunt de dades té mitjana
, la desviació d'un valor xi es defineix com di
= xi-
.
Hi ha desviacions positives i negatives però
es compensen:
* La desviació mitjana d'una sèrie és la mitjana dels valors absoluts de les desviacions:
* La variància d'una sèrie és la mitjana dels quadrats de les desviacions:
* La desviació tipus d'una sèrie
és l'arrel quadrada de la variança:
És el més important dels paràmetres
de dispersió.
L'interval
conté habitualment una part significativa de les dades. En el cas
de dades repartides de forma normal, que es tractaran més
endavant, conté un 68% de les dades.