Algunes activitats d'estadística i probabilitat amb la Wiris |
>>
|
![]() |
Continguts (conceptes i procediments) |
A més de les activitats del final de la pàgina, aquesta secció consta dels apartats següents:
Definició de paràmetres de posició centrals.
Són valors al voltant dels quals "s'agrupen" les dades.
Paràmetres de posició centrals més coneguts.
És el valor que té una freqüència absoluta (o relativa) més alta. Pot ser únic (distribucions unimodals) o no (distribucions multimodals: bimodals si tenen 2 modes, trimodals si en tenen 3, etc.).
Determinació de la moda:
Finalment, si els intervals anterior i posterior al modal tenen freqüències diferents, es pot fer una determinació gràfica de la moda tal com s'indica en el gràfic següent:
Llavors, la fórmula matemàtica que ens permetria calcular la moda seria aquesta:
on:
Li = extrem inferior de l'interval de classe modal
ni = és la freqüència absoluta de la classe modal
ni-1 = és la freqüència absoluta de l'interval anterior a la classe modal
ni+1 = és la freqüència absoluta de l'interval posterior a la classe modal
h = amplitud de l'interval
Es calcula mitjançant alguna de les dues fórmules equivalents següents:
o bé, tenint en compte que ni/N=fi,
.
Si el càlcul es fa a mà, amb una taula, podem organitzar la informació així:
Quan s'han agrupat les dades en intervals, si se suposa que les dades estan distribuïdes uniformement en cada interval, la mitjana aritmètica es calcula amb les fórmules anteriors tenint en compte que els xi són les marques de classe de cada interval i ni. les freqüències absolutes de cada interval.
Quan se sobreentén que es parla de la mitjana aritmètica se li pot dir simplement mitjana, però si pot haver confusió, s'ha de dir mitjana aritmètica, ja que hi ha altres mitjanes (harmònica, geomètrica...).
És el valor que deixa per sota d'ell el 50% de les dades, és a dir, si s'ordenen les dades, és aquell valor que ocupa la posició central. Només té sentit per a variables quantitativas.
El seu càlcul per a variables quantitatives discretes (no agrupades en intervals) és fàcil: si hi ha un total de N dades i ordenem les dades de manera creixent, llavors:
Quan les dades han estat agrupades en intervals cal esbrinar l'interval que és la classe mediana. Per determinar-lo començo a mirar la freqüència absoluta acumulada (o la relativa acumluada) dels intervals des dels que tenen una marca de classe més petita a aquells que la tenen més gran. El primer interval que compleixi tenir una freqüència absoluta acumulada superior a N/2 (o, equivalentment, tenir una freqüència relativa acumulada superior a 0,5) és la classe mediana.
Una vegada coneguda la classe mediana, si anomenem:
Li = extrem inferior de l'interval de classe mediana
N = nombre de dades
Ni-1 = és la freqüència absoluta acumulada de l'interval anterior a la classe mediana
ni = és la freqüència absoluta de la classe mediana
h = amplitud de l'interval
Resulta que la mediana Me ve donada per la fórmula següent:
S'anomenen quartils als valors de la variable que parteixen la distribució en 4 parts iguals (entre cada quartil hi ha un 25% de les dades). Per determinar els quartils ordenem els valors de la variable de manera creixent.
Es determina d'una manera semblant a la mediana:
Si les dades no estan agrupades, quan N és divisible entre 4, el primer quartil és la mitjana entre els valors de la variable que ocupen les posicions N/4 i (N/4)+1. En cas que N no sigui divisible entre 4, el primer quartil és el primer valor de la variable que és superior a N/4.
Si les dades estan agrupades en intervals, primer busquem l'interval que conté el primer quartil (haurà de ser el interval que, tenint una marca de classe el més petita possible, té una freqüència absoluta acumulada superior a N/4 -o equivalentment, una freqüència relativa acumulada superior a 0,25). Després caldrà aplicar la fórmula següent:
on, com és d'esperar:
Li = extrem inferior de l'interval (que conté el quartil)
N = nombre de dades
Ni-1 = és la freqüència absoluta acumulada de l'interval anterior a l'interval que conté el quartil
ni = és la freqüència absoluta de l'interval que conté el quartil
h = amplitud de l'interval
Si les dades estan agrupades en intervals, primer busquem l'interval que conté el tercer quartil (haurà de ser el interval que, tenint una marca de classe el més petita possible, té una freqüència absoluta acumulada superior a 3N/4 -o equivalentment, una freqüència relativa acumulada superior a 0,75). Després caldrà aplicar la fórmula següent:
(i el significat de cada lletra ara ja és conegut -consulteu la llegenda per al primer quartil-).
De manera semblant als quartils, però generalment per a variable que ha estat agrupada en intervals (només donarem la definició en aquest cas), es poden definir els percentils (o centils) Pk. El percentil Pk és el valor de la variable tal que per sota d'ell hi ha un k% de les dades.
Per calcular-los, primer busquem l'interval que conté el primer quartil (haurà de ser el interval que, tenint una marca de classe el més petita possible, té una freqüència absoluta acumulada superior a k·N/100 -o equivalentment, una freqüència relativa acumulada superior a k/100-). Després caldrà aplicar la fórmula següent:
on el significat de les lletres ja es conegut.
Observeu que la fórmula del percentil ens permet calcular quin percentatge de dades (quina k) hi ha per sota d'un cert valor x=Pk de la distribució. Vegem un exemple: si em diuen que calculi quin % de les dades són menors o iguals que x=25 en una certa distribució de dades el que hauríem de fer és identificar Pk amb 25, és a dir, substituir Pk=25 en la fórmula del percentil i, esbrinant prèviament el valor de totes les lletres que apareixen a la fórmula, trobar la k, que és el percentatge que busco.
Si l'exercici em diu que trobi quin percentatge de dades hi ha entre x1=25 i x2=67, el que hauria de fer és, utilitzant el procediment trobat en l'apartat anterior, trobar les k1 i k2 corresponents a aquestes x i restar els percentatges obtinguts, és a dir, fer k2-k1.
Els percentils P10, P20, P30, P40, P50, P60, P70, P80 i P90 s'anomenen decils i se'ls simbolitza per D1, D2, D3, D4, D5, D6, D7, D8 i D9.
Activitats