|
||||||||||||||||
Pràctica |
Exercicis
|
|||||||||||||||
Les distribucions de probabilitat contínues |
Glossari
|
|||||||||||||||
Simulacions per obtenir dades | |
En aquesta pràctica estudiarem com es pot jutjar gràficament l'ajust d'un conjunt de dades empíriques corresponents a una variable contínua amb el corresponent model de probabilitat. Per disposar de conjunts de dades per modelitzar una situació, tenim al nostre abast el procediment conegut com a simulacions. Amb aquest procediment, que s'aplica també per a variables contínues, l'Excel genera un conjunt de dades que s'adapten a un determinat model. Els punts concrets que treballareu són aquests:
|
|
Simulació de la suma de dues distribucions normals | |
Imaginem que una afeccionada a les curses a peu recorre sovint el mateix trajecte; a l'anada fa pujada i, segons com es troba i les ganes que té de córrer, triga un temps que segueix una distribució normal de mitjana 22 minuts i desviació estàndard 0,6 minuts. A la tornada fa baixada (és clar!) i el temps que triga segueix una distribució normal de mitjana 20 minuts i desviació estàndard 0,8 minuts. Quina serà la distribució que podrà servir de model al temps total suposant (cosa que ja és molt suposar) que el temps de tornada és independent del temps d'anada? És interessant simular la repetició de l'experiència (en aquest cas, seria «com si féssim moltes vegades la cursa»). Per fer-ho, heu de clicar a l'opció Herramientas | Análisis de datos | Generación de números aleatorios, que, com ja hem comentat repetidament, heu de tenir ben instal·lada. Seguiu el procediment següent:
En acabat, podeu procedir a un estudi estadístic de la variable Temps total que teniu a la columna C i que heu obtingut com a suma de les variables Pujada i Baixada.
És molt il·lustratiu tenir un resum de les mitjanes i les desviacions estàndards de les tres variables. Ho podeu fer així:
Ara ja podeu procedir a fer l'histograma:
És ben interessant que repetiu diverses vegades tot el procediment per copsar la influència de l'atzar i per constatar empíricament la part fonamental de la doctrina que volem explicar, que es reflecteix en l'enunciat següent: "La suma de dues distribucions normals és una altra distribució normal de mitjana la suma de les mitjanes i variància la suma de les variàncies".
Els autors han fet diverses vegades el procediment de simulació. Es transcriuen els resultats de tres proves per a la distribució suma, que sempre donava una aparença força bona d'ajust per la normal i, en principi, la mitjana i la desviació estàndard tenen un valor força aproximat al que ens diu la teoria.
Per poder constatar de manera visual si l'ajust de la variable suma a una normal és globalment consistent (i no solament pel que fa als paràmetres calculats), podeu superposar en el mateix gràfic de l'histograma una campana de Gauss que sigui la funció densitat de la distribució normal teòrica de mitjana i desviació estàndard iguals a les que ens diu la teoria (és a dir 42 i 1 respectivament).
Veureu que l'Excel «ha endevinat» la millor manera per poder comparar adequadament els dos gràfics. Ha interpretat que volíem un gràfic de línia i ha vist que seria convenient fer servir dos eixos verticals diferents, per les diferents escales que cal emprar (recordeu que l'àrea delimitada per la gràfica d'una funció densitat i l'eix horitzontal sempre val 1). Nota: No
penseu pas que sempre serà així quan volguem superposar
dos gràfics; en aquest cas ha estat perquè el primer gràfic
s'havia fet amb el procediment ...|Histograma. De fet hi ha un
gràfic personalitzat que fa un diagrama de barres i li supeposa
un gràfic de línies seleccionant alhora les dues columnes:
En una de les nostres proves, després de fer modificacions en la presentació, hem obtingut el gràfic següent:
Observeu com s'ajusten els dos gràfics. En el mòdul següent estudiareu les proves de contrast estadístic que permeten valorar si aquest ajust és realment significatiu o no. Potser penseu: "Sembla que la corba normal
hagi quedat desplaçada cap a l'esquerra". Si ho penseu, teniu
raó; si us interessa corregir-ho, cliqueu a la icona d'ampliació. |
|
Presentació d'una nova família de distribucions: la khi quadrat | |
La suma de quadrats de n distribucions normals independents correspon
a un model teòric molt important: la distribució khi
quadrat amb n graus de llibertat. La distribució khi quadrat amb tres graus de llibertat resulta de la suma de quadrats de tres distribucions normals estàndards independents.
Número de variables: 3 Al mòdul següent treballarem a bastament amb aquestes distribucions de la família khi quadrat. |
|
Ampliacions, aclariments i comentaris | |
"Sembla que la corba normal hagi
quedat desplaçada cap a l'esquerra". En la construcció gràfica que hem fet per tal de superposar la corba normal a l'histograma obtingut amb les dades de la simulació, arrosseguem l'anomalia que ja hem comentat en altres ocasions sobre la manera que té l'Excel de posar els rètols de l'eix de les x en el gràfic que anomena histograma. En aquesta ampliació expliquem com es pot fer per corregir aquesta anomalia i dibuixar la corba normal que realment correspon als intervals de classe amb què hem agrupat les dades.
D'aquesta manera veureu que s'ha dibuixat la corba normal que realment correspon. Tot seguit transcrivim com a exemple el gràfic corregit, atl com s'ha explicat en aquesta ampliació, corresponent a la mateixa simulació de què havíem mostrat el gràfic en el text de la pràctica. Oi que, sense cap mena de dubte, l'ajust és molt millor? |
|