|
||||||||||||||||
Pràctica |
Exercicis
|
|||||||||||||||
Els contrastos d'hipòtesis. La prova khi quadrat |
Glossari
|
|||||||||||||||
Proves de normalitat | ||||||||||||||||
Proves estadístiques de contrast de la mitjana | ||||||||||||
Una vegada coneguts els termes relacionats amb els contrastos estadístics (molt especialment el significat del valor p) en aquesta pràctica, que es pot considerar d'ampliació, es presenten diverses proves útils en la valoració de la significació d'hipòtesis sobre mitjanes. Es tracta de respondre a preguntes del tipus "allò que s'observa en aquest conjuntés significativament millor que la mitjana de la població?", o bé "les notes del grup A indiquen que aquest grup és significativament millor que el grup B?" o, encara, "el repàs que hem fet d'un tema de coneixements bàsics, ha comportat un augment significatiu en el rendiment en les proves de control?". Tot i que els elements estadístics que hi ha al darrere de les proves escapen dels objectius del curs, com que les proves es poden fer ràpidament amb el programa Excel, ha semblat interessant comentar-les. L'objectiu fonamental d'aquestes proves és quantificar si unes diferències observades permeten dubtar significativament de la hipòtesi nul·la "conservadora" que estableix que s'ha de mantenir el model. Ha semblat interessant ressaltar la idea que el que es valora és el nivell de significació d'unes diferències observades. És clar, si no observem diferències ja no farem cap prova! Els temes concrets que es tractaran són els següents:
|
||||||||||||
Proves de contrast d'una mitjana | ||||||||||||
Les primeres proves que presentem tenen l'objectiu de contrastar una mitjana. La situació és la següent: es recullen dades d'una variable contínua sobre una mostra, i alhora se sap un model que permet conèixer la mitjana d'aquella variable en la població. La prova intenta establir si hi ha criteris per decidir que la mostra és significativament diferent del conjunt de la població. Per exemple, quan el DURSI envia al nostre centre la mitjana de la nota que han tret els nostres alumnes de matemàtiques a les PAU i envia també la nota mitjana de Catalunya, podem aplicar aquestes proves per veure si les diferències observades són significatives o no. Veureu que hi ha dos plantejaments teòrics segons quina sigui la informació de què disposem pel que fa a les dades de la població. Aquests plantejaments teòrics poden ser fruit de condicionants pràctics o d'un altre tipus.
La primera de les proves, prova z per a una mostra, és un test inferencial sobre la mitjana que es fa, suposada coneguda la mitjana i la desviació estàndard de la població. La hipòtesi nul·la, en aquest cas, és que la mitjana del conjunt on s'ha pres una mostra és igual a la mitjana de la població. A partir dels comentaris que hem fet, ja podeu entendre que és igual vol dir no tenim criteris per suposar, de manera significativa, que és diferent. En aquesta prova es calcula l'estadístic , en què és la mitjana de la mostra, µ, la mitjana i la desviació estàndard de la població, i n la mida de la mostra (nombre de dades). La distribució d'aquest estadístic és la distribució normal estàndard, habitualment representada com a Z i d'aquí la denominació de la prova. Exemple 1: Rebem una informació estadística de l'Oficina de Coordinació
de les PAU que ens diu que a les proves de selectivitat d'enguany la mitjana
de l'examen de matemàtiques ha estat 4,98 amb una desviació
estàndard d'1,72. Les notes dels nostres 28 alumnes han estat les
següents:
Es pot dir que el rendiment d'aquest grup d'alumnes, que han tingut una mitjana superior a la de Catalunya, ha estat significativament millor que la població sencera? Aquesta és la pregunta que podem respondre amb la prova de z-per a una mostra. Vegem com la podem aplicar amb l'Excel.
Veureu que la conclusió del test, valor p gran, no ens permet dubtar significativament de la hipòtesi nul·la (que, com ja hem dit, és mitjana de la mostra = mitjana de la població). Tot i que observem una mitjana força més gran que la teòrica de la població, hem d'entendre que la diferència pot ser fruit de l'atzar. En la conclusió hi influeix el fet que la mostra és poc nombrosa. Podeu veure que, si canvieu el valor 4,98 de la mitjana de la població per 4,68, llavors el valor p de la prova esdevé molt petit. Si fos aquesta la dada coneguda, no tindríem gairebé cap risc de rebutjar la hipòtesi nul·la. Llavors sí que podríem anunciar: "Els nostres alumnes de matemàtiques són significativament millors que la mitjana de Catalunya". Feu la prova i vegeu que si aneu abaixant la hipotètica mitjana de la població, cada vegada el valor p és més petit. No sempre la informació que tenim és tan completa com en l'exemple que s'acaba d'exposar. Sovint cal una prova anàloga a l'anterior sobre la mitjana d'una mostra, però sense cap hipòtesi sobre la desviació estàndard de la població. Com que la desviació estàndard no se suposa coneguda,
ara es calcula l'estadístic , en què
i s representen la mitjana i la desviació estàndard
de la mostra, µ la mitjana teòrica de la població i
n la mida de la mostra. La diferència amb el cas anterior és que s'estima la desviació estàndard de la població a partir de s, desviació estàndard del conjunt de dades que formen la mostra. El model teòric per a la distribució mostral de l'estadístic és la distribució t de Student, que dóna nom a la prova, prova t per a una mostra. Compareu la situació anterior amb la següent: Exemple 1 bis: Llegim a la premsa una notícia que ens diu que a les proves de selectivitat d'enguany la mitjana de l'examen de matemàtiques ha estat 4,98 i vistes les notes dels nostres 28 alumnes, que ja hem indicat anteriorment i que donen una mitjana de 5,286, pensem que potser han estat significativament millors (de mitjana, és clar). Com ho podem decidir amb l'Excel?
|
||||||||||||
Proves de comparació de dues mostres | ||||||||||||
|
La prova-t per a 2 mostres que es presenta
a continuació té com a finalitat decidir si les diferències que es poden
observar en les mitjanes de dues mostres es poden considerar significativament
diferents per arribar a decidir que les poblacions (o subpoblacions) de
què s'han pres les mostres són diverses pel que fa al caràcter estudiat.
Com la darrera que hem vist, el nom de proves t els ve del fet que els estadístics que s'estudien corresponen al model donat per la distribució t de Student. Prsentareu l'estudi amb l'Excel mitjançant la funció PRUEBA.T. Podeu veure que a Herramientas | Análisis de datos també hi ha incloses les proves que veureu en aquest apartat i al següent, però, tanmateix, s'ha optat per la via indicada, perquè la sortida de resultats se situa en un marc molt més concret: ens dóna simplement el valor p que ens permet treure la conclusió que volem, amb el benentès que la hipòtesi nul·la estableix la igualtat de mitjanes. Necessitem proves fefaents (un valor p molt baix) per dubtar del model establert i considerar significatives les diferències de valors observades.
Exemple 2: Després d'analitzar les notes dels nostres alumnes
a les PAU, que hem vist a l'exemple anterior, ens assabentem de les notes
obtingudes a la mateixa prova pel conjunt d'alumnes d'un institut proper;
com a infromació suplementària sabem que els correctors han estat diferents.
Si es calcula la mitjana d'aquell centre, es veu que és millor que la del nostre (exemple 1). La prova que ara plantejarem tendeix a contestar la pregunta següent: La diferència observada, és significativa dels del punt de vista estadístic?
El quadre de diàleg que apareix quan es fa Insertar | Función | PRUEBA.T és el següent:
Podeu veure de seguida que al tercer requadre se'ns demana el nombre de cues amb què es vol aplicar la prova. Aquest fet concorda amb el fet que en algunes proves d'hipòtesis convé proposar una hipòtesi alternativa, que és la que interessa acceptar en cas de rebutjar la hipòtesi nul·la. Recordeu que a la prova que ara estudiem la hipòtesi nul·la és Igualtat de mitjanes de les poblacions. Una formulació de la hipòtesi alternativa és Les mitjanes de les poblacions són significativament diferents, però, en canvi, en la majoria de situacions pràctiques, interessa més una formulació del tiups La mitjana de la segona població és significativament més gran que la mitjana de la primera. La primera d'aquestes formulacions es diu una prova de dues cues, i la segona formulació (la que els autors aconsellen en tots els exemples que presenten) és una prova d'una cua. Aquesta consideració té relació amb el resultat que s'obté per al valor p i també enllaça amb un concepte anomenat la potència d'un test:
|
|||||||||||
El darrer argument de PRUEBA.T fa referència al Tipo de prueba i enllaça amb el fet que aquesta prova té diverses versions que s'apliquen en situacions conceptualment diferents. A part de la de dades emparellades, que es comenta a l'apartat següent de la pràctica, la prova t per a dues mostres independents també té dos plantejaments teòrics diferents: un d'ells treballa amb la hipòtesi es poden suposar variàncies iguals per a les poblacions (o subpoblacions) on s'han recollit les dades de les dues mostres, i en l'altre plantejament aquesta assumpció no es pot fer. Convé comentar l'existència d'aquestes dues situacions tot i que, pels objectius i les possibilitats del curs, segurament n'escapa el plantejament teòric de cada cas. Heu de saber que hi ha una prova de contrast que permet contrastar numèricament la plausibilitat de la suposició d'homogeneïtat de les variàncies.
|
||||||||||||
|
Exemple 3:
Vegem com s'arriba a les respostes.
Com que esteu "lluitant" contra la hipòtesi nul·la que indica que no es pot pressuposar diferència significativa de mitjanes i, en canvi, heu observat un valor p molt petit, la conclusió que podeu treure és que la diferència de mitjanes és significativa.
En altres programes estadístics, es permet entrar
com a dades per a l'aplicació de la |
|||||||||||
Proves relatives a dades emparellades | ||||||||||||
Al final del document d'introducció al món
de l'estadística, es comentava que l'experimentació estadística difereix
de la simple observació pel fet que l'experimentador controla o manipula
l'entorn en què es mouen les unitats estadístiques. Sovint, llavors, cal
fer dues observacions dels elements estadístics, una d'inicial i l'altra
després d'aplicar el tractament o l'experimentació que s'ha dissenyat.
En aquest tipus de situacions, també hi té el seu àmbit d'aplicació la PRUEBA.T de l'Excel. Abans de passar a un exemple pràctic, és important reflexionar sobre el fet que les proves de dues mostres que hem vist fins ara fixaven l'atenció en la globalitat de les observacions en cada mostra, independentment les unes de les altres. En canvi, ara veureu una prova que tracta les dades d'una mostra i de l'altra no de manera independent, sinó emparellades. Més que una prova de dues mostres, doncs, seria més encertat dir que farem una prova per a una mostra bivariant, i l'estudi que es fa, doncs, es pot complementar en certa manera amb un estudi de la correlació i la regressió lineal. Exemple 4: Estudiareu les dades incloses en el llibre MATE1.XLS del qual podeu llegir la descripció detallada. Ara fixareu l'atenció en les variables NOTA1, NOTA2 i NOTA3 que corresponen a les qualificacions en:
Segona qüestió: Va ser realment eficaç el plantejament didàctic? Atenent a la idea que interessava que l'alumnat sabés sempre aquestes qüestions operatives bàsiques, era cert, això, quan ja no es treballaven els temes explícitament?
Per acabar, insistim que aquesta versió de la prova analitza la informació molt més a fons que un simple contrast de mitjanes com els que hem vist a la segona part de la pràctica. No solament mirem si el grup, com a col·lectiu, va millorar, sinó que hem fet un experiment del tipus mesura abans --> tractament --> mesura després i hem estudiat el comportament alumne per alumne (dades emparellades) |
||||||||||||
Ampliacions, aclariments i comentaris | ||||||||||||
Proves de contrast de la mitjana versus interval de confiança en l'estimació
És interessant comentar que la fonamentació teòrica d'aquestes proves que ara es presenten i la del problema d'estimació de la mitjana d'una població tenen certa similitud, però adopten punts de vista diferents.
Ambdues situacions es basen en l'estudi de la variabilitat de l'estadístic mitjana mostral que s'estudia a bastament al mòdul següent. Si el model de la població (en particular la mitjana) és conegut i l'interval de confiança per a l'estimació de la mitjana conté el valor conegut d'aquesta dada, no podem dubtar significativament d'aquell model. |
||||||||||||
Prova d'homegeneïtat de les variàncies
Per aplicar una versió o l'altra de la prova-t per a dues mostres, cal basar-se en la plausibilitat o no d'un model donat per variàncies iguals en els dos processos de recollida de dades. L'Excel incorpora una prova estadística que permet contrastar el grau de significació d'aquesta hipòtesi. Per aplicar aquesta prova, cal tenir les dues mostres en rangs diferents i llavors la manera més ràpida és fer servir la funció PRUEBA.F, a la qual hem d'entrar com a arguments els dos rangs on tenim una mostra i l'altra i ens retorna el valor p de la prova que pren com a hipòtesi nul·la la homogeneïtat de les variàncies.
|
||||||||||||
Sobre la potència d'una prova estadística
Pareu atenció a les diferents situacions que es poden donar en un contrast d'hipòtesis estadístiques:
Ja hem comentat en el document de fonaments Els contrastos d'hipòtesis que, de les dues decisions errònies, es considera conceptualment molt més seriosa la que ens fa rebutjar H0 quan de fet és certa. Habitualment, una decisió d'aquest tipus rep el nom d'error de tipus I. A partir d'aquesta idea, recordeu que el valor p dóna la probabilitat de caure en un error del tipus I i ens permet determinar el nivell de significació del test. Fixeu-vos ara en l'altra decisió errònia que es pot prendre: no encertar a rebutjar H0 i donar validesa a la hipòtesi alternativa quan, de fet, això seria el que escauria. És per això que s'introdueix el concepte de potència d'un test que mesura la capacitat d'encert del test.
Tanmateix, s'ha de considerar que moltes vegades la hipòtesi
alternativa no és tan concreta com la hipòtesi nul·la,
i pot costar descobrir-la. Per exemple, si la hipòtesi nul·la
és mitjana=0, aquesta afirmació és molt més
concreta, per exemple, que mitjana > 0. Pot ser que la mitjana, de
fet, sigui molt poc diferent de 0, el test no encerti a descobrir-ho i
cometem un error del tipus II. Per això, un mateix test encaminat
a contrastar el valor d'un paràmetre estadístic té
diferents valors de la potència, un per cada possible valor del
paràmetre que faci vàlida la hipòtesi alternativa;
de fet, doncs, el concepte de potència ens porta a definir una
funció, i el seu gràfic es coneix com a corba de potència
del test. |
||||||||||||
ANOVA
Es pot dir, en una primera visió intuïtiva, que les tècniques estadístiques conegudes com a ANOVA (anàlisi de la variància) generalitzen la prova t quan s'aplica al contrast de les mitjanes de dues subpoblacions, en el cas en què es vol estudiar globalment la variació de les mitjanes entre grups diversos d'una població donats per una variable categòrica. De fet, en aquesta primera passada, es pot dir que seria més encertat designar aquest estudi com a anàlisi de la variació de les mitjanes entre grups. Es constata que, sovint, el fet que hi hagi més de dos grups fa que les variacions observades d'un grup a un altre o dintre de cada grup no siguin tan importants estadísticament com si només s'analitzessin dos grups.
Quina era la hipòtesi nul·la? Que les quatre mostres procedien de subpoblacions que es podia pressuposar que tenien la mateixa mitjana. Quina conclusió traiem de l'ANOVA que hem tret en pantalla? Que la hipòtesi nul·la té un alt grau de significació; no la podem rebutjar. Es podria pensar que aquest resultat és contradictori amb el que hem vist sobre les mitjanes de lletres i de ciències. Però no es així: el fet de considerar quatre grups aporta informació totalment diferent en el cas en què considerem només dos grups. Podeu provar de fer únicament dues columnes, enganxant la 1 amb la 2, i la 3 amb la 4, i fer una ANOVA només amb dos grups, i veureu que, en aquest cas, la conclusió és ben bé la mateixa que amb la prova t de dues mostres. |
||||||||||||