Enrera
Mòdul 6
Estadística amb el full de càlcul: usos didàctics
  Pràctica
1
2
3
4
5
6
   
Exercicis
Exercicis
  Els contrastos d'hipòtesis. La prova khi quadrat  Documentació
Glossari
Glossari
  Proves de normalitat   Documentació
 
 
Anàlisis de taules creuades amb
   

A l'apartat corresponent del document de fonaments teòrics d'aquest mòdul, s'ha presentat l'estudi de la prova de khi quadrat per a l'anàlisi de taules creuades en dos supòsits: per analitzar la consistència de la hipòtesi de la independència de les dues variables o bé la de la homogeneïtat de la resposta (d'una variable respecte a les categories de l'altra).

També s'ha raonat que el càlcul de les freqüències esperades dóna el mateix en un cas que en l'altre. Per això, en aquesta pràctica ens limitarem a exposar les diverses maneres que té l'Excel per aplicar la prova de khi quadrat segons la presentació de les dades i a interpretar la sortida d'informació que fa el programa. Els objectius són:

  • Aprendre a calcular les freqüències esperades en l'estudi d'una taula creuada.
  • Utilitzar la prova de khi quadrat per analitzar la significativitat de les relacions entre variables categòriques.
   
Pràctica Estudi a partir de les dades individuals
   

A la pràctica 1 del mòdul 3, heu elaborat diferents taules creuades a partir de les dades del fitxer BAT2.XLS. Ara en construireu una que relacioni la variable OPCIÓ (de batxillerat) amb la variable TORN (diürn o nocturn). Tot seguit, aplicareu la prova khi quadrat per esbrinar si podem concloure o no que la tria del torn és homogènia respecte a l'opció escollida. Per tant, la hipòtesi nul·la és la de l'homogeneïtat. Es tracta, doncs, d'un exemple del que s'ha anomenat anàlisi de l'homogeneïtat de la resposta.

  • Recupereu el fitxer BAT2.XLS tal com l'heu desat al final de la pràctica 1 del mòdul 3.
  • Feu servir l'opció de Taules dinàmiques del menú Datos, com heu fet en pràctiques anteriors, per crear una taula creuada que tingui la variable OPCIÓ a les files, la variable TORN a les columnes. A l'apartat DATOS ha de sortir Contar de... (qualsevol de les variables).
  • Feu que la taula dinàmica creada estigui situada al rang H1:K7 del full Taules creuades que havíeu fet servir a la pràctica 1 del mòdul 3.
  • Copieu el rang H1:J2 sobre H9:J10. Copieu també el rang H3:H6 sobre H11:H14.
  • Entreu a la cel·la I11 la fórmula
    =I$7*$K3/$K$7
    i després copieu-la sobre tot el rang I11:J14.
    Cal que reflexioneu molt bé pel que fa a l'ús de les referències mixtes absolutes/relatives per veure que aquesta fórmula ens dóna la taula dels valors esperats, suposant certa la hipòtesi nul·la. Recordeu del document de teoria que s'ha de multiplicar el nombre total d'elements de la fila pel nombre total d'elements de la columna i dividir pel nombre total de dades.
  • Entreu a la cel·la L1 la fórmula
    =PRUEBA.CHI(I3:J6;I11:J14)
    i vegeu que aquesta funció calcula el valor p corresponent a la prova khi quadrat per la taula de valors observats (rang I3:J6) amb relació a la taula de valors esperats (rang I11:J14). Òbviament, a l'hora de fer els càlculs, aquesta funció ja té en compte que, en aquest cas, cal considerar 3 graus de llibertat.
  • Observeu el valor p que surt. Com que és més gran que 0,05 (nivell de significació), no podem rebutjar la hipòtesi nul·la. Podem concloure que hi ha homogeneïtat entre les variables.

Podeu observar, doncs, que, com en molts altres procediments de l'Excel, per a un treball a partir de les dades individuals, en primer lloc ha fet falta elaborar la taula creuada.

Així, doncs, si voleu examinar la taula creuada feta a la pràctica 1 del mòdul 3, que relaciona la variable OPCIÓ i la variable SEXE de les dades de BAT2.XLS, podeu aplicar el procediment anterior des del moment en què ja teníem feta la taula.

Feu-ho i veureu que, a diferència del cas anterior, el valor p és pràcticament 0. Reflexioneu sobre què ens diu aquest valor p tant petit. Recordeu que en la nostra presentació actual la hipòtesi nul·la és la homogeneïtat de la resposta.

   
 
Pràctica Estudi a partir d'una taula de contingència
   
 

Recordeu l'exemple sobre l'admissió en uns cursos universitaris que es presentava al document de fonaments:

  Aptes No aptes Total
Homes 40 40 80
Dones 20 40 60
Total 60 80 140
  • Entreu en un full nou aquesta taula al rang A1:D4.

La taula creuada ja està feta, per tant, no cal accedir a l'opció de taules dinàmiques. Elaboreu la taula de freqüències esperades suposant homogeneïtat (hipòtesi nul·la).

  • Copieu el rang A1:C1 a A6:C6 i A2:A3 a A7:A8.
  • Entreu a B7 la fórmula =B$4*$D2/$D$4 i copieu-la a B7:C8.
  • Entreu a E1 la fórmula =PRUEBA.CHI(B2:C3;B7:C8).

El valor p surt 0,048606579, que confirma les conclusions ja comentades al document de fonaments. Amb un nivell de significació del 5 % ens podem atrevir a rebutjar la hipòtesi d'homogeneïtat en el tractament, però ben just (hem de comparar el valor p 0,049 amb 0,05).

Nota: En alguns tractats d'estadística el test de khi quadrat en el cas de taules de dues files i dues columnes s'aplica amb l'anomenada correcció de Yates. L' Excel no té en compte aquesta consideració.

   
   
Pràctica Un exemple amb una taula de freqüències
   
  Imaginem un estudi sobre l'hàbit de fumar per sexes. El resultat es presenta d'aquesta manera:

FUM SEX Freq
No Dona 34
No Home 26
Dona 16
Home 21
No Dona 28
No Home 21
Dona 14
Home 19

Aquesta taula, tot i que no correspon a una presentació usual, és fàcilment interpretable i també ho és el fet que acumula les freqüències observades en dos reculls de dades (que podrien correspondre, perfectament, a dos subgrups de la població donats per una altra variable categòrica).
  • Entreu aquesta taula en un full nou de manera que quedi situada al rang A1:C9.
  • Creeu una taula dinàmica amb la variable FUM a les files i la variable SEX a les columnes. En aquest cas, cal que a l'apartat de DATOS situeu la variable Freq, de manera que surti el rètol Suma de freq. Aquesta és l'única diferència entre aquesta forma de presentar les dades i l'anterior. Situeu-la al rang E1:H5.

Elaboreu una taula de freqüències esperades sota la hipòtesi de nul·la homogeneïtat:

  • Copieu E1:G2 sobre E7:G8 i E3:E4 sobre E8:E9.
  • Entreu a F9 la fórmula =F$5*$H3/$H$5, similar a l'exemple anterior. Copieu-la sobre F9:G10. Així queden calculades les freqüències esperades suposant que hi ha homogeneïtat. (hipòtesi nul·la).
  • Entreu a I1 la fórmula =PRUEBA.CHI(F3:G4;F9:G10) per calcular el valor p. Surt 0,066970912.

Si treballem amb el nivell de significació habitual del 5 % (o bé 0,05), com que el valor p és més gran que 0,05, podem concloure que les dades recollides no permeten rebutjar la hipòtesi nul·la.

Conclusió: Les diferències observades pel que fa a l'hàbit de fumar no són significatives estadísticament al nivell de significació del 5 %. Es pot seguir pensant, doncs, que en la població de la qual s'ha pres una mostra, l'hàbit de fumar s'observa homogèniament entre ambdós sexes.

 
Amunt