Enrera
Mòdul 6
Estadística amb el full de càlcul: usos didàctics 
 
   
 

Exercicis

Per enviar les respostes als exercicis elaborareu un document amb el processador de textos en què:

  • Posareu un títol per a cada exercici (no cal que hi copieu els enunciats).
  • Escriureu les respostes numèriques concretes que es demanen i redactareu, breument, els comentaris adients.

En aquest mòdul, com en tots els mòduls del curs, heu d'enviar les respostes a un mínim de sis exercicis amb les consideracions següents:

  • Els exercicis que concreten el treball de les quatre primeres pràctiques i del document teòric sobre contrastos d'hipòtesis i la prova de khi-quadrat són els nou que estan numerats com 1.I, 1.II, 1.III, 2.I, 2.II, 2.III, 2.IV i 3.I i 3.II.
    • Si n'envieu 6 d'entre els anteriors, amb el benentès que n'hi ha d'haver com a mínim un dels 1.i, un dels 2.i i un dels 3.i "ja heu complert".
    • Els tres exercicis 1.i s'adequen a allò que s'ha explicat en la primera pràctica i el primer exemple de la quarta, l'ajust d'unes dades mitjançant un model "teòric" intuïtiu; els quatre exercicis 2.i corresponen a la recerca d'un model donat per una distribució de probabilitat, com es fa a la pràctica 2; finalment els dos exercicis 3.i tracten de les relacions entre variables, com la pràctica 3 i el darrer exemple de la pràctica 4 i és fonamental entendre'ls bé per la seva aplicació posterior al nostre treball global.
  • Els exercicis 4, 6, 7 i 8 enllacen amb la pràctica 6 que tracta del tema dels contrastos entre mostres diverses de variables numèriques per veure si les diferències que s'observen es poden considerar estadísticament significatives o no. (Ja s'ha dit que el tema es pot considerar d'ampliació però això no vol dir pas que no sigui "important" en les aplicacions estadístiques!... per exemple "el grup A de quart d'ESO és significativament millor que el grup B de quart d'ESO" o qüestions d'aquest tipus, que poden incidir en la nostra tasca quotidiana)
  • L'exercici 5 demana l'aplicació d'alguna de les proves de normalitat explicades al corresponent document teòric i a la pràctica 5. És un exercici d'ampliació.

Si teniu dubtes sobre algun exercici, encara que sigui dels d'ampliació i no el vulgueu enviar resolt, podeu consultar-los per via telemàtica.


En tots els exemples següents, exposeu les conclusions de l'aplicació de la prova de khi quadrat o de les altres proves que es comenten amb un nivell de significació del 5 %, com és norma bastant habitual en els treballs estadístics.


  1. Heu d'enviar com a mínim 1 dels exercicis següents, que valoren el bon ajust (o no) a un model intuïtiu. Els altres són exercicis opcionals.

    1. Creuríeu que és honrat un jugador que juga a tirar dos daus i sumar els punts i treu les freqüències absolutes següents {65, 51, 84} respectivament per a les puntuacions {menys de 7, 7, més de 7} en 200 tirades?
    2. En un institut hi ha 684 alumnes i les freqüències de les dates de naixement mes a mes (donades ordenadament) són les següents: 58, 44, 73, 68, 66, 65, 55, 66, 49, 54, 46, 40. Creieu que es pot acceptar estadísticament una frase que digui: "El nombre de naixements tendeix a ser el mateix cada mes"?
    3. Al web www.onlae.com podeu trobar informació sobre Loterías y Apuestas del Estado. De les taules de dades que apareixien a principis de setembre de 2002 transcrivim la que dóna els nombres ordenats segons la quantitat d'aparicions fins en aquell moment (1.480 sorteigs, sense considerar els nombres complementaris, és a dir, que cal comptar 6 nombres en cada sorteig).

    39
    204
    5
    191
    41
    187
    29
    183
    11
    178
    16
    175
    43
    172
    38
    203
    25
    191
    22
    187
    17
    182
    4
    178
    13
    175
    28
    170
    23
    201
    36
    189
    27
    185
    42
    181
    48
    178
    31
    174
    44
    168
    6
    200
    3
    188
    34
    185
    21
    180
    32
    177
    33
    174
    2
    162
    47
    198
    35
    188
    30
    185
    10
    179
    7
    176
    18
    173
    24
    161
    45
    193
    15
    188
    37
    184
    26
    179
    19
    176
    46
    173
    49
    161
    14
    193
    9
    187
    40
    184
    1
    179
    12
    175
    8
    172
    20
    158

    Proposeu un model intuïtiu que digui quants nombres de cada desena haurien d'haver sortit i feu un contrast d'aquesta hipòtesi mitjançant la prova de khi quadrat. (Penseu que el sorteig es fa sobre els nombres de l'1 al 49; a la primera desena hi ha 10 nombres, de l'1 al 10; el mateix a les altres, excepte a la darrera desena, que només té 9 nombres, del 41 al 49).

  2. Heu d'enviar com a mínim un dels exercicis següents, que valoren el bon ajust (o no) a un model donat per una distribució de probabilitat (i un d'ells avança cap a la comparació de mostres). Els altres són exercicis opcionals.
    1. Per fer una comprovació de la (suposada) telepatia existent entre dues germanes bessones, es fa 48 vegades la prova de fer que una d'elles escrigui una llista de 10 símbols, cadascun d'ells a triar entre 5 símbols concrets, i l'altra miri d'encertar quina llista ha escrit la seva germana. Resulta que només 1 vegada no ha encertat cap símbol; 11 vegades n'ha encertat 1; 13 vegades n'ha encertat 2; 12 vegades n'ha encertat 3; 6 vegades n'ha encertat 4; 3 vegades n'ha encertat 5; 1 vegada n'ha encertat 6, i 1 vegada n'ha encertat 7. Amb la prova de khi quadrat, podem trobar arguments significatius per defensar que hi ha telepatia? (Hipòtesi nul·la: no hi ha telepatia; llavors, el model seria la distribució binomial amb n = 10 i p = 1/5=0,2.)
    2. Quina de les dues variables, nombre de germans o bé nombre de germans sense comptar l'alumne, us sembla més plausible que es pugui ajustar per una distribució de Poisson? Per què? (Penseu en el valor 0.) Estudieu numèricament la bondat de l'ajust a dades recollides en una classe vostra, o bé en el fitxer TERCERJM.XLS que forma part dels materials del curs.
    3. Volem aplicar la prova de khi quadrat per tal d'ajustar, mitjançant la distribució de Poisson, les dades de l'exemple del nombre de morts per una coça de cavall a l'exèrcit prussià. Prèviament, a partir de les dades, hem d'estimar la mitjana d'aquesta distribució i, per altra banda, cal ajuntar algunes classes per respectar al màxim les precisions amb què cal aplicar la prova.
      • Amb quants graus de llibertat cal aplicar la prova i quin valor p resulta?
      • Quina interpretació té el fet que resulti un valor p tan gran?
    4. Accidents mortals.
      Estudieu les dades sobre la freqüència d'accidents mortals de trànsit durant els anys 1982 o 1983 (consulteu el fitxer MORACC.XLS i la pràctica 2).
      • Es poden ajustar mitjançant una distribució de Poisson?
      • Estudieu algun procediment per decidir si hi ha diferències significatives entre les dades d'un any i les de l'altre.

  3. Heu d'enviar com a mínim un dels dos exercicis següents sobre taules de doble entrada. L'altre és un exercici opcional.
    1. Comproveu amb la funció PRUEBA.CHI( ) la independència de les variables color dels ulls i grup d'alçada de l'exemple que il·lustrava el test d'independència en la introducció teòrica d'aquest mòdul.
    2. Al fitxer NOTES.XLS hi ha consignades les notes de català, castellà i matemàtiques d'un nombrós grup d'alumnes. Doneu un raonament estadístic que justifiqui la no-acceptació de la hipòtesi d'independència entre la variable nota de català i la variable nota de matemàtiques.

  4. (Exercici opcional) Descriviu un estudi amb dades del vostre centre en què escaigui aplicar alguna de les proves explicades a la pràctica 6. Tot seguit, entreu les dades en un llibre de l'Excel (que no cal que ens envieu!) i expliqueu els resultats obtinguts i les conclusions que heu tret.

  5. (Exercicis opcionals: podeu enviar-ne un, cap o més d'un) Apliqueu alguna prova de normalitat (i en un cas, de confrontació de mitjanes) a alguna de les situacions següents. Cal que expliqueu quina prova heu fet servir i com arribeu a la vostra conclusió:
    1. La plausibilitat de l'ajust mitjançant la distribució normal de les variables PROVA i EXP a partir de les dades obtingudes del fitxer PAU.XLS a la pràctica 4 del mòdul 2. Estudieu també si hi ha diferències significatives entre aquestes dues variables i expliqueu quin procediment heu seguit per decidir-ho.
    2. Quina de les variables, ALT1, ALT2, ALT3, del fitxer DADES74.XLS es pot ajustar millor per una normal? Creieu que hi ha raons intuïtives que justifiquin la resposta?
    3. Creieu que la variable que dóna la puntuació total en la prova Cangur de l'SCM es pot ajustar mitjançant una distribució normal per algun dels nivells de la prova (fulls del llibre CANGUR.XLS) ?

  6. (Exercici opcional) Feu les proves que cregueu convenients i expliqueu quin estudi i quina prova heu fet i quines conclusions traieu per estudiar si hi ha diferències significatives entre les dades següents en el fitxer DADES74.XLS:
    1. Les altures de la variable ALT1 i les d'ALT3
    2. Les altures de la variable ALT2 i les d'ALT3
    3. Les altures dels nois i les altures de les noies a ALT1
    4. Les altures dels nois i les altures de les noies a ALT3

  7. (Exercici opcional) Ajunteu en un sol full les dades dels fulls LL85, LL86 i SAL85 del fitxer TEMPS.XLS. Apliqueu la tècnica explicada per al contrast de dades emparellades a la pràctica 4 per decidir si:
    1. Es pot dir que hi va haver diferències significatives de temperatura a la Llacuna l'any 1986 i l'any 1985?
    2. Es pot dir que hi va haver diferències significatives de temperatura a la Llacuna i a Saldes l'any 1985?

  8. (Exercici opcional) Apliqueu proves de dues mostres per justificar la diferència significativa entre qualsevol de les tres varietats de lliris incloses al fitxer IRIS.XLS. (Alternativament, també podeu fer una prova ANOVA després de desapilar convenientment les dades.)
 
Amunt