Enrera
Mòdul 3
Estadística amb el full de càlcul: usos didàctics  
  Pràctica 1 2
3
4
5
6
 
 
 
Exercicis
Exercicis
  L'estadística bivariant Documentació    
 
   
Glossari
Glossari
 
 
 
   
Recursos didàctics per a l'estadística bidimensional
   

L'objectiu d'aquesta pràctica és presentar aplicacions elaborades en l'entorn Excel o amb la calculadora Wiris, que ajuden a treballar els continguts de l'estadística bivariant des d'un punt de vista pràctic i també conceptual.

En concret, les aplicacions amb què treballareu són:

  • ESTADISTICA.XLS. És un llibre de l'Excel que funciona com un programa tancat, de manera que l'usuari només ha d'entrar les dades que vulgui estudiar i ha d'interpretar els resultats numèrics i gràfics que surten.
  • CORREGL.HTM obre un tauler gràfic de la calculadora Wiris del portal edu365.com que permet (a part de copsar que la Wiris és molt més que una calculadora) interactuar sobre un núvol de punts i estudiar aspectes conceptuals sobre la correlació lineal. La segona part d'aquesta pràctica us proposa algunes activitats guiades en aquest sentit.

Amb aquestes activitats es persegueixen els objectius següents:

  • Treballar de manera interactiva diferents aspectes de la correlació i la regressió lineal.
  • Reflexionar sobre les possibilitats didàctiques dels recursos presentats.
 

Pràctica
Núvol de punts, covariància i correlació lineals amb ESTADÍSTICA.XLS
   
 

Heu d'obrir el fitxer ESTADÍSTICA.XLS que hi ha a la carpeta habitual dels fitxers de treball. Pera l'activitat que proposem seguidament no és convenient obrir el fitxer de l'Excel des de l'Explorer.

En obrir-lo, cal que premeu el botó Habilitar macros. D'aquesta manera, totes les macros estan actives.

A la pantalla principal apareix un índex amb els diferents fulls de què consta aquesta aplicació. Per accedir a cadascun d'ells, cal que cliqueu a l'etiqueta corresponent que surt a la part inferior de la pantalla. En aquest cas, seleccioneu Correlació i regressió.

Aquesta aplicació és un full de càlcul que pot ser útil per analitzar la correlació lineal entre dues variables i per trobar l'equació de la recta de regressió. Les dades que vulgueu analitzar s'han de situar a la regió B4:C203. Permet, per tant, estudiar fins a 200 parells de dades. Aquestes dades es poden introduir directament a les cel·les corresponents o bé copiar-les, totes de cop, des d'una base de dades o des d'un altre full de càlcul.

Una vegada entrades les dades, el full calcula les mitjanes i desviacions estàndards de cada variable, així com també la covariància i el coeficient de correlació lineal. Fa la representació gràfica triada i, amb uns botons que apareixen sota del gràfic, es pot triar molt ràpidament l'escala més convenient per a una bona visió del núvol de punts. També es poden superposar uns eixos que passin pel punt mitjà i, d'aquesta manera, apreciar millor el tipus de correlació lineal de les variables. Si s'ha triat la representació d'alguna recta de regressió, el full de càlcul en mostra l'equació. A continuació, es poden fer prediccions a partir de la regressió calculada. En entrar un valor per a una de les variables, el full calcula, seguint la recta corresponent, la seva imatge i la representa en el gràfic. A més, els punts del núvol poden ser desplaçats directament amb l'ajuda del ratolí. Aquest desplaçament provoca que es modifiquin els valors corresponents de les variables i, per tant, es tornin a refer tots els càlculs. Aquesta possibilitat permet dissenyar diferents formes de núvols de punts per aconseguir uns determinats valors per al coeficient de correlació lineal.

A continuació, practicareu algunes d'aquestes possibilitats amb les dades de pes i altura dels nois i les noies de 14 anys del fitxer DADES74, expressades en diferents unitats, així com les havíeu enregistrat al final de la pràctica 3.

  • Obriu, si no ho heu fet ja, el full Correlació i regressió del llibre ESTADÍSTICA.
  • Assegureu-vos que el rang d'entrada de dades (B4:C203) del full Correlació i regressió està buit (botó Esborrar-ho tot).
  • Seleccioneu d'Opció gràfica l'opció Només núvol de punts (desplegable situat a E11:G11 d'aquest full).
  • Sense tancar ESTADÍSTICA.XLS, obriu el fitxer DADES74.XLS.
  • Seleccioneu les dades de PES1 (rang B2:B111 del full DADES74). Premeu Control + C per començar la còpia d'aquestes dades.
  • Seleccioneu la cel·la B4 del full Correlació i regressió del llibre ESTADÍSTICA i accediu a Edición | Pegado especial | Valores. Heu fet la còpia de dades d'aquesta manera per no canviar el format de la columna B. Recordeu que per passar d'un llibre a un altre ho heu de fer a través del menú Ventana.
  • Feu més o menys el mateix per copiar les dades de ALT1(rang D2:D111 del full DADES74) a partir de C4 del full Correlació i regressió.

Ja s'han calculat les mitjanes i les desviacions estàndard de les dues variables. També hi apareixen el nombre de dades, la covariància i el coeficient de correlació lineal.

En el gràfic, podeu veure el núvol de punts. Aquesta visió es pot modificar:

  • Premeu el botó Eixos optimitzats.
  • Per tornar a la visió anterior, premeu el botó Eixos automàtics.

En aquest cas, és millor tenir activats els Eixos optimitzats.També podeu entrar diferents valors a la taula del rang F22:G24 i prémer, a continuació, el botó Eixos manuals. El núvol de punts il·lustra la covariància i el coeficient de correlació lineal. Tot i així, podeu representar uns eixos que estiguin centrats en el punt mitjà:

  • Premeu el botó Eixos punt mitjà. Observeu com estan distribuïts els punts en els diferents quadrants:

Tot seguit, entreu les dades expressades en lliures i peus. Però, abans, és convenient guardar alguns paràmetres actuals i el gràfic.

  • Sense tancar res, obriu el Word.
  • Seleccioneu tot el gràfic del núvol de punts i premeu Control + C per iniciar la còpia.
  • Seleccioneu la pàgina en blanc del Word i premeu Control + V. Així, podeu guardar el gràfic independentment del full de càlcul.
  • Copieu també la covariància i el coeficient de correlació lineal.

Esborreu aquestes dades i entreu les altres:

  • Premeu el botó Esborrar-ho tot.
  • Entreu, copiant-les de la manera habitual, les dades del pes i l'altura expressades en lliures i peus, com ho heu fet abans. Les trobareu al rang E2:F111 del full DADES74.
  • Premeu Eixos optimitzats i Eixos punt mitjà.
  • Copieu el gràfic, la covariància i el coeficient de correlació lineal a la mateixa pàgina del Word i compareu-los.

Fixeu-vos que els dos gràfics són pràcticament idèntics, el coeficient de correlació lineal és el mateix i, en canvi, les covariàncies són diferents.

Amb aquest exemple constateu allò que ja s'ha explicat en el document teòric: la covariància està molt influïda per les unitats amb què s'expressen les mesures i és difícilment interpretable intuïtivament. En canvi, el coeficient de correlació és intrínsec de la relació entre les variables.

 
Pràctica
Regressió i predicció de valors amb ESTADÍSTICA.XLS
   
 

En aquest apartat s'insisteix en el concepte de regressió lineal a partir de l'anàlisi de la relació entre les alçades d'uns pares i dels seus fills, i es treballa la possibilitat de fer prediccions a partir de la recta de regressió. En un estudi similar, Francis Galton (1822-1911), a finals del segle XIX, va utilitzar per primer cop el terme regressió, com ja s'ha comentat al final de la pràctica 5.

  • Premeu el botó Esborrar-ho tot del full Correlació i regressió
  • Prement les fletxes de la part inferior esquerra de la pantalla, accediu al full GALTON, l'etiqueta del qual està més a la dreta de la del full actual. Aquest  conté les alçades mitjanes, mesurades en centímetres, de 29 pares i les dels seus fills. 
  • Copieu les dades del full GALTON al rang d'introducció de dades del full Correlació i regressió com heu fet a la pràctica anterior. 
  • Trieu l'opció gràfica y = ax + b de la finestra desplegable. 
  • Premeu el botó eixos optimitzats

Fixeu-vos en les mitjanes i les desviacions estàndards. En la mitjana, els fills són més alts que els pares i tenen una desviació estàndard molt similar. El coeficient de correlació lineal és bastant alt. Apareix l'expressió de la recta de regressió.

  • Situeu el cursor a la cel·la E15 per fer prediccions d'alçades dels fills a partir de les alçades dels pares, tot seguint la recta de regressió y = ax + b
  • Ens preguntem quina alçada cal esperar que tinguin els fills d'uns pares de 155 cm o de 171 cm o de 190 cm. Per esbrinar-ho, entreu a les cel·les E15, E16 i E17 les alçades 155, 171 i 190 centímetres respectivament. Observeu les alçades dels fills que surten a les cel·les F15, F16 i F17. Al gràfic podeu observar com s'han calculat aquestes prediccions. 

Si us hi fixeu, els pares molt baixos tendeixen a tenir, en mitjana, fills molt més alts que ells; mentre que pares molt alts, segons aquest model, tindrien fills no tan alts com ells. Aquest fenomen es coneix com a regressió cap a la mitjana i va ser descrit per Galton. 
 
Pràctica
Exemples amb ESTADÍSTICA.XLS per interpretar el coeficient de correlació
   
 

En aquesta pràctica podeu analitzar tres exemples de núvols de punts en què, tot i que el seu aspecte gràfic és molt diferent, tenen aproximadament el mateix coeficient de correlació lineal (r = 0,816). Utilitzeu els fulls A, B i C del mateix llibre. Les seves etiquetes es troben més a la dreta de la del full actual.

  • Analitzeu consecutivament la correlació lineal de les dades dels fulls A, B i C d'aquest mateix llibre. 
  • Observeu que, tot i que tenen gràfics ben diferents, els coeficients de correlació lineal i les rectes de regressió són pràcticament iguals. 

Com es pot veure, en algunes ocasions i sobretot si tenim poques dades, el valor de r no ens acaba de donar prou informació sobre la relació que hi ha entre dues variables. En aquests casos, el gràfic complementa prou bé aquesta informació. 

Aquesta aplicació permet moure els punts del núvol i, d'aquesta manera, comprovar com varien els paràmetres d'acord amb aquests canvis. Ho podeu provar amb qualsevol d'aquests exemples:

  • Feu clic diferents cops a sobre el punt que heu de desplaçar fins que el cursor es transformi en una creu amb les puntes en forma de fletxa. 
  • Desplaceu el punt, amb el botó esquerre del ratolí premut, verticalment i/o horitzontalment i, en deixar anar el botó, observeu com varien els paràmetres calculats.
 

Pràctica
Reflexions sobre el coeficient de correlació
   
  En aquesta part de la pràctica es presenta un tauler gràfic interactiu elaborat amb la calculadora Wiris del portal educatiu edu365.com que permet reflexionar sobre el valor del coeficient de correlació d'una distribució bidimensional i interpretar-lo adequadament.

D'aquesta manera, es complementa la tasca que es feia a la primera part de la pràctica amb ESTADISTICA.XLS. Heu vist que aquest llibre de l'Excel permet gestionar eficaçment un conjunt de dades i fer tots els càlculs i gràfics relacionats amb l'estadística bidimensional i, a més, us ha ajudat a fer unes reflexions conceptuals que ara reprendreu. A l'activitat que ara proposem es posa totalment l'èmfasi en les reflexions didàctiques.

Experimentareu sobre el núvol de punts d'un conjunt de 15 dades estadístiques bivariants, on podreu moure lliurement els punts i, en cada moment, es mostraran unes paral·leles als eixos de coordenades fetes pel punt mitjà de la distribució i també la recta de regressió.

Accedireu a cinc propostes successives, redactades com una activitat didàctica per a alumnes, amb la finalitat que reflexioneu pel que fa als aspectes següents:

  • No es poden treure conclusions rigoroses de l'estadística bivariant feta amb poques dades. Un canvi en un valor atípic pot fer variar substancialment el valor del coeficient de correlació.
  • La disposició dels punts en els quadrants determinats per les paral·leles als eixos dibuixades pel punt mitjà de la distribució ens ajuda a interpretar el signe del coeficient de correlació.
  • El coeficient de correlació lineal estudia, com el seu nom indica, la tendència a la consistència del model lineal per representar la relació entre dues variables. El valor del coeficient de correlació no indica res sobre altres tipus de relació.
  • El signe del coeficient de correlació i el del pendent de la recta de regressió coincideixen, cosa que no implica res sobre els seus valors absoluts.
  • L'existència de subpoblacions clarament diferenciades en un conjunt de dades treu tota significació estadística al coeficient de correlació.

Podeu començar l'activitat, amb el benentès que heu de tenir instal·lada la versió local de la Wiris o bé treballar en línia.

Si escriviu un comentari de l'activitat amb la Wiris (o de l'anterior amb l'aplicació ESTADÍSTICA.XLS), aquesta tasca pot ser un dels exercicis opcionals d'aquest mòdul.

   
 
Amunt