Enrera
Mòdul 3
Estadística amb el full de càlcul: usos didàctics  
  Pràctica 1 2
3
4
5
6
 
 
 
Exercicis
Exercicis
  L'estadística bivariant Documentació    
 
   
Glossari
Glossari
 
 
 
Regressió lineal i predicció de valors
   

En aquesta pràctica es presentaran les eines fonamentals d'anàlisi de la regressió des d'un punt de vista descriptiu. Els objectius són:

  • Trobar la recta de regressió de dues variables.
  • Representar la recta de regressió.
  • Fer prediccions a partir d'aquesta recta.
S'utilitzarà el fitxer DADES74.XLS, tal com l'heu guardat en acabar la pràctica anterior, després d'inserir unes columnes que no figuraven en el fitxer inicial. Tots els materials del curs estan redactats "com si" les pràctiques s'anessin fent successivament en l'ordre en què es presenten. A més, sempre s'imagina (a no ser que s'indiqui el contrari) que en acabar cada pràctica es guarda la feina feta.
 
Pràctica
Representació gràfica de la recta de regressió
   
 

Si estudieu, en el fitxer DADES74, la correlació entre les variables PES1 i PES3 (pes dels nois i les noies de 14 anys i el pes corresponent als 16 anys) resulta –com era d'esperar– una correlació lineal ben elevada: el coeficient de correlació lineal surt 0,837 (heu arribat a aquest resultat?; ho podeu fer seguint les indicacions de la pràctica anterior). Això vol dir que el model lineal és prou correcte per representar la relació entre aquestes variables.

Si repetiu aquests procediments amb altres parelles de variables del full DADES74, us podeu adonar que és ben cert allò que diuen els tractats d'estadística sobre l'elevada correlació que hi ha, en aquesta etapa del desenvolupament del cos, entre l'alçada d'una persona i la seva envergadura.

Feu una representació gràfica del núvol de punts associat:

  • Creeu un full nou en aquest mateix llibre i anomeneu-lo Regressió.
  • Seleccioneu el rang B2:B111 del full DADES74 (dades de la variable PES1), premeu la tecla Control i, sense deixar de prémer-la, seleccioneu el rang J2:J111 (dades de la variable PES3). Tot seguit, seguiu les instruccions de la pràctica anterior per fer el gràfic del núvol de punts relatius a aquestes variables. Situeu el gràfic en el rang A1:E20 del full Regressió.

Núvol de punts del pes a 14 i a 16 anys

A continuació, representareu la recta de regressió corresponent:

  • Per representar la recta de regressió, cal fer clic sobre els punts del gràfic fins que quedin seleccionats i, a continuació, prémer el botó dret del ratolí. Trieu l'opció Agregar línea de tendencia del menú que ha aparegut. 
  • Fixeu-vos en el contingut de la fitxa Tipo. Com podeu veure, podríeu triar diferents tipus de regressió. Trieu la Lineal i accediu a la fitxa Opciones
  • És convenient entrar el nombre 5 o 6 en els apartats Extrapolar Hacia adelante i Hacia atrás. D'aquesta manera la recta sobrepassa 5 o 6 unitats per sobre i per sota el núvol de punts. 
  • Si premeu Aceptar (o equivalent) la recta ja apareix en el gràfic. Si no us agrada el disseny, el podeu modificar, seleccionant-la, prement el botó dret del ratolí i accedint a l'opció Formato de línea de tendencia.
  • Si voleu que es vegi l'equació de la recta en el gràfic, cal que activeu l'opció Presentar ecuación en el gráfico. Premeu Aceptar.
  • L'equació que surt en el gràfic es pot canviar de lloc seleccionant-la i movent-la amb el ratolí. També podeu canviar-ne el format, seleccionant-la, prement el botó dret del ratolí i accedint al menú corresponent.

Recta de regressió

Si estudiéssim per separat el grup dels nois i el de les noies, arribaríem a conclusions molt diferents? Aquesta qüestió l'analitzareu a la pràctica 5.

 
  Càlcul de la recta de regressió
   
 

A més d'aconseguir que l'equació de la recta de regressió surti al gràfic, es pot també calcular de manera independent d'aquest.

  • Per calcular el pendent de la recta de regressió, heu de fer servir la  fórmula, introduint-la en una cel·la qualsevol del mateix full on teniu les dades, =PENDIENTE(J2:J111;B2:B111). Aquesta funció calcula el pendent de la recta de regressió de Y sobre X. Fixeu-vos que primer s'ha d'escriure el rang corresponent a la segona variable (Y) i després el de la primera (X). 

  • Per calcular el terme independent, feu servir la fórmula:

=INTERSECCION.EJE(J2:J111;B2:B111)

Aquí també val el comentari fet anteriorment sobre l'ordre d'escriptura dels diferents rangs.

També podeu aprofitar l'expressió de la recta de regressió que surt al gràfic, copiant-la per incorporar-la al full Regressió:

  • Entreu a F1 del full Regressió el rètol Recta de regressió (per exemple en negreta perquè destaqui bé.)
  • Cliqueu sobre l'expressió de la recta de regressió que surt al gràfic. Ha sortit un requadre que la selecciona. Després d'una pausa, torneu a clicar-hi.
  • Prement el botó esquerre del ratolí, seleccioneu tot l'expressió i premeu Control + C, per començar la còpia.
  • Seleccioneu la cel·la F2 i premeu Control + V per enganxar l'expressió.
    Ha d'haver quedat així:

Heu de tenir en compte que aquesta expressió copiada és un simple rètol i no té cap propietat operativa. Si es fes algun canvi en les dades inicials, l'expressió de la recta de regressió del gràfic canviaria, però la còpia feta al full no.

 
  Predicció del valor d'una variable de resposta a partir del valor d'una variable predictora
   
 

Si una persona a 14 anys pesa 60 kg (PES1), quant podem predir que pesarà a 16 anys (PES3)?

Per a l'anàlisi d'una pregunta com aquesta des del punt de vista descriptiu, hem de tenir en compte que una primera manera de fer-ho és observar totes les persones amb PES1 = 60 kg, analitzar-ne el PES3 i fer la mitjana. Aquesta seria la resposta, que caldria donar amb un marge d'error o bé mitjançant un interval de confiança, com veurem al mòdul 7

Una tasca semblant a aquesta es fa amb la recta de regressió. Si calculem el valor de l'ajust substituint en l'expressió coneguda de la recta de regressió x = 60 kg, el valor resultant és la predicció que podem fer per al PES3.

Obtindríem   y ajust = 11,69 + 0,92·60 = 66,4 kg

Si ho voleu calcular fent servir l'Excel:

  • Entreu a G4 i I4 del full Regressió els rètols PES1 i PES3 en negreta, respectivament.
  • Entreu 60 a G5.
  • Entreu a I5 la fórmula =PRONOSTICO(G5;Dades74!J$2:J$111;Dades74!B$2:B$111). Aquesta funció fa una predicció a partir del valor introduït a G5, tot seguint el model de la recta de regressió calculada a partir de les dades del rang J2:J111 (pes als 16 anys) i del rang B2:B111 (pes als 14 anys) del full Dades74. Els símbols $ indiquen les referències absolutes i són necessaris per poder copiar aquesta fórmula a la resta de la columna.
  • Si voleu fer més prediccions, només cal que entreu un nou valor per sota de G5 i copieu la fórmula de I5 a la fila corresponent.

Sembla clar que per poder fer una predicció més acurada, hauríem de restringir-nos a les dues subpoblacions de noies i nois. Per això caldria calcular les rectes de regressió relatives a cada grup. Aquest càlcul es veurà amb detall a la pràctica 5 d'aquest mòdul.

Si entreu a l'opció Herramientas | Análisis de datos | Regresión podeu observar que hi apareixen molts més conceptes dels treballats en aquesta pràctica. En el mòdul 7 es fa un breu comentari sobre aquesta qüestió.

 
Amunt