Activitats d'aprenentatge

Distribucions estadístiques bidimensionals

Dues sèries de dades aparellades, com per exemple les alçades i els pesos dels membres d'un club de bàsquet, o per exemple les notes de dos exàmens consecutius de tots els alumnes d'un mateix curs..., direm que formen distribucions bidimensionals.

Si les dades aparellades fossin per exemple el consum elèctric i el cost de la factura de la llum, podríem comprovar que s'ajusten a una fórmula exacta i que representades gràficament es veuen perfectament alineades. Són parelles de valors d'una funció lineal.

En una distribució estadística NO hi ha una fórmula general que ens permeti calcular el segon valor de la parella a partir del primer. Però si representem gràficament les parelles de valors en uns eixos de coordenades, a vegades podem observar tendències. Aquesta representació gràfica s'anomena núvol de punts. Per aquest núvol de punts hi haurà una recta que s'hi acostarà en certa manera: la recta de regressió lineal. Aquesta recta tindrà una equació que aprendrem a calcular.

Volem saber si tendeix a haver-hi relació lineal entre les dues sèries de dades i mesurar objectivament aquesta tendència. És a dir volem mesurar el grau d'apropament del núvol de punts a la recta de regressió. Per això calcularem un paràmetre anomenat coeficient de correlació lineal (també dit de Pearson) i l'equació de la recta de regressió.

El coeficient de correlació lineal (Pearson) té un valor entre -1 i 1 que ens indica el grau de dependència lineal: Aprop de 0 poca dependència lineal, aprop de 1 o de -1 dependència lineal forta; si és positiu la dependència és creixent (quan una de les dues augmenta l'altra també tendeix a augmentar) i si el coeficient és negatiu la dependència és decreixent (quan una variable augmenta l'altra tendeix a disminuir).

L'equació de la recta de regressió la podem utilitzar per fer prediccions del valor de la segona variable per un valor donat de la primera. Aquestes prediccions no seran en general resultats exactes però ens poden donar una idea de per on poden anar les coses. En direm estimacions.

Els paràmetres esmentats i la recta de regressió es poden calcular directament utilitzant algun programa d'estadística o amb un full de càlcul. Però també podem calcular els paràmetres disposant les parelles de dades en una taula i fent únicament sumes, multiplicacions i alguna divisió amb les dades que volem estudiar.

Però abans de passar a veure quins són aquests càlculs (que farem amb un full de càlcul) anem a veure gràficament com es comporten aquests paràmetres.

Llicenciat sota la Creative Commons Attribution Non-commercial Share Alike 3.0 License

Estadística bivariant: Correlació i regressió lineals