Enrera
Mòdul 4
Estadística amb el full de càlcul: usos didàctics
  Pràctica
1
2
3
4
5
6
   
Exercicis
Exercicis
  Les distribucions de probabilitat discretes     Documentació
Glossari
Glossari
 
 
 
La probabilitat     Documentació

 
Per al desenvolupament d'aquest mòdul és molt important tenir ben assolit el concepte de probabilitat i convé conèixer les principals propietats de la probabilitat. Aquest document permet revisar els fonaments del tractament de l'atzar i el vocabulari associat, la visió intuïtiva de la probabilitat, algunes propietats fonamentals per al càlcul de probabilitats, i la introducció de la noció de probabilitat condicionada.

 
 
Experiències aleatòries
 
 
Algunes ciències estudien experiències de les quals podem predir el resultat amb tota certesa. Per exemple, es pot calcular a quina hora sortirà demà el sol o bé la solució de l'equació x + 4(2 – 8x) = 5. S'anomenen experiències deterministes, en les quals pot ser calculat i determinat prèviament el resultat de l'experiència.

En canvi, en altres experiències hi ha factors que contribueixen a fer-ne imprevisible el resultat. A vegades es diu que l'atzar és un d'aquests factors. Vegem què ens diu el diccionari de la llengua catalana de l'IEC:

  • atzar. Causa assignada als fets dels quals ens escapa la causa real.

Dit així, podríem pensar en l'atzar com a sinònim de descontrol, però no és pas així. De fet, el diccionari de l'Enciclopèdia Catalana, en l'accepció MAT del mot atzar ens diu:

  • atzar. Conjunt de causes inconegudes que produeixen un efecte no previsible. Un fenomen és degut a l'atzar quan llur realització depèn d'un conjunt de condicions massa complexes per a poder-les conèixer i estudiar totes.

Quan un jugador molt traçut tira un dard cap a una diana, el punt on anirà a clavar-se el dard és, de fet, el resultat d'un problema de física. Ara bé, és tan difícil arribar a establir les condicions inicials d'aquest problema i també les condicions de l'entorn, que podem dir clarament que l'atzar influeix en el resultat de l'experiència. Semblantment passa quan tirem un dau enlaire o fem girar una ruleta.

Donarem tot seguit algunes definicions i vocabulari que convé conèixer.

 
Una experiència aleatòria és el procés d'observació d'un fenomen tal que pot tenir variacions en el seu resultat, de manera que en aquestes variacions intervé l'atzar.

Així, doncs, si estem estudiant un fenomen aleatori, tot i que el repetim diverses vegades en les mateixes condicions, el resultat que observem pot ser un, o un altre, o un altre...

 
L'espai universal associat a un experiment aleatori és el conjunt format per tots els valors que és possible que tingui el resultat d'una realització de l'experiment, i que no poden ser expressats lògicament en funció de resultats més simples. Es representa per la lletra grega omega majúscula, .

A part del resultat concret, l'observació del qual pot tenir força limitacions, en l'estudi dels fenòmens aleatoris ens interessa analitzar diverses situacions de les quals podem dir que tenen èxit o que no en tenen quan fem una prova de l'experiment.

 
Un esdeveniment és qualsevol dels fets que ens pot interessar estudiar en un experiment aleatori, és a dir, qualsevol afirmació de la qual hom pot dir si ha esdevingut certa o falsa després d'una realització de l'experiment.

Cada esdeveniment s'associa amb un observable, que és el subconjunt de l'espai mostral format per aquells elements de que fan que l'esdeveniment sigui cert.

S'anomena esdeveniment impossible aquell que no té èxit mai. S'associa amb el conjunt buit, Ø.
L'esdeveniment segur és aquell que té èxit sempre i s'associa amb el conjunt .

L'esdeveniment treure parell en el llançament d'un dau s'associa amb l'observable {2, 4, 6} de l'espai universal = {1, 2, 3, 4, 5, 6}.

L'esdeveniment treure bola blanca d'una bossa en què hi ha 60 boles blanques i 40 boles negres totes idèntiques excepte pel que fa al color té com a observable associat el conjunt format per totes les boles blanques. Tanmateix, una sola bola blanca no defineix un observable perquè no podem distingir si ha sortit aquella bola o una altra d'idèntica.

L'enunciat "Escollir una noia l'alçada de la qual sigui exactament 1,68" no dóna lloc a un esdeveniment observable en l'experiència de fer un sorteig entre les noies d'una classe i mesurar l'alçada de l'escollida. Aquesta és una característica de les variables contínues.
En canvi, l'enunciat "Escollir una noia d'1,68 m" sí que pot definir un esdeveniment si ens fixem en la forma de donar l'alçada (amb dos decimals). El podem associar amb l'observable format per l'interval [1,675; 1,685) perquè aquests són els valors que s'arrodoneixen a 1,68 m.
Convé precisar que la no-observabilitat (a la qual assignarem probabilitat 0) no s'ha de confondre amb la impossibilitat (a la qual també assignarem probabilitat 0). Una reunió d'esdeveniments impossibles sempre segueix essent impossible; en canvi, per acumulació d'esdeveniments no observables arribem a un esdeveniment observable. La idea és semblant al fet que un punt no té longitud, però molts punts junts sí que arriben a tenir longitud.

Els elements de l'universal es coneixen amb el nom d'esdeveniments elementals.

 

En el cas d'una experiència amb un universal finit, els esdeveniments elementals reben també el nom de casos possibles de l'experiència. En aquest cas, els esdeveniments elementals que ens permeten afirmar que l'esdeveniment A s'ha esdevingut amb èxit reben el nom de casos favorables a A.

Un dels exemples més importants d'experiments aleatoris el tenim en la recollida de dades d'un treball estadístic. L'atzar hi influeix per dues raons: pel fet que prendre mesures sempre comporta una càrrega d'incertesa o marge d'error i, sobretot, per la necessitat amb què ens trobem sovint de prendre una mostra per extreure'n conclusions per a una població més gran.

La probabilitat, concepte que introduïm en aquestes pàgines, facilita l'estudi dels experiments aleatoris i, doncs, aporta el model escaient per a la tasca fonamental de l'estadística: la inferència.

 
 
La llei empírica de l'atzar
 
 
Ja hem dit que atzar no és sinònim de descontrol, sinó que hi ha criteris per estudiar-lo: hi ha una llei, constatable empíricament, que regula els fenòmens on intervé l'atzar. És aquesta llei, que enunciarem a continuació, la que ens porta de forma intuïtiva a la idea de probabilitat.

  • El valor de la freqüència relativa d'èxits d'un esdeveniment en les successives repeticions d'una experiència aleatòria tendeix a mantenir-se al voltant d'un valor constant, a mesura que el nombre de repeticions es va fent més i més gran.

La llei empírica de l'atzar rep també el nom de llei dels grans nombres, ja que perquè l'acostament de les freqüències a un valor concret, de què parla la llei, sigui significatiu, cal repetir l'experiència un nombre molt gran de vegades. Només així podem tenir una constatació empírica de quin és el nombre al qual s'acosten les freqüències d'un esdeveniment, allò que en diem la seva probabilitat.

Els treballs de simulació amb ordinador permeten experimentar amb molta rapidesa i arribar a nombres ben grans de repeticions d'un fenomen aleatori. En el context de les pràctiques d'aquest mòdul, tindreu referències a aquesta possibilitat.

 
 
La probabilitat
 
 
La probabilitat respon a la idea de disposar d'una mesura del grau de certesa que determinats fets es produeixin o no en una realització de l'experiment. La llei empírica de l'atzar ens permet arribar a aquesta definició intuïtiva:

S'anomena probabilitat d'un esdeveniment a un nombre que representa la proporció de vegades que podem esperar que l'esdeveniment succeeixi quan l'experiment és repetit moltes vegades en idèntiques condicions.

Representarem com a p(A) el nombre que representa la probabilitat d'un esdeveniment associat amb el subconjunt A.

Globalment, la probabilitat és el procés que permet assignar a cada esdeveniment el nombre que mesura la seva probabilitat. Aquí hem adoptat el punt de vista intuïtiu; en canvi, en molts textos d'estadística, s'adopta el punt de vista axiomàtic i es defineix la probabilitat mitjançant les propietats bàsiques que compleix. Seguidament, comentem algunes d'aquestes propietats:

  • Com que una proporció (o freqüència relativa) és un nombre comprès entre 0 i 1, això mateix verifica la probabilitat,
                  0 p(A) 1
    tot i que sovint, sobretot en els mitjans de comunicació, s'expressa també en tant per cent.

  • L'esdeveniment impossible (que s'associa amb el conjunt buit) compleix
    p(Ø) = 0.

  • L'esdeveniment segur té sempre èxit:    p() = 1.

A partir de dos esdeveniments A i B, mitjançant operacions lògiques es defineixen d'altres esdeveniments, com s'explica tot seguit:
L'esdeveniment intersecció de A i B, representat com a A B és aquell esdeveniment que s'escau quan i només quan s'observa un resultat que és favorable a A i a B alhora.
Dos esdeveniments mútuament excloents o incompatibles són els que no poden fer-se alhora; és a dir, són aquells esdeveniments A i B que compleixen
A B = Ø.
L'esdeveniment reunió de A i B, representat com a A B,
és aquell esdeveniment que s'escau quan s'observa un resultat favorable a A,
favorable a B o bé favorable a tots dos alhora.
L'esdeveniment contrari d'un esdeveniment A, que representarem Ac, és aquell esdeveniment del qual direm que té èxit quan i només quan A falla.

 

Es compleixen les propietats següents:

  • Si A i B són mútuament excloents:     p(AB) = p(A) + p(B)
    fórmula dita a vegades de les probabilitats totals

  • En general: p(AB) = p(A) + p(B) – p(AB)

  • p(Ac) = 1 – p(A)

que, amb tota seguretat el lector o lectora trobaran clares (i potser fins i tot evidents) a partir del punt de vista empíric que hem donat al tema.

 
 
La regla de Laplace
 
 

La recerca d'un model adequat per a una experiència consisteix en l'establiment global d'una probabilitat. Molts dels exemples que s'estudien, i en particular el que es presenta en l'altre document auxiliar d'aquest mòdul, corresponen al més intuïtiu d'aquests models: el model uniforme de probabilitat.

El model uniforme de probabilitat és el que correspon als experiments aleatoris amb un conjunt universal finit per al qual hi ha criteris que permeten pensar que és vàlid un model amb tots els casos possibles igualment probables.

 

  • En un experiment aleatori uniforme es compleix la regla de Laplace:
             

A vegades es fa servir l'expressió a l'atzar per indicar que la realització d'un fenomen respon al model uniforme. Per exemple:

Si fem l'experiència de treure una bola d'una bossa en la qual hi ha 100 boles, 20 de blanques, 50 de negres i 30 de verdes, podem dir que l'extracció serà feta a l'atzar si les boles són totes idèntiques en pes i mida i remenem bé les boles abans d'extreure-les, de manera que totes les boles tinguin la mateixa oportunitat de sortir.

Si és així, podem aplicar la regla de Laplace i serà:
p(blanca) = 20/100; p(negra) = 50/100; p(verda) = 30/100.

L'assignació de probabilitats per a una experiència simple quan no escau el model uniforme té dues línies de treball fonamentals: la reformulació de l'experiència de manera que sigui vàlid el model uniforme o bé l'assignació empírica de probabilitats. Tanmateix, l'aprofundiment d'aquesta consideració escapa a la finalitat d'aquest curs.

 
 
El concepte d'independència
 
 
 

En moltes situacions pràctiques es fa servir de forma habitual un concepte que, a l'hora de ser definit amb rigor, rep el nom de probabilitat condicionada. Posem com a exemple els casos en què es parla que "el fet de ser drogoaddicte és un factor de risc per tenir la sida", que podríem reformular dient que "la probabilitat de tenir la sida augmenta si sabem que una persona és drogoaddicte".

Es tracta de situacions en què el fet de disposar d'informació complementària pot condicionar la mesura de les possibilitats que un esdeveniment es produeixi, és a dir, ens trobem amb una nova manera de veure la probabilitat. Aquesta informació complementària es pot presentar, en general, com un esdeveniment que sabem o suposem que s'ha produït, que anomenarem esdeveniment condicionant. Donarem la definició següent:

S'anomena probabilitat, condicionada per A, de B, representada p(B | A),
(enunciada habitualment com la probabilitat de B condicionada per A) és el nombre

  

  • Perquè aquesta definició sigui consistent ha de ser p(A) > 0.
Observeu l'analogia d'aquesta definició amb la fórmula de Laplace però com si restringíssim l'espai universal únicament als resultats favorables a A. Aquesta és realment la idea que persegueix la probabilitat condicionada, que ens dóna, doncs, un nombre que mesura el grau de certesa que podem tenir que es doni un cas favorable a l'esdeveniment B, suposant que s'ha realitzat amb èxit l'esdeveniment condicionant, és a dir, A. Ha de quedar clar en el moment de parlar de probabilitat condicionada que no és pas que, en la realitat, un esdeveniment estigui condicionat per un altre, sinó que és la forma de calcular la probabilitat, allò que queda condicionat. Podeu veure un exemple si cliqueu a la icona de l'esquerra.
 

A partir de la noció de probabilitat condicionada s'arriba a un dels conceptes crucials en la teoria de probabilitats (i en les seves aplicacions pràctiques!).

Es diu que B és independent de A, i que A i B són esdeveniments d'una experiència aleatòria i p(A) > 0, si es compleix que p(B|A) = p(B)

Dues observacions sobre la definició anterior (i perdoneu els jocs de paraules si els considereu excessius):

  • La propietat que s'acaba de formular es pot enunciar així:
    El resultat del càlcul de la probabilitat de l'esdeveniment B és el mateix, independentment de si el calculem globalment o bé condicionat per l'esdeveniment A.

  • En canvi, la noció d'independència entre dos esdeveniments aleatoris no té, en absolut, cap relació amb la independència política que porta implícita una idea de separació, de situacions excloents entre una part i l'altra. Us deixem reflexionar quina paraula falta a la qüestió conceptual següent, que heu de raonar a l'exercici 1: Si dos esdeveniments són mútuament excloents segur que (són?) (no són?) independents.

  • Si B és independent de A, una reflexió senzilla sobre la definició de probabilitat condicionada ens permet establir que p(AB) = p(A) · p(B).

    Adoneu-vos que aquesta propietat a la qual hem arribat és simètrica pel que fa als esdeveniments A i B. Es demostra, per altra banda, que és del tot equivalent a la definició i és la que s'empra habitualment.

Es diu que els esdeveniments A i B d'una experiència aleatòria són independents si i només si p(AB) = p(A) · p(B).

En la majoria de situacions que hem treballat en aquest capítol els esdeveniments condicionant i condicionat es desenvolupaven de manera simultània en el temps, però el concepte que acabem de comentar també s'aplica a experiències compostes de diverses parts que es duen a terme successivament i en què el resultat d'una part pot condicionar el desenvolupament de la següent.

Pensem, doncs, en una experiència composta de dues parts i, en aquesta experiència, siguin A un esdeveniment de la primera part de l'experiència o, més exactament, que passi A a la primera part i qualsevol cosa a la segona part, i B un esdeveniment de la segona part de l'experiència o, més exactament, que passi qualsevol cosa a la primera part i es faci amb èxit B a la segona part. Si operem en la fórmula de la probabilitat condicionada aplicada a aquests esdeveniments A i B obtenim p(AB) = p(A) · p(B|A), però analitzem què apareix en aquesta expressió:

  • AB és l'esdeveniment que té èxit si s'observa A a la primera part i B a la segona part de l'experiència, podem dir-ne esdeveniment A i després B.
  • p(A) probabilitat de A a la primera part de l'experiència.
  • p(B|A) probabilitat que s'esdevingui B a la segona part de l'experiència calculada de manera condicionada, amb la suposició que a la primera part de l'experiència s'hagués donat A realment.

Aquesta reflexió ens permet escriure la fórmula del producte de probabilitats per a experiències compostes:
           p(A i després B) = p(A) · p(B|A).

Es diu que dues parts d'una experiència es desenvolupen de forma independent en els casos en què la realització de la primera part de l'experiència no condiciona el càlcul de probabilitats de l'altra o les altres parts de l'experiència.

Heu de tenir ben present que en cas d'experiments successius no es fa servir la fórmula del producte per calcular p(B|A), sinó que aquest valor s'obté de manera intuïtiva i la fórmula serveix per calcular la probabilitat que s'esdevinguin, successivament, A i B. En aquest mateix ordre de coses, convé que diguem que el fet que les parts de què es compon una experiència composta siguin independents no es dedueix pas a partir de cap càlcul, sinó que és un concepte intuïtiu, la validesa o no del qual és conseqüència de la forma de dur a terme l'experimentació.

Vegeu un exemple: imagineu una bossa amb 20 boles, 14 de les quals són vermelles i 6 són blanques i que extraiem successivament dues boles d'aquesta bossa.

  • Podem pensar que les extraccions es fan de manera independent si després de cada extracció retornem a la bossa la bola que n'havíem tret i barregem ben bé les boles de la bossa abans de l'extracció següent.
    En aquest cas, la probabilitat de treure dues boles blanques, per exemple, es calcularia així:
    p(BB) = p(1ªB) · p(2ªB) = 0,3 · 0,3 = 0,09

    Si volem calcular la probabilitat de treure dues boles de diferent color, hem de tenir en compte les dues possibilitats: BV i VB. Tenim:

    p(BV) = p(1ªB) · p(2ªV) = 0,3 · 0,7 = 0,21
    p(VB) = p(1ªV) · p(2ªB) = 0,7 · 0,3 = 0,21
    p(una de cada color) = p(BV) + p(VB) = 0,21+ 0,21 = 2 · 0,21 = 0,42

  • En canvi, si fem les extraccions sense devolució, és ben clar que no hi ha independència entre una extracció i l'altra. Ara hem d'escriure
    p(BB) = p(1ªB)·p(2ªB|1ªB)
    en el benentès que la probabilitat condicionada que apareix no és fruit de cap càlcul, sinó de la intuïció.
    Si suposem que la primera bola ha estat blanca, a la bossa hi quedaran 19 boles de les quals només 5 seran blanques. Per tant, p(2ªB|1ªB) = 5/19. D'ací obtindrem:
    p(BB) = (6/20) · (5/19) = 0,079 (arrodonint)

    Semblantment, si volem calcular la probabilitat de treure una sola bola blanca de les dues (boles de diferent color) tindrem:

    p(BV) = p(1ªB) · p(2ªV|1ªB) = (6/20) · (14/19)
    p(VB) = p(1ªV) · p(2ªB|1ªV) = (14/20) · (6/19)
    p(una de cada color) = p(BV) + p(VB) = 2 · (14 · 6)/(20 · 19) = 0,44 (arrodonint)

Entre els exercicis plantejats al final del mòdul, en trobareu un que us farà pensar en un experiment compost amb les diverses parts de l'experiment independents i un altre que correspon a un cas en què la realització d'una part de l'experiment condiciona el càlcul de la probabilitat de les parts successives.

 
Amunt
 
 
  Aclariments, ampliacions, exemples
   
Un exemple relatiu a la probabilitat condicionada

En una parada de fira es juga amb una roda de la fortuna, però el joc es fa de manera ben especial: el director del joc fa voltar la roda darrere d'una cortina, i quan s'atura anuncia si el nombre que ha sortit correspon a un sector acolorit o no. Seguidament, els jugadors fan les seves apostes a parell o imparell, sense que es torni a fer girar la roda de la fortuna, sinó que, quan les apostes ja estiguin fetes, s'obrirà la cortina i es podrà veure on ha parat la ruleta. Analitzeu aquest joc i penseu a què apostaríeu (parell o imparell) si el crupier canta "Ha sortit acolorit" en les dues situacions següents:

(a) si la roda de la fortuna
té aquesta estructura
(b) si la roda de la fortuna
està acolorida així
Seguidament aplicarem la fórmula que hem donat com a definició de la probabilitat condicionada; així comprovarem si es confirma la intuïció. Els esdeveniments que ens interessen els indicarem així:
P: sortir parell         S: sortir senar o imparell
A: sortir acolorit       B: sortir blanc
Hem de pensar que en totes dues ruletes podem aplicar la fórmula de Laplace, perquè els sectors són idèntics i se suposa que no hi ha trampa. Llavors tenim en tos dos casos:

p(P) = p(S) = 0,5 i també p(A) = p(B) = 0,5

Des del moment que sabem que el crupier ha cantat "Ha sortit acolorit", les preguntes que ens hem de fer per apostar si ha sortit parell o imparell tendeixen a fer-nos pensar en les probabilitats condicionades en què A (acolorit) serà l'esdeveniment condicionant. Penseu que volem encertar el resultat d'un experiment del qual coneixem part de la informació ("Ha sortit A").

Haurem de calcular, doncs, p(P|A) i p(S|A), les probabilitats que surti parell o imparell però calculades com si s'hagués esdevingut A (sector acolorit). Apliquem la definició:

Ruleta (a)

p(PA) = 1/8 perquè PA = {6} i d'ací val    (1/8)/(1/2) = 1/4.
Com que sortir S és el contrari de sortir P, això ens porta a p(S|A) = 1 – (1/4) = 3/4.

En aquesta ruleta, doncs, el fet de saber que ha sortit un sector acolorit fa augmentar la probabilitat de senar: això és el que apostaríem.

Ruleta (b)

p(PA) = 2/8 perquè PA = {4,6} i d'ací val    (2/8)/(1/2) = 1/2.
Com abans, d'ací resulta que p(S|A) = 1 – (1/2) = 1/2.

En aquest cas, la informació suplementària (saber si ha sortit acolorit o no) no aporta res de nou: parells o imparells tenen les mateixes probabilitats si es calculen a priori o bé si es calculen condicionades per l'esdeveniment A.

 
Torna a la pràctica