llibre estadística

287
CIÈNCIES APLICADES Probabilitat i estadística matemàtica Teoria i problemes resolts UPCGRAU Francesc Pozo Montero Núria Parés Mariné Yolanda Vidal Seguí Ferran Mazaira Font

Upload: jonny-weissmuller

Post on 14-Nov-2014

770 views

Category:

Documents


39 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Llibre estadística

CIÈNCIESAPLICADES

Probabilitat i estadística matemàticaTeoria i problemes resolts

UPCGRAU

CIÈNCIES APLICADES

Probabilitat i estadística matemàticaTeoria i problemes resolts

Aquest llibre segueix l’esquema bàsic d’una assignatura troncal de probabilitat i estadística dels nous graus adaptats a l’Espai Europeu d’Educació Superior. El text té l’objectiu d’introduir l’estudiant en els conceptes bàsics de la teoria de la probabilitat i l’estadística matemàtica, des d’un enfocament alhora amè i rigorós. Els continguts s’estructuren en sis capítols, més un annex amb taules. Al primer capítol, que serveix d’introducció, s’hi exposen els conceptes bàsics de l’estadística descriptiva. Al segon capítol es presenta la teoria axiomàtica de la probabilitat i es repassen nocions de combinatòria. Les variables aleatòries i els models probabilístics més utilitzats es desenvolupen als capítols tercer i quart, respectivament. El mostreig i l’estimació es tracten al capítol cinquè. Finalment, el contrast d’hipòtesis es presenta al sisè capítol. Al final de cada capítol s’inclou una llista de problemes completament resolts.

Francesc Pozo és llicenciat en Matemàtiques per la Universitat de Barcelona (2000) i doctor en Matemàtica Aplicada per la UPC (2005). És membre del grup de recerca consolidat CoDAlab (codalab.ma3.upc.edu).Núria Parés és llicenciada en Matemàtiques (1999) i doctora en Matemàtica Aplicada (2005) per la UPC. És membre del grup de recerca consolidat LaCàN.Yolanda Vidal és llicenciada en Matemàtiques (1999) i doctora en Matemàtica Aplicada (2005) per la UPC. És membre del grup de recerca consolidat CoDAlab.Ferran Mazaira és llicenciat en Matemàtiques per la UPC (2011).F. Pozo, N. Parés i Y. Vidal són professors agregats del Departament de Matemàtica Aplicada III de la UPC, fundadors del Grup d’Innovació Matemàtica E-Learning (GIMEL, http://bibliotecnica.upc.es/gimel/). Imparteixen docència, principalment, de matemàtiques i estadística.

UPCG

RAU

Pro

bab

ilita

t i e

stad

ísti

ca m

atem

àtic

a. T

eoria

i pr

oble

mes

res

olts

Pozo

| Pa

rés

Vid

al |

Maz

aira

www.upc.edu/idp

Francesc Pozo MonteroNúria Parés Mariné

Yolanda Vidal Seguí Ferran Mazaira Font

Page 2: Llibre estadística

UPCGRAU

Probabilitat i estadística matemàticaTeoria i problemes resolts

Francesc Pozo MonteroNúria Parés Mariné

Yolanda Vidal Seguí Ferran Mazaira Font

Page 3: Llibre estadística

En col·laboració amb el Servei de Llengües i Terminologia de la UPC

Primera edició: desembre de 2010

Disseny i dibuix de la coberta: Jordi SoldevilaDisseny maqueta interior: Jordi SoldevilaMaquetació: Mercè Aicart

Foto de la coberta: Francesc Pozo

© Els autors, 2010

© Iniciativa Digital Politècnica, 2010 Oficina de Publicacions Acadèmiques Digitals de la UPC Jordi Girona Salgado 31, Edifici Torre Girona, D-203, 08034 Barcelona Tel.: 934 015 885 Fax: 934 054 101 www.upc.edu/idp E-mail: [email protected]

Producció: LIGHTNING SOURCE

Dipòsit legal: B-47222-2010ISBN: 978-84-7653-529-5

Qualsevol forma de reproducció, distribució, comunicació pública o transformació d’aquesta obra només es pot fer amb l’autorització dels seus titulars, llevat de l’excepció prevista a la llei. Si necessiteu fotocopiar o escanejar algun fragment d’aquesta obra, us he d’adreçar al Centre Espanyol de Drets Reprogràfics (CEDRO), <http://www.cedro.org>.

Page 4: Llibre estadística

Índex

Introducció i estadística descriptiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.1. Introducció . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.2. Població i variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.3. Distribucions de caràcter unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.4. Presentació de dades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3.Tabulació . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . 201.3.Agrupació de dades en intervals de classe . . . . . . . . . . . . . . . . .. . . . . . . . . . . 211.3.Representacions gràfiques clàssiques de les distribucions .. . . . . . . . . . . . . 221.5. Descriptors d’un conjunt d’observacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.Mesures de tendència central d’un conjunt d’observacions . .. . . . . . . . . . . 261.3.Mesures de posició d’un conjunt d’observacions . . . . . . . . . . .. . . . . . . . . . . 281.3.Mesures de dispersió d’un conjunt d’observacions . . . . . . . . .. . . . . . . . . . . 291.6. Tipificació de les dades d’una mostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Problemes resolts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Elements de probabilitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.1. Experiències aleatòries i espai mostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.2. Esdeveniments o successos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522.3. Axiomàtica de la probabilitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542.4. Probabilitat condicionada. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 552.5. Nocions de combinatòria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581.3.Variacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . 581.3.Permutacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . 591.3.Combinacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 591.3.Variacions amb repetició . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 601.3.Permutacions amb repetició . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 601.3.Combinacions amb repetició . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 61Problemes resolts (combinatòria) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Problemes resolts (probabilitat) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

7

Page 5: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Variables aleatòries. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1111 3.1. Conceptes bàsics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 1111 3.2. Àlgebra de variables aleatòries . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 1121 3.3. Distribucions de probabilitat . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 1141 3.4. Característiques d’una variable aleatòria discreta . .. . . . . . . . . . . . . . . . . . 1171 1.3.Esperança matemàtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 1171 1.3.Variància . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1191 1.3.Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 1201 1.3.Desviació tipus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1201 1.3.Coeficient de variació . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 1201 3.5. Variables aleatòries contínues . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 1201 1.3.Funció de densitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1201 1.3.Funció de distribució . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1211 3.6. Característiques d’una variable aleatòria contínua . .. . . . . . . . . . . . . . . . . 1231 1.3.Esperança matemàtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 1231 1.3.Variància . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1231 3.7. Tipificació de variables . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 1241 3.8. Teorema de Txebitxev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . 1251 3.9. Vectors aleatoris discrets . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . 127

3.10. Vectors aleatoris continus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1283.10.Distribucions de probabilitat conjuntes . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1283.10.Distribucions marginals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1293.10.Funció de distribució conjunta. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1303.11. Transformacions de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1323.10.Variables aleatòries estadísticament independents . . . . . .. . . . . . . . . . . . . 1323.10.Característiques d’una variable aleatòria bidimensional .. . . . . . . . . . . . . 1333.10.Covariància de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 134Problemes resolts (variables aleatòries discretes) . . . . . . . . . . . . . . . . . . . . . . . . . 135Problemes resolts (variables aleatòries contínues) . . . . . . . . . . . . . . . . . . . . . . . . 149Problemes resolts (variables aleatòries bidimensionals) . . . . . . . . . . . . . . . . . . . 157

Models probabilístics a l’enginyeria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1731 4.1. Models de distribucions discretes . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 173

3.10.Distribució uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1733.10.Distribució de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1743.10.Distribució binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1743.10.Distribució de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1753.10.Distribució geomètrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1783.10.Distribució binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1803.10.Distribució hipergeomètrica . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 181

1 4.2. Models de distribucions contínues . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . 1833.10.Distribució uniforme contínua . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1833.10.Distribució normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . 1843.10.Llei normal tipificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 1883.10.Ús de la taula de la llei normal tipificada i interpolació lineal . . . . . . . . . 1903.10.Aproximació de la llei binomial per la llei normal . . . . . . . . . .. . . . . . . . . 191

8

Page 6: Llibre estadística

Índex

3.10.Càlcul efectiu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1933.10.Distribució logarítmiconormal . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1933.10.Distribució exponencial negativa . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 1953.10.Distribució khi quadrat (χ2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1963.10.Distribuciót de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1983.10.DistribucióF de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200Problemes resolts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

Mostreig i estimació. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2291 5.1. Mostra aleatòria simple . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 2291 5.2. Llei forta dels grans nombres . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . 2301 5.3. Teorema central del límit . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 2301 5.4. Problemes d’inferència estadística . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . 2311 5.5. Estadístics i estimadors . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 2311 5.6. Propietats dels estimadors . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 232

3.10.Centratge o no esbiaixament . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . 2323.10.Consistència . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 2323.10.Suficiència . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 2323.10.Eficiència . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 233

1 5.7. Informació de Fisher en una variable aleatòria . . . . . . . .. . . . . . . . . . . . . . . 2343.10.Propietats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . 234

1 5.8. Estimadors de la màxima versemblança . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 2361 5.9. Estimadors pel mètode dels moments . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . 237

5.10. Estimació per intervals de confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2385.11. Construcció d’intervals de confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2383.10.Estimació de la mitjana en poblacions normals amb variància coneguda 2383.10.Estimació de la mitjana en poblacions normals amb variància descone-

3.10.guda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . 2393.10.Estimació de la variància en poblacions normals . . . . . . . . . . .. . . . . . . . . . 2403.10.Estimació de la diferència de mitjanes en poblacions normalsamb va-

3.10.riàncies conegudes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . 2403.10.Estimació de la diferència de mitjanes en poblacions normalsamb va-

3.10.riàncies desconegudes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . 2413.10.Estimació del quocient entre variàncies de poblacions normals . . . . . . . . 2433.10.Estimació de la mitjana en poblacions sense normalitat . . . . .. . . . . . . . . . 243Problemes resolts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

Contrast d’hipòtesi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2611 6.1. Proves d’hipòtesi paramètriques . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 2611 6.2. Proves d’hipòtesi no paramètriques . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 265

Problemes resolts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

Taules. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2811 7.1. Distribució normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 2811 7.2. Distribuciót . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2821 7.3. Distribucióχ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2831 7.4. DistribucióF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283

9

Page 7: Llibre estadística
Page 8: Llibre estadística

Pròleg de l’autor

Fa més de deu anys que faig docència d’estadística i, entre lesmeves referències bà-siques, he tingut sempre un parell de llibres:Ejercicios de cálculo de probabilidades,d’Hermenegildo Fernández-Abascal i altres, publicat per Ariel Matemática, iLa estadís-tica: una orquesta hecha instrumento, de Jaime Llopis Pérez (que fou professor meu ala Facultat de Matemàtiques de la Universitat de Barcelona), publicat per Ariel Ciencia.Després d’un temps recomanant aquests dos llibres curs rere curs, una estudiant em vafer veure que ja no estaven a la venda, sinó que estaven descatalogats. De fet, l’editorialAriel va desaparèixer fa ja alguns anys. És llavors que decideixo transformar la mevaexperiència, i la dels companys que m’acompanyen en aquest viatge, en un llibre.

El llibre està pensat com un material de referència bàsic per a una assignatura de proba-bilitat i estadística, que alhora sigui complet, amè i rigorós. Conté les demostracions quea vegades no hi ha temps de presentar a l’aula, il·lustracions que ajuden a entendre elsconceptes que s’hi exposen i també una llista extensa de problemes resolts de principi afi.

Aquest llibre és fruit de l’esforç dels seus autors. Però seria injust no citar, de formaexplícita, en Sergi Arruga Cantalapiedra, que també ha dedicat una bona part del seutemps perquè aquesta obra sigui una realitat. I també vull agrair a Edicions UPC, araconvertida en Iniciativa Digital Politècnica, l’oportunitat de publicar-lo. En especial, aMontse Mañé (editora d’Edicions UPC quan el projecte va ser aprovat), a Jordi Prats(director actual) i a Ana Martí.

Francesc Pozo

11

Page 9: Llibre estadística
Page 10: Llibre estadística

Pròleg de Jesús Martínez,periodista i escriptor

Deu

L’any 2009 va jugar 35 partits de Lliga i va sortejar els contraris, emulant Diego ArmandoMaradona i Marco Van Basten, amb les seves mitges tisores (aquestes xilenes que esveuen venir), amb els seus xuts a porta que perforen la xarxa i amb les seves vaselines quedeixen en ridícul Tzorvas, del Panathinaikos. D’aquests 2.952 minuts en què va demostrarla seva classe i va córrer com ningú pel mig camp, a dalt, a la zona delsobrellaunes,va marcar 34 gols, amb les seves fintes insuperables a l’Álvaro Arbeloa —l’as de lamàniga del Manuel Pellegrini—, els seus barrets d’ala ampla a la zona de l’àrea i elsseus xuts antics, per emèrits, a l’estil Panenka. Aquests 34 gols van ser com bufetadesper als argonautes de la Unión Deportiva Almería i els rubicunds muscles del CristianoRonaldo, i va arrencar els aplaudiments a l’estadi Manuel Ruiz de Lopera.

Tres targetes grogues. Cap targeta vermella. Les volees li plovien com aigua de maig i lesbotes li pesaven pels quelats que recobrien les llengüetes serigrafiades. A la Champions,va tocar el cel delssirtakis: vuit gols en onze partits jugats. “Li va marcar quatre golsa l’Arsenal i va col·locar el Barcelona a les semifinals de la Champions (4-1)”, titulavael diari El Comercio,de Perú, amb aquest subtítol de volants:“La ‘Pulga’, solito, le diovuelta al partido que se jugó en el Camp Nou con una actuación espectacular. Ahora en-frentará al Inter”. Abans, a la Wikipedia, s’havia fet el buit per la nova entrada de l’astreargentí: “El 16 de gener de 2010, amb 22 anys, 6 mesos i 23 dies, es va convertir en eljugador més jove a aconseguir 100 gols amb el Barça”, cosa que va originar nombrosesvisites alsweblogsamb els seus incomptables i plebeustags: pilota d’or, estel·lar, blau-grana, crack.Una pregunta maliciosa planava pels fòrums en què participava, a més del’afecció amb les seves cantates, els desitjats actors deMars Attacks!,de genolls davantla figura axial d’un heroi grec: “Podrà superar el rècord blaugrana del brasiler Ronaldo,de 34 gols en una Lliga?” (Ronaldoel Breu).

Qui ja s’ha convertit en el màxim golejador de la història del Barça a la Copa de Cam-pions d’Europa, es va saltar olímpicament les normes de cortesia durant la temporada2009-2010: “Amb vuit gols, Ell; amb set gols, Cristiano Ronaldo (Reial Madrid) i Olic(Bayern de Munic); amb sis gols, Diego Milito (Inter); amb cinc gols, Bendtner (Arse-

13

Page 11: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

nal), Chamakh (Girondins) i Rooney (Manchester United). . . Iaixí successivament, finsa quedar-nos amb els tristos homes engalipats pels cants de sirena que combaten a lesfiles del Porto, de l’Oympique de Lió i del Wolfsburg, lloc de llegenda on es perd l’es-fèric.

De qui parlem? És Leo; és Déu. Leo Messi no té ni idea d’estadística, branca de lesmatemàtiques feta a imatge i semblança seva, si bé l’estadística va néixer per lloar-li iglossar el seu palmarès: Premi FIFA al millor jugador del món; inclòs a l’onze ideal dela revistaL’équipei a l’onze ideal de la dècada pel diari anglèsThe Sun;premi al millorjugador d’Europa del diariEl Paísd’Uruguai; trofeu al màxim golejador. . .

Segurament, Messi no llegirà mai a la vida aquest llibre del Francesc Pozo, la NúriaParés, la Yolanda Vidal i el Ferran Mazaira, text imprescindible per saber exactament quènassos és “una variable aleatòria tridimensional” (en 3D) i quins enrenous es porten entreells els eixos de les coordenades i si, encara que sigui relativament, es poden transformartotes aquestes observacions en gols.

Messi, la llum, el mite, l’il·lustre senyor dels camps de batalla, la medul·la espinal delvestidor, l’omnímode, la cama esquerra, el nen magnànim, el gladiador. Ha begut l’am-brosia del messies, ha rematat la seva ambició. El deu a la samarreta. Déu.

14

Page 12: Llibre estadística
Page 13: Llibre estadística

Hola

Page 14: Llibre estadística

Introducció iestadística descriptiva

“There are three kinds of lies: lies, damned lies, and statistics.”

Mark Twain,Autobiography, 1904.

“Les fonts d’energia renovables proveeixen el 55% del consum” (El Periódico de Cata-lunya, 8 de maig de 2010) o “Més del 50% de les noves contractacions [d’assegurancesde cotxe] inclouen només cobertura a tercers o ampliada a llunes” (La Vanguardia, 27d’abril de 2009). Aquests dos enunciats són fruit de l’aplicació de l’estadística. És a dir,expressen, de forma sintètica i mitjançant valors numèrics, determinats fenòmens i fetsde la realitat: les energies renovables o les assegurances de cotxe, per exemple.

Per arribar a aquest nivell de coneixement, cal aplicar mètodes i fórmules que tradu-eixin, en xifres concretes, conjunts de dades sovint complexos i que permetin extreureconclusions sobre l’objecte de l’estudi.

1.1. Introduccio

Definició 1.1 Una estadística és un conjunt de dades numèriques presentades en formade taules o gràfics.

Definició 1.2 L’estadística és un mètode matemàtic que estudia les estadístiques, n’in-vestiga les causes i les lleis empíriques. El nom deriva de la paraulaestat. Durant elsegleXIX , l’estadística era considerada la ciència de l’estat. Després va depassar aquestàmbit i va adquirir una aplicació més universal.

L’estadística descriptiva, com a part de l’estadística, estudia les tècniques de la recollidade dades i els procediments per a sintetitzar les dades recollides.

L’objectiu de l’anàlisi exploratòria de dades és sintetitzar la informació, detectar patronsde comportament, detectar anomalies, etc.

17

Page 15: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

1.2. Poblacio i variables

Definició 1.3 (Població) És el conjunt d’elements o individus objecte d’estudi. La po-blació pot ser finita o infinita, i pot ser real o hipotètica. Quan el conjunt població ésmolt nombrós, en podem considerar les parts o els subconjunts, anomenatsmostres.

Definició 1.4 (Mostra aleatòria simple) Una mostra és aleatòria simple quan tots elselements de la població tenen la mateixa probabilitat de ser inclosos a la mostra. Elnombre d’elements és la grandària de la mostra.

Per exemple, en una enquesta sobre la intenció de vot dels ciutadans i les ciutadanes ma-jors d’edat de Catalunya, l’ideal seria poder preguntar a tota la població a quin partit tépensat votar. És evident, però, que això no és possible. Els enquestadors han de recórrer,doncs, a una mostra.

Definició 1.5 (Variable o caràcter) És qualsevol propietat que tenen tots els elementsde la població i que varia entre ells.

Definició 1.6 (Variable qualitativa o atribut) És tota variable que no es pot expressarnumèricament.

Definició 1.7 (Variable quantitativa) És una variable que es pot expressar numèrica-ment. Pot ser discreta o contínua:

- Les variables discretes són les que només poden prendre valors entre els elementsd’un conjunt discret, com ara un conjunt amb un nombre finit d’elements o conjunts,per exemple, els naturals, els enters o els racionals.

- Les variables contínues són les que poden prendre qualsevol valor real en un interval.

La variable quantitativa que compta el nombre de germans que té una persona és unavariable discreta, ja que pot prendre valors en el conjunt dels nombres naturals. En efec-te, el nombre de germans pot ser 0, o bé 1, etc. En canvi, l’alçada d’una persona és unavariable contínua, perquè pot tenir qualsevol valor real positiu.

Definició 1.8 (Observació)És el valor que té la variable en un element de la població.

Definició 1.9 (Variable unidimensional) Una variable és unidimensional quan cadaobservació d’un element de la població només necessita un valor per ser representada.

Són variables unidimensionals el pes, l’alçada o l’edat, per exemple.

Definició 1.10 (Variable multidimensional) Una variable és multidimensional quancada observació d’un element de la població necessita més d’un valor per ser represen-tada.

Per exemple, la velocitatv de l’aire en un punt qualsevol(x,y,z) de l’espai és una varia-ble tridimensional ja que és representada per tres nombres reals:

v(x,y,z) = (vx,vy,vz),

onvx,vy i vz representen la velocitat en la direccióx, y i z, respectivament.

18

Page 16: Llibre estadística

Introducció i estadística descriptiva

1.3. Distribucions de caracter unidimensional

Suposem que hem preguntat a deu persones quants germans són a la seva família (inclo-sos ells mateixos) i que les respostes obtingudes són aquestes (ordenades de menor a ma-jor):

1,1,1,2,2,2,2,3,3,4.

Com que tenim quatre valors diferents, podem agrupar aquestes dades en quatre classes:

x1 = 1, x2 = 2, x3 = 3, x4 = 4.

Definició 1.11 (Freqüència absoluta)És el nombre de vegades que apareix un valordeterminat de la variable.

La freqüència absoluta dexi la representarem perni. Evidentment, la suma de les fre-qüències absolutes és el nombre d’individusN de la població (o de la mostra). En efecte,si tenimk classes,

k

∑i=1

ni = N.

En el nostre exemple, tenim que les freqüències absolutes de les nostres classes són:

x1 = 1, n1 = 3x2 = 2, n2 = 4x3 = 3, n3 = 2x4 = 4, n4 = 1

on, evidentment, se satisfà quen1+n2+n3+n4 = 10= N.

Definició 1.12 (Distribució de freqüències d’una variable)La distribució de freqüèn-cies d’una variable és el conjunt format pels diferents valors de la variable i la freqüènciade cada valor.

Així doncs, en el nostre exemple, la distribució de freqüències és:

xi ni

1 3

2 4

3 2

4 1

Definició 1.13 (Freqüència relativa d’una observació)És el quocient entre la fre-qüència de l’observació i el nombre total de dades o observacions.

La freqüència relativa de l’elementxi amb una freqüència absolutani és

fi =ni

N.

19

Page 17: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Evidentment, es compleix que 0≤ fi ≤ 1 i que

k

∑i=1

fi = 1.

Ara, la distribució de freqüències és:

xi ni fi

1 3 0.3

2 4 0.4

3 2 0.2

4 1 0.1

Definició 1.14 (Freqüència acumulada)Un cop hem ordenat els valors de la variableestadística, sovint ens interessa conèixer el nombre de vegades que es presenta un valori tots els anteriors. És aleshores quan apareixen el concepte de freqüència acumuladaNi = ∑i

j=0 nj i el de freqüència acumulada relativa Fi =Ni

N.

Seguint amb l’exemple, les freqüències acumulades i les freqüències acumulades relati-ves són:

N1 = n1 = 3,F1 =N1

N= 0.3

N2 = n1+n2 = 7,F2 =N2

N= 0.7

N3 = N2+n3 = n1+n2+n3 = 9,F3 =N3

N= 0.9

N4 = N3+n4 = n1+n2+n3+n4 = 10,F4 =N4

N= 1

Noteu que, si tenimk classes, sempre passa queNk = N i Fk = 1.

La distribució de freqüències completa d’aquestes dades és:

xi ni fi Ni Fi

1 3 0.3 3 0.3

2 4 0.4 7 0.7

3 2 0.2 9 0.9

4 1 0.1 10 1

1.4. Presentacio de dades

Tabulacio

Per facilitar el tractament de les dades, es pot utilitzar la tabulació. Els objectius de latabulació són:

20

Page 18: Llibre estadística

Introducció i estadística descriptiva

- Descriure les dades inicials de forma concisa.- Subdividir les dades inicials en un nombre reduït de categories o classes.

Ens trobarem amb:

- Variables amb moltes observacions però amb pocs valors diferents de la variable. Enaquest cas, farem una taula com en la secció anterior.

- Variables en què el conjunt de valors possibles de la variablenumèrica discreta és moltgran, o bé en què la variable numèrica sigui contínua. En aquest cas, cal fer un procésde classificació i tabulació.

Agrupacio de dades en intervals de classe

Per poder fer aquesta subdivisió en classes, es busquen els valors mínim i màxim delconjunt de dades i s’escullen intervals juxtaposats, que abastin tot el rang de valors de lavariable. Vegeu el problema 1.2.

Definició 1.15 (Interval de classe)És cada subdivisió de tot el rang de valors de lavariable.

Definició 1.16 (Freqüència d’una classe)És el nombre de vegades que el valor de lavariable es troba dins de l’interval de classe. La freqüència d’una classe la denotem ambni.

Definició 1.17 (Marca de classe)És un identificador de l’interval de classe. S’acostu-ma a adoptar el valor mitjà de cada interval de classe. El denotarem amb mi.

Definició 1.18 (Distribució de freqüències per intervals de classe)És el conjunt for-mat pels intervals de classe i la freqüència de cada interval de classe.

Suposem que tenim una mostra de 50 persones, a les quals hem mesurat. Les dades leshem resumit i agrupat en la distribució següent de freqüències per intervals de classe:

interval de classe mi ni Ni

[160,163) 161.5 3 3

[163,166) 164.5 6 9

[166,169) 167.5 5 14

[169,172) 170.5 5 19

[172,175) 173.5 12 31

[175,178) 176.5 6 37

[178,181) 179.5 5 42

[181,184) 182.5 5 47

[184,187) 185.5 2 49

[187,190) 188.5 1 50

21

Page 19: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Representacions grafiques classiques de les distribucions

La transcripció de totes les dades en una gràfica és un dels recursos més corrents quees fan servir per a veure clarament i d’un cop d’ull tot el que està escrit a les taulesestadístiques. Els objectius en aquesta transcripció han de ser:

- La simplicitat (ve donada pel gràfic)- La precisió (de caràcter numèric i no de representació)

Considerem els tipus de gràfics següents:

a) Diagrames temporals. Representació gràfica de les dades que indiquen l’evoluciótemporal d’una magnitud. Generalment, a l’eix d’abscisses es representa el temps i al’eix d’ordenades, la magnitud de la variable. Vegeu els diagrames representats a lesfigures 1.1-1.2.

1.1L'eix d'abscisses

representa el temps enmesos i l'eix

d'ordenades, l'estimaciódel resultat electoral en

tant per cent de vot vàlid[ , 2/5/2010,

pàgina 14 (traduït alcatalà)].

El País

ESTIMACIÓ DE RESULTAT ELECTORAL En % sobre vot vàlid

Sondeigmaig2009

E. Generals de 2008

(vot sense resi-dents absents)

Sondeigjuny2009

Sondeigjuliol2009

Sondeigoctubre

2009

Sondeig15 octubre

2009

Sondeignov.2009

Sondeigdesembre

2009

Sondeiggener2010

Sondeigfebrer

2010

Sondeigmarç2010

Sondeigabril2010

Sondeigmaig2010

PSOE

PP

43,4

41,8

37,3 37,8

41,7

37,5

43,7

40,8 40,941,8

40,1

41,6 41,340,3

39,9

41,5

39,6 38,938,7

38,039,0

38,1

41,7

43,4

38,237,5

Intencio de vot i valoracio de lıders

1.2L'eix d'abscisses

representa el temps i l'eixd'ordenades, el

percentatge de poblacióenquestada que

menciona el problemaentre els tres primers [

, 4/5/2010, pàgina32 (traduït al català)].

ElPaís

200100 2002 2003 2004 2005 2006 2007 2008 2009 10

0

20

40

60

80

100

82,9L‘atur

45,3Els problemes econòmics

15,8 La classe política, els partits polítics

13,5 La immigració

11,1 El terrorisme. ETA

9,2 La inseguretatciutadana

MarçDesembre

Percentatge de població enquestada que el menciona entre els tres primersPrincipals problemes de la societat espanyola

22

Page 20: Llibre estadística

Introducció i estadística descriptiva

b) Diagrama de barres. Representació gràfica de les dades recollides mitjançant barreso rectangles en què la base és igual i l’altura correspon a la freqüència del valor re-presentat. Generalment, a l’eix d’abscisses (horitzontal) es representen els valors quepren la variable i a l’eix d’ordenades (vertical) es representa la freqüència absoluta orelativa. La barra més alta correspon a la moda. Però també es poden representar al’eix d’ordenades els valors que pren la variable i a l’eix d’abscisses, la freqüència. Enaquest cas, la moda serà representada per la barra que arriba més a la dreta.

1.3, 5/5/2010, pàgina

24 (traduït al català).El País

–24.188

62.769

SÈRIE ORDINÀRIA SÈRIE DESESTACIONALITZADA

ATUR REGISTRAT Variació mensual

-90.000

-60.000

-30.000

0

30.000

60.000

90.000

120.000

150.000

-20

0

20

40

60

80

100

120

N D E F MA M AJ J A S O N D E F MA M AJ J A S O2009 2010 2009 2010

(en milers)

Evolucio del mercat laboral a l’abril

1.4, 24/4/2010,

pàgina 26 (traduït alcatalà).

El País

7

10

19

30

63

65

75

76

78

79

85

92

96

136

137

146

166

317

335Catalunya

Andalusia

Balears

Galícia

Madrid

C. Valenciana

Múrcia

Aragó

Castella i Lleó

Navarra

Castella–La Manxa

Extremadura

Canàries

Cantàbria

Astúries

La Rioja

Ceuta

Melilla

Altres

ENTITATS PER COMUNITAT AUTÒNOMA

El sector public empresarial

c) Diagrama de sectors. Representació gràfica de les dades recollides mitjançant un cer-cle o un semicercle, dividits en sectors o parts d’àrees proporcionals a les freqüències.Per calcular l’àrea de cada sector, s’ha de multiplicar la freqüència relativa per 360

en el cas d’un cercle o per 180 en el cas d’un semicercle.

23

Page 21: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

1.5El País, 7/5/2010,

pàgina 2 (traduït alcatalà).

LaboristesBlair356

Liberal-demòcratesKennedy

62

ConservadorsHoward

198

Altres30

646ESCONS

650ESCONS

324Majoria absoluta

326Majoria absoluta

Liberal-demòcrates

Clegg59

ConservadorsCameron

307

Altres29

PARLAMENT 2005CAMBRA DELS COMUNS (diputats)

LaboristesBrown

255

Sondejos a peu d’urna

1.6, 26/4/2010,

pàgina 32 (traduït alcatalà).

El PaísCOBERTURA DE LA DEMANDA

Cicle combinat29%

Nuclear19%

Eòlica13%

Carbó12%

Hidràulica9%

Solar3%

Fuel / gas1%

Altres14%

Energia solar fotovoltaica a Espanya

d) Pictograma. Representació gràfica mitjançant dibuixos de les dades recollides. S’e-labora amb el mateix procediment que un diagrama de barres, però substituint elsrectangles per dibuixos que simbolitzen el fenomen estudiat.

1.7, 26/4/2010,

pàgina 32 (traduït alcatalà).

El País

1992 1993 1994 1995 1996 1997

5.500 ha

7.389 ha

9.836 ha

12.162 ha

18.400 ha

21.645 ha

24

Page 22: Llibre estadística

Introducció i estadística descriptiva

e) Histograma de freqüències. Representació gràfica per a variables quantitatives contí-nues, que s’obté construint sobre cada interval de classe, marcat a l’eix d’abscisses,un rectangle l’àrea del qual és proporcional a la freqüència, absoluta o relativa, cor-responent a l’interval.

f) Polígons de freqüències (relatives i acumulades). Representació gràfica de les dadesrecollides mitjançant una línia que uneix els diferents valors obtinguts. Per representaraquesta línia, unim els punts centrals de cada una de les parts superiors dels rectanglesrepresentats en un diagrama de barres.

1.8, 24/4/2010,

pàgina 34 (esquerra);28/4/2010, pàgina 24(dreta) (traduït al català).

El PaísEn milions d’euros. Xifres acumulades.

20092010

719

-706

5.070

-8.908

-7.732

3.277

G F M45

50

55

60

65

70

75

80

02 03 04 05 06 07 08 09

52 52 55

65

62

74 75

69

DONES MORTES A MANS DE

LES SEVES PARELLES O EXPARELLES

Violencia de genere Deficit de l’Estat

1.5. Descriptors d’un conjunt d’observacions

Quan disposem d’un conjunt de dadesx1,x2,. . . ,xn, a part de tenir les freqüències, resultaútil disposar d’alguns valors (descriptors) queresumeixincom es distribueixen les dades.Els més importants són:

- mesures de centralització, que indiquen el valor central o mitjà de les dades (mitjana,moda i mediana).

- mesures de dispersió, que ens indiquen com s’agrupen les dades a l’entorn del valorcentral (desviació tipus, variància, rang, quartils, etc.).

Definició 1.19 (Estadístics)Les mostres es caracteritzen pels estadístics, que són va-lors calculats a partir de les dades. Són quantitats conegudes, però no fixes, ja que de-penden de la mostra escollida.

Definició 1.20 (Paràmetres)Les poblacions es caracteritzen pels paràmetres, que sónquantitats fixos, però generalment no conegudes i de vegades impossibles de conèixer.

25

Page 23: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Mesures de tendencia central d’un conjunt d’observacions

Definició 1.21 (Mitjana) La mitjana d’un conjunt d’observacions d’una variable nu-mèrica s’obté sumant tots els valors i dividint-ne el resultat pel nombre total d’observa-cions.

Si els valors de la variable sónx1,x2,. . . ,xN, la mitjana és

x=x1+x2+ · · ·+xN

N=

1N

N

∑i=1

xi .

Si els valors de la variable sónx1,x2,. . . ,xk, amb freqüències absolutesn1,. . . ,nk, respec-tivament, la mitjana és

x=x1 ·n1+x2 ·n2+ · · ·+xk ·nk

N=

1N

k

∑i=1

xi ·ni,

on n1+ · · ·+nk = N.

Si les dades estan agrupades en intervals amb freqüències, la mitjana és

x=

k

∑i=1

mi ni

k

∑i=1

ni

=k

∑i=1

mi fi, on fi =ni

k

∑i=1

ni

on mi és la marca de classe ik és el nombre de valors diferents de la variable.

Exemple 1.1 Donada la mostra x1 = 1,x2 = 4,x3 = 7,x4 = 9,x5 = 10,x6 = 14,x7 = 15,x8 = 16,x9 = 20 i x10 = 21, la seva mitjana és:

x=1+4+7+9+10+14+15+16+20+21

10= 11.7

Propietats de la mitjana

- Si reemplacem tots els valors de la variable per la mitjanax, la nova mitjana és lamateixa.

- La mitjana aritmètica depèn de tots els valors observats.- La mitjana aritmètica s’expressa mitjançant la mateixa unitat que la variable.- La suma algebraica de les desviacions dels valorsxi respecte de la mitjanax és zero.

Anomenemdi = xi −x ladesviaciód’un valorxi respecte de la mitjanax.- La mitjana aritmètica és el valorx que fa mínima l’expressió

k

∑i=1

|xi −x|n

26

Page 24: Llibre estadística

Introducció i estadística descriptiva

Definició 1.22 (Mediana) La mediana (Me) d’un conjunt d’observacions d’una variablenumèrica, si ordenem les dades de menor a major, és el valor que en deixa la meitat persobre i l’altra meitat per sota. Quan la distribució té un nombre de dades parell(N), no hiha, de fet, un valor central. Llavors, s’agafen els dos valors que parteixen la distribució,xN

2i xN

2 +1, i es fa la mitjana d’aquests dos valors.

Si la distribució és de freqüències per intervals de classe, tenim que

Me = l i−1+N2−Ni−1

ni

·ai

on

- l i−1 és el límit inferior de l’interval en què està situada la mediana;- Ni−1 és la freqüència acumulada de l’interval anterior a l’interval en què està situada

la mediana;- ni és la freqüència de l’interval en què està situada la mediana;- ai és l’amplitud de l’interval en què està situada la mediana.

L’interval en què està situada la mediana és el que conté l’elementxN+12

, si N és senar,o els elementsxN

2i xN

2 +1, si N és parell. En cas quexN2

i xN2 +1 caiguin en dos intervals

diferents, considerem que la mediana és directament la mitjana aritmètica de les marquesde classe d’ambdós intervals.

Exemple 1.2 Donada la mostra x1 = 1,x2 = 4,x3 = 7,x4 = 9,x5 = 10,x6 = 14,x7 = 15,x8 = 16,x9 = 20 i x10 = 21, la seva mediana es calcula com la mitjana aritmètica delselements centrals (x5 i x6), en tenir un total de N= 10elements:

Me =x5+x6

2=

242

= 12

Propietats de la mediana

- Els valors extrems de la distribució no influeixen en el valor de la mediana.- Si tenim un histograma de freqüències relatives, la mediana és el valor de la variable

que divideix l’àrea total de l’histograma en dues parts iguals.

Definició 1.23 (Moda) S’anomena moda d’una distribució el valor de la variable queté una freqüència més gran.

A vegades, no n’hi ha cap (quan tots els valors de la mostra tenen la mateixa freqüènciaabsoluta) i, a vegades, n’hi ha més d’una (distribucions multimodals).

Si la distribució és de freqüències per intervals de classe, tenim que

Mo = l i−1+

ni+1

ai+1

ni+1

ai+1+ ni−1

ai−1

·ai

on

- l i−1 és el límit inferior de l’interval modal- ni−1 és la freqüència de l’interval anterior a l’interval modal

27

Page 25: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

- ni+1 és la freqüència de l’interval posterior a l’interval modal- ai−1 és l’amplitud de l’interval anterior a l’interval modal- ai+1 és l’amplitud de l’interval posterior a l’interval modal

L’interval modal és l’interval amb major freqüència absoluta.

Exemple 1.3 Donada la mostra x1 = 1,x2 = 4,x3 = 7,x4 = 9,x5 = 10,x6 = 14,x7 = 15,x8 = 16,x9 = 20 i x10 = 21, podem observar que no té moda, ja que tots els valors tenenla mateixa freqüència absoluta.

Observació 1.1El programa R no té cap funció definida per a calcular la moda.

Mesures de posicio d’un conjunt d’observacions

Definició 1.24 (Quartils) Ordenats de menor a major, són els valors de la variable quereparteixen les dades en quatre conjunts amb el mateix nombre d’elements cadascun.

- El primer quartil es denominaquartil inferior o LQ (de l’àngleslower quartile otambéQ1), i té un 25% de les dades per sota.

- El segon quartil és la mediana.- El tercer quartil es denominaquartil superior o UQ (de l’anglèsupper quartileo

tambéQ3), i té un 25% de les dades per sobre.

Definició 1.25 (Percentils)Ordenades les dades de menor a major, són els valors quedeixen per sota el percentatge i.

En particular,

P25 = LQ

P50 = Me

P75 = UQ

Si tenim una mostrax1,. . . ,xN, el percentili es calcula resolent perk l’equació

i100

=k−1N−1

,

és a dir,

k=i

100(N−1)+1

i després per interpolació lineal entre els elementsx⌊k⌋ i x⌊k⌋+1 tenim que

Pi = x⌊k⌋+(k−⌊k⌋) · (x⌊k⌋+1−x⌊k⌋) ,

on ⌊·⌋ representa la funció part entera.

Observació 1.2Així és com ho calcula el programa R.

28

Page 26: Llibre estadística

Introducció i estadística descriptiva

Exemple 1.4 Donada la mostra x1 = 1,x2 = 4,x3 = 7,x4 = 9,x5 = 10,x6 = 14,x7 = 15,x8 = 16,x9 = 20 i x10 = 21, per al càlcul del primer quartil Q1 o, equivalentment, elpercentil P25, resolem per k l’equació

0.25=k−110−1

⇒ k= 3.25

i després, per interpolació lineal entre els elements x3 i x4, tenim

Q1 = x3+0.25· (x4−x3)= 7+0.25·2= 7.5

Per al càlcul del tercer quartil Q3 o, equivalentment, el percentil P75, resolem per k l’e-quació

0.75=k−110−1

⇒ k= 7.75

i després, per interpolació lineal entre els elements x7 i x8, tenim

Q3 = x7+0.75· (x8−x7)= 15+0.75·1= 15.75

Si la distribució és de freqüències per intervals de classe, tenim que el percentilk és

Pk = l i−1+k·N100

−Ni−1

ni

·ai

on

- l i−1 és el límit inferior de l’interval on es troba situat el percentilk;- ni és la freqüència de l’interval on es troba situat el percentilk;- Ni−1 és la freqüència absoluta acumulada de l’interval posterior de l’interval on es

troba situat el percentilk;- ai és l’amplitud de l’interval on es troba situat el percentilk.

Mesures de dispersio d’un conjunt d’observacions

Definició 1.26 (Rang)El rang o amplitud d’un conjunt d’observacions és la diferènciaentre el valor màxim i el valor mínim observats:

R= max−min

Definició 1.27 (Rang interquartíl·lic IQR) És la diferència entre el quartil superior il’inferior:

IQR=UQ−LQ

Definició 1.28 (Desviació mitjana)La desviació mitjana d’un conjunt d’observacionsx1,x2,. . . ,xN és

1N

N

∑i=1

|xi −x|.

29

Page 27: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Definició 1.29 (Variància) La variància d’un conjunt d’observacions x1,x2,. . . ,xN és

σ2 =1N

N

∑i=1

(xi −x)2.

- Si la variància correspon a una població, s’escriuσ2.- Si la variància correspon a una mostra de midaN, s’escrius2

N.

Definició 1.30 (Variància corregida) Amb la finalitat d’aproximar la variància de lapoblació a partir de les dades d’una mostra, fem servir la variància corregida

σ2N−1 =

NN−1

s2N.

Definició 1.31 (Desviació tipus)És l’arrel quadrada positiva de la variància.

σ = +√σ2

sN = +√

s2N

sN−1 = +√

s2N−1

Proposició 1.1 La variància pot calcular-se també com

σ2 =1N

(N

∑i=1

x2i

)− x2

1.6. Tipificacio de les dades d’una mostra

Considerem dues mostresx1,. . . ,xN1i y1,. . . ,yN2

, amb mitjanesx i y, respectivament, idesviacions tipussX i sY, respectivament. Per tal de comparar els valors d’aquestes duesmostres, els hem detipificar segons l’expressió

xi =xi −x

sX

, yi =yi −y

sY

Exemple 1.5 Un grup de matí de l’assignatura Estadística té, de mitjana en el primerexamen parcial, un 5, amb una desviació tipus d’1. Un grup de tarda, de la mateixaassignatura, té una nota mitjana de 6, amb una desviació tipus de 2. En Sergi, matriculatal matí, ha tret un 7. L’Ignasi, matriculat a la tarda, ha tret un 8. Quin dels dos ha tret,per comparació als seus companys, una nota millor?

Per tal de poder comparar aquests dos valors, els hem de tipificar. La nota tipificada delSergi és

x=7−5

1= 2,

30

Page 28: Llibre estadística

Introducció i estadística descriptiva

mentre que la nota tipificada de l’Ignasi és

y =8−6

2= 1.

Donat quex = 2 > 1 = y, en Sergi ha tret, comparativament, una nota millor, tot i serinferior en valor absolut.

Problemes resolts

Problema 1.1 Considereu la taula següent amb l’alçada en centímetres de 50 estudiantsagafats a l’atzar:

164 188 164 174 173 183 168 161 178 176

181 163 181 172 174 178 179 185 171 170

173 169 172 169 176 174 160 186 181 161

175 167 176 165 168 172 182 177 174 179

174 174 163 164 167 180 173 168 175 171

Calculeu-ne la mitjana aritmètica (x), la mediana (Me), la moda (Mo), la variància (s2N),la variància corregida (s2N−1), la desviació tipus (sN), el quartil inferior (LQ), el quartilsuperior (UQ), el rang i el rang interquartíl·lic (IQR).

Solucio

Per realitzar els càlculs, ens serà útil fer una taula amb els valors d’alçades, ordenats ambles seves freqüències:

xi ni xi ni xi ni

160 1 170 1 180 1

161 2 171 2 181 3

162 0 172 3 182 1

163 2 173 3 183 1

164 3 174 6 184 0

165 1 175 2 185 1

166 0 176 3 186 1

167 2 177 1 187 0

168 3 178 2 188 1

169 2 179 2 189 0

Per tal de calcular la mitjana aritmètica, recordem l’expressió que la defineix:

x=1N

N

∑i=1

xi ·ni

31

Page 29: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Per tant,

x =150

· (160+161+161+163+163+ · · ·+188)

=150

· (160·1+161·2+163·2+ · · ·+188·1) = 172.96

La mediana és el valor que deixa tantes dades per sobre com per sota. En aquest cas,tenim un nombre parell de dades; per tant, farem la mitjana dels dos valors centrals:

Me =x25+x26

2=

173+1742

= 173.5

L’alçada que es repeteix més entre els alumnes és 174 cm, amb un total de 6 alumnes.Per tant,Mo = 174.

Recordem l’expressió que defineix la variància:

s2N =

1N

N

∑i=1

(xi − x)2

Per tant,

s250 =

150

·((161−172.96)2+2· (162−172.96)2+ · · ·+1· (188−172.96)2

)≈ 46.04

La variància corregida ve donada per l’expressió:

s2N−1 =

NN−1

s2n

s249 =

5049

·46.04≈ 46.98

A partir de la variància, podem trobar la desviació tipus:

sn = +√

s2n

s50 = +√

46.04≈ 6.79

El quartil inferior o percentil 25 és el valor que deixa una quarta part de les dades persota. En aquest cas, el calculem resolent perk l’equació

0.25=k−150−1

d’on obtenimk= 13.25

i després, per interpolació lineal entre els elementsx13 i x14,

LQ= Q1 = P25 = x13+0.25(x14−x13) = 168

32

Page 30: Llibre estadística

Introducció i estadística descriptiva

El quartil superior és el que deixa una quarta part de les dadesper sobre. En aquest cas,el calculem resolent perk l’equació

0.75=k−150−1

d’on obtenimk= 37.75

i després, per interpolació lineal entre els elementsx37 i x38,

UQ= Q3 = P75 = x37+0.75(x38−x37) = 177.75

El rang interquartíl·lic serà, aleshores,

IQR=UQ−LQ= 177.75−168= 9.75

I, finalment, el rang,

rang= x50−x1 = 188−160= 28

Problema 1.2 Donades les alçades del problema anterior, agrupeu les dades en10 in-tervals d’igual longitud (tancats per l’esquerra i oberts per la dreta) de 160 a 190.

Calculeu les marques de classe dels intervals resultants, les freqüències absolutes i lesfreqüències acumulades. Torneu a calcular la mediana (Me), la moda (Mo), la variància(s2

n), la variància corregida (s2n−1), la desviació tipus (sn), el quartil inferior (LQ), elquartil superior (UQ), el rang i el rang interquartíl·l ic (IQR).

Quina diferència hi ha entre les dades obtingudes? Per què?

Solucio

Estem avaluant alçades d’entre 160 i 190 centímetres; per tant, agruparem les dades en10 intervals de 3 centímetres d’amplitud, on la marca de classe de cada interval serà lamitjana aritmètica dels seus extrems:

xi mi ni Ni

[160,163) 161.5 3 3

[163,166) 164.5 6 9

[166,169) 167.5 5 14

[169,172) 170.5 5 19

[172,175) 173.5 12 31

[175,178) 176.5 6 37

[178,181) 179.5 5 42

[181,184) 182.5 5 47

[184,187) 185.5 2 49

[187,190) 188.5 1 50

33

Page 31: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

En aquest cas, i tenint en compte que l’interval on està situada la mediana és l’interval[172,175), calculem la mediana com

Me = l i−1+N2−Ni−1

ni

·ai

= 172+502−19

12·3≈ 173.63

Tenint en compte, també, que l’interval modal és l’interval[172,175), la moda quedacom

Mo = l i−1+ni+1ai+1

ni+1ai+1

+ ni−1ai−1

·ai

= 172+63

63+ 5

3

·3≈ 173.64

Per als càlculs següents, ens caldrà la mitjana aritmètica, que calculem com

x =1N·

k

∑i=1

mi ·ni

=150

· (161.5·3+164.5·6+ · · ·+188.5·1) = 173.44

Ara en podem calcular la variància:

s2N =

1N·

k

∑i=1

ni · (mi − x)2

=150

· (3· (161.5−173.44)2+6· (164.5−173.44)2+ · · ·+1· (188.5−173.44)2)

≈ 45.90

i la variància corregida, igual que al problema anterior,

s2N−1 =

NN−1

·s2N

=5049

·45.90≈ 46.83

Un cop calculada la variància, n’obtindrem la desviació tipus,

sn = +√

s2n

s50 = +√

45.90≈ 6.77

34

Page 32: Llibre estadística

Introducció i estadística descriptiva

Per tal de calcular els percentils, fem servir l’expressió:

Pk = l i−1+k·N100

−Ni−1

ni

·ai

Per tant, calculem els quartils com

LQ = P25 = 166+25·50100

−9

5·3= 168.10

UQ = P75 = 178+75·50100

−37

5·3= 178.30

i el rang interquartíl·lic com

IQR=UQ−LQ= 178.30−168.1= 10.20

Finalment, calculem el rang,

rang= 190−160= 30

Podem observar que les dades obtingudes en aquest cas són molt properes a les obtingu-des en el problema anterior, amb diferències que en cap cas no arriben a l’1 % (tret delrang, que hem ampliat voluntàriament). Aquestes diferències són degudes al fet que, enagrupar les dades en intervals, hi ha una pèrdua d’informació, que augmenta amb l’am-plitud dels intervals. Vegeu que, si haguéssim fet intervals de 10 centímetres d’amplitud,la pèrdua de precisió hauria estat major i, per tant, també l’error en els càlculs succes-sius. Si, com en aquest cas, agrupem les dades en intervals d’una amplitud coherent, lapresentació de les dades les fa més assimilables, i l’anàlisi exploratòria no perd, gairebé,precisió.

Problema 1.3 Les temperatures que va registrar un termòstat en 25 assajos van ser:

55 54 55 51 5355 55 54 51 5655 55 54 53 5554 53 50 52 5655 55 50 56 55

a) Calculeu-ne la mitjana i la desviació tipus.b) Calculeu-ne la mediana i els quartils.

Solucio

El primer que farem és ordenar-les, de menor a major, i agrupar-les per classes segons laseva freqüència absoluta:

c1 = 50,c2 = 51,c3 = 52,c4 = 53,c5 = 54,c6 = 55,c7 = 56,

n1 = 2,n2 = 2,n3 = 1,n4 = 3,n5 = 4,n6 = 10,n7 = 3.

35

Page 33: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

a) Per al càlcul de la mitjana, apliquem la fórmula

x=

7

∑i=1

cini

7

∑i=1

ni

=134725

= 53.88,

i, per al càlcul de la desviació tipus,

sn =

√√√√√√√√

7

∑i=1

c2i ni

7

∑i=1

ni − x2

=√

2906.2−2903.0544=√

3.1456≈ 1.77358394

b) La mediana és l’element en la posició central. Com que tenim 25 elements, és l’ele-ment que ocupa la posició número 13, és a dir,Me = x13 = 55.

Per al càlcul del primer quartilQ1 o, equivalentment, el percentilp25, resolem perkl’equació

0.25=k−125−1

⇒ k= 7.

Per tant,Q1 = x7 = 53.

Per al càlcul del tercer quartilQ3 o, equivalentment, el percentilp75, resolem perkl’equació

0.75=k−125−1

⇒ k= 19.

Per tant,Q3 = x19 = 55.

Problema 1.4 Siguin xi , i = 1,. . . ,N un conjunt de dades ix la seva mitjana aritmètica.Vegeu que

a)N

∑i=1

(xi − x) = 0

b)N

∑i=1

(xi − x)2 =N

∑i=1

x2i −Nx2

Solucio

a) Ens demanen que vegem que la suma de les desviacions dels valorsxi respecte de laseva mitjana ¯x és igual a 0. Podem expressar el sumatori de la manera següent:

36

Page 34: Llibre estadística

Introducció i estadística descriptiva

a)N

∑i=1

(xi − x) =N

∑i=1

xi −N

∑i=1

x

Ara podem simplificar els dos sumatoris per separat. Mitjançant la fórmula de la mit-jana aritmètica, el primer sumatori queda com

x=1N

N

∑i=1

xi ⇒N

∑i=1

xi = Nx

Sabent que ¯x és constant respecte dei, podem simplificar el segon sumatori:

N

∑i=1

x= xN

∑i=1

1= x(1+1+1+ · · ·+1) = xN

i substituint en l’expressió inicial:

N

∑i=1

(xi − x) = Nx−Nx= 0

b) Si desenvolupem el quadrat de la diferència, obtindrem

N

∑i=1

(xi − x)2 =N

∑i=1

(x2

i −2x xi + x2)

Com hem fet abans, separem el sumatori:

N

∑i=1

(x2

i −2x xi + x2)=

N

∑i=1

x2i −

N

∑i=1

2x xi +N

∑i=1

x2

Sabem que ¯x és constant respecte dei; per tant, el segon sumatori el podem expressarcom

N

∑i=1

2x xi = 2xN

∑i=1

xi

i, com ja hem vist en el problema anterior,

N

∑i=1

xi = Nx ⇒ 2xN

∑i=1

xi = 2xNx

El tercer sumatori el podem simplificar també com hem fet a l’apartat anterior:

N

∑i=1

x2 = x2N

∑i=1

1= Nx2

Per tant, l’expressió inicial queda com

N

∑i=1

(xi − x)2 =N

∑i=1

x2i −2xNx+Nx2 =

N

∑i=1

x2i −Nx2

37

Page 35: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

a) que suposa una manera alternativa de calcular la variància:

s2N =

1N

N

∑i=1

(xi − x)2 =1N

N

∑i=1

x2i − x2

Problema 1.5 Sigui xi, i = 1,. . . ,N un conjunt de dades. Calculeu el valor de la varia-

bleα que fa mínima l’expressióN

∑i=1

(xi −α)2.

Solucio

Si definim f (α) =N

∑i=1

(xi −α)2, hem de trobar el mínim d’aquesta funció real de varia-

ble real. La condició necessària de mínim és quef ′(α) = 0; per tant, hem de trobar laderivada de la funció

f ′(α) =−2N

∑i=1

(xi −α)

Podem simplificar l’expressió com hem fet en el problema anterior:

f ′(α) =−2

(N

∑i=1

xi −N

∑i=1

α

)=−2(Nx−Nα) = 2N(x−α)

i, igualant a zero,

2N(x−α) = 0 ⇒ α= x

Perquè ¯x sigui un mínim, cal quef ′(α) = 0 i que f ′′(α)> 0:

f ′′(α) = (2N(x−α))′ = 2N ⇒ f (x)> 0

Per tant, el valor que fa mínima l’expressió ésα= x.

Problema 1.6 Sigui xi, i = 1,. . . ,N un conjunt de dades. Definim un nou conjunt dedades yi, i = 1,. . . ,N com

yi = a+bxi , i = 1,. . . ,N on a i b són constants.

a) Determineu la relació entre les mitjanes aritmètiques dels dos conjunts de dades.b) Determineu la relació entre les desviacions tipus dels dos conjunts de dades.

Solucio

a) Les mitjanes de les dues variables vénen donades per

x=1N

N

∑i=1

xi y=1N

N

∑i=1

yi

38

Page 36: Llibre estadística

Introducció i estadística descriptiva

a) Per tal de determinar la relació entre les dues mitjanes, expressarem ¯y en funció de ¯x,

y=1N

N

∑i=1

(a+bxi) =1N

(N

∑i=1

a+N

∑i=1

bxi

)

Atès quea i b són constants respecte dei,

y =1N

(a

N

∑i=1

1+bN

∑i=1

xi

)

=1N(Na+bNx)

= a+bx

b) Per tal de trobar la relació entre les desviacions tipus de les dues variables, comencembuscant la relació entre les seves variàncies. Expressem la variància de la variabley enfunció dex:

s2Y,N =

1N

N

∑i=1

(yi − y)2

=1N

N

∑i=1

(a+bxi − (a+bx))2

=1N

N

∑i=1

(bxi −bx)2

=1N

b2N

∑i=1

(xi − x)2

La variància de la variablex la calculem com

s2X,N =

1N

N

∑i=1

(xi − x)2

Substituint-ho en l’expressió anterior,

s2Y,N = b2 ·s2

X,N

Per tant, la relació entre desviacions tipus queda com,

sY,N = |b| ·sX,N

Veiem que la desviació tipus és invariant per a translacions de les dades.

39

Page 37: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 1.7 En una escola universitària, hi ha1008alumnes matriculats. D’aquests,504són alumnes de primer,360són alumnes de segon i144són alumnes de tercer. Elnombre mitjà d’assignatures que agafen els alumnes de primer és d’11.25+ c, on c ésla suma dels nombres del vostre DNI entre72, amb una desviació tipus de4.25. Els desegon n’agafen14.1+ c, amb una variància de26.19, i els de tercer12+ c, amb unadesviació tipus de3.5.

a) Calculeu la mitjana aritmètica i la desviació tipus del nombre d’assignatures quecursen els alumnes de tota l’escola.

b) S’ha fet un estudi del nombre d’anys que es tarda a finalitzar els estudis. S’han clas-sificat els alumnes en tres categories: alumne dins el procés de fase lenta, nf l ; alumneque treballa i no està dins la fase lenta, ntr , i els altres, nal. Les mitjanes obtingudesper a aquests grups han estat de7, 6.16 i 4.5, amb una mitjana global de5.375. Cal-culeu el nombre d’alumnes en cada categoria sabent que hi ha1 alumne que treballaper cada1.12alumnes que no treballen i no són de fase lenta.

Solucio

a) Comencem calculant-ne la mitjana aritmètica. La mitjana del nombre d’assignaturesmatriculades és el nombre total d’assignatures que han estat objecte de matrícula(NAM) entre el nombre total d’alumnes. El nombre d’alumnes el coneixem; per tant,ens cal trobar quantes assignatures han estat objecte de matrícula en total.

Sabem que la mitjana d’assignatures a què s’han matriculat els alumnes de primer ésde 11.25+c. Això vol dir que el nombre d’assignatures a què s’han matriculat els deprimer (NAM1) entre 504 és 11.25+c; per tant,

NAM1504

= 11.25+c ⇒ NAM1= (11.25+c) ·504= 5670+504c

De la mateixa manera, trobem les assignatures a què s’han matriculat els alumnes desegon i tercer:

NAM2360

= 14.1+c ⇒ NAM2= (14.1+c) ·360= 5076+360c

NAM3144

= 12+c ⇒ NAM1= (12+c) ·144= 1728+144c

Per tant, el nombre total d’assignatures objecte de matrícula és:

NAM = NAM1+NAM2+NAM3

= 5670+504c+5076+360c+1728+144c

= 12474+1008c

i la mitjana aritmètica:

x=12474+1008c

1008= 12.375+c

40

Page 38: Llibre estadística

Introducció i estadística descriptiva

a) El que hem fet es pot veure com una mitjana ponderada:

x=(11.25+c) ·504+(14.1+c) ·360+(12+c) ·144

1008= 12.375+c

La desviació tipus la calculem mitjançant la variància. Per tal de calcular la variància,coneixem dues expressions:

s2n =

1N

N

∑i=1

(xi − x)2 =1N

N

∑i=1

x2i − x2

on xi és el nombre d’assignatures a què es matricula cada alumne. En aquest cas, faremservir la segona fórmula. Si denotem per ¯x1 i s2

504,1 la mitjana i la variància del nombred’assignatures a què s’han matriculat els de primer, i fem el mateix pels de segon itercer, tenim

4.252 = s2504,1=

1504

504

∑i=1

x2i,1− x2

1 =1

504

504

∑i=1

x2i,1−11.252

26.19= s2360,2=

1360

360

∑i=1

x2i,2− x2

2 =1

360

360

∑i=1

x2i,2−14.12

3.52 = s2144,3=

1144

144

∑i=1

x2i,3− x2

3 =1

144

144

∑i=1

x2i,3−122

Per tant,

504

∑i=1

x2i,1 = 504· (18.0625+11.252) = 72891

360

∑i=1

x2i,2 = 360· (26.19+14.12) = 81000

144

∑i=1

x2i,3 = 144· (12.25+122) = 22500

Si ara tenim en compte que la suma dels nombres d’assignatures al quadrat dels alum-nes les podem sumar per separat segons si són de primer, segon o tercer, és a dir:

1008

∑i=1

x2i =

504

∑i=1

x2i,1+

360

∑i=1

x2i,2+

144

∑i=1

x2i,3

tenim que la variància ve donada per

s21008 =

11008

N

∑i=1

x2i − x2

41

Page 39: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

=1

1008

(504

∑i=1

x2i,1+

360

∑i=1

x2i,2+

144

∑i=1

x2i,3

)−12.3752

=1

1008(72891+81000+22500)−12.3752 ≈ 21.85

Per tant, la desviació tipus és

s1008=√

s21008 ≈ 4.67

b) Com ja hem vist en el càlcul de la mitjana d’assignatures a l’apartat anterior, la mitja-na aritmètica d’un conjunt segmentat en diversos subconjunts dels quals coneixem lamitjana, la podem calcular com una mitjana ponderada. Si denotem per ¯ai la mitjanad’anys que triga el subconjunti a acabar la carrera, tenim

a=af l ·nf l + atr ·ntr + aal ·nal

nf l +ntr +nal

⇒ 5.375=7·nf l +6.16·ntr +4.5·nal

nf l +ntr +nal

Sabem, a més, que el nombre total d’alumnes és de 1008 i que, per a cada alumneque treballa, n’hi ha 1.12 que no treballen ni són de fase lenta. Tenim, per tant,

5.375=7·nf l +6.16·ntr +4.5·nal

nf l +ntr +nal

nf l +ntr +nal = 1008

1.12ntr = nal

Resolent aquest sistema d’equacions, obtenim

ntr = 450 nal = 504 nf l = 54

Problema 1.8 A la consulta de la doctora Villa s’ha fet un estudi sobre la pressió ar-terial sistòlica (mesurada en mmHg) dels pacients durant un mes. Els resultats s’hanrecollit en una taula, però algunes dades s’han esborrat accidentalment. Es disposa,per tant, només de les dades següents:

PAS(xi) mi ni Ni fi Fi

[100,120) 110 35

[120,130) 125 25 0.6

[130,140) 135 0.7

[140,150) 145 0.1

[150,160) 155

[160,180) 170 5

42

Page 40: Llibre estadística

Introducció i estadística descriptiva

on mi és la marca de classe, ni la freqüència absoluta, Ni la freqüència absoluta acumu-lada, fi la freqüència relativa i Fi la freqüència relativa acumulada.

a) Completeu les dades que falten a la taula.b) Calculeu la mitjana aritmètica.c) Calculeu la mediana.

Solucio

a) Per al primer interval[100,120), la freqüència absoluta ha de coincidir amb l’absolutaacumulada. Aleshores, coneixent el valorn2, també podrem calcularN2:

n1 = N1 = 35 N2 = N1+n2 = 35+25= 60

El valor conegut de la freqüència relativa del tercer interval ens permet ara trobar elnombre total de pacients que han participat a l’estudi, que coincideix amb la freqüèn-cia absoluta acumulada de l’últim interval:

F2 =N2

N⇒ N =

N2

F2=

600.6

= 100= N6

Amb això podem trobar les freqüències absolutes dels intervals següents:

N3 = F3 ·N = 0.7·100= 70 n3 = N3−N2 = 70−60= 10

n4 = f4 ·N = 0.1·100= 10 N4 = N3+n4 = 70+10= 80

i les absolutes del cinquè interval:

n5 = N− (n1+n2+n3+n4+n6) = 100− (35+25+10+10+5) = 15

N5 = N4+n5 = 80+15= 95

Podem ara trobar les freqüències relatives i relatives acumulades que ens manquen,sabent que:

fi =ni

100Fi =

Ni

100

Per tant, la taula queda de la manera següent:

a)PAS(xi) mi ni Ni fi Fi

[100,120) 110 35 35 0.35 0.35

[120,130) 125 25 60 0.25 0.6

[130,140) 135 10 70 0.1 0.7

[140,150) 145 10 80 0.1 0.8

[150,160) 155 15 95 0.15 0.95

[160,180) 170 5 100 0.05 1

43

Page 41: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

b) Coneixent totes les dades, podem fer servir l’expressió ¯x=k

∑i=1

mi fi:

x= 110·0.35+125·0.25+135·0.1+145·0.1+155·0.15+170·0.05= 129.5

c) El valor que parteix una mostra de 100 dades en dues meitats es troba entre el 50i el 51. En aquest, cas agafem, doncs, l’interval[120,130), i aplicant la fórmula

Me = l i−1+

ni +1ai +1

ni +1ai +1

+ni −1ai −1

·ai: Me = 120+

1510

1510

+2510

·10=138011

≈ 125.45

Problema 1.9 Una coneguda marca de cotxes ha calculat els beneficis totals obtingutsdurant un mes per la venda de cada un dels quatre models que fabrica, i els beneficisque genera una unitat de cada model (en milers d’euros).

model beneficis mensuals Bi beneficis per unitat bi

A 6684 3.00

B 4995 2.22

C 2695 1.96

D 4428 1.80

Calculeu el benefici mitjà obtingut en vendre un cotxe.

Solucio

Podem calcular el benefici mig que s’obté per cotxe com el benefici total obtingut entreel total de cotxes venuts. Denotem perBT el benefici total obtingut durant aquest mes,que serà:

BT = 6684+4995+2695+4428= 18802

Denotem perCi el nombre de cotxes venuts del modeli, que correspon al total de be-

neficis generats per un model entre el benefici unitari del mateixCi =Bi

bi

. Llavors, el

nombre total de cotxes serà:

CT = CA+CB+CC +CD

=66843.00

+49952.22

+26951.96

+44281.80

= 8313

Per tant, el benefici mitjà per cotxe venut és:

b=BT

CT

=188028313

≈ 2.26

44

Page 42: Llibre estadística

Introducció i estadística descriptiva

Problema 1.10 En una botiga d’ordinadors, s’estimen unes vendes diàries de6 ordina-dors de taula i9 portàtils. Els guanys mitjans dels ordinadors de taula són de200euros,amb una desviació tipus de50 euros. En els portàtils, el guany mitjà és de250 euros,amb una desviació tipus de80 euros. Determineu el guany mitjà per article venut i laseva desviació tipus.

Solucio

Denotem perGi,T els guanys d’un ordinador de taula, perGi,P els guanys d’un portàtil i perGi el guany d’un ordinador en general. També denotem pernT i nP el número d’ordinadorsde taula i portàtils que es venen al dia. Tenim, llavors:

GT = 200 σT = 50 nT = 6

GP = 250 σP = 80 nP = 12

Calculem la mitjana de guanys general comG=

N

∑i=1

Gi

N, que podem expressar com

G=

N

∑i=1

Gi,T +N

∑i=1

Gi,P

nT +nP

Coneixent les mitjanes particulars,

GT =

N

∑i=1

Gi,T

nT

⇒N

∑i=1

Gi,T = GT ·nT

GP =

N

∑i=1

Gi,P

nP

⇒N

∑i=1

Gi,P = GP ·nP

i, si ho ajuntem tot,

G =GT ·nT + GP ·nP

nT +nP

=200·6+250·9

6+9= 230

El que hem fet és una mitjana ponderada de les dues mitjanes aritmètiques.

Per tal de calcular la variància de tot el conjunt, fem servir la fòrmulaσ2 =

N

∑i=1

G2i

N− G2,

que en aquest cas podem expressar com

45

Page 43: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

σ2 =

N

∑i=1

G2i,T +

N

∑i=1

G2i,P

nT +nP

− G2

Coneixent les desviacions tipus dels subconjunts, podem trobar els dos sumatoris:

σ2T =

N

∑i=1

G2i,T

nT

− G2T ⇒

N

∑i=1

G2i,T = (σ2

T + G2T) ·nT

σ2P =

N

∑i=1

G2i,P

nP

− G2P ⇒

N

∑i=1

G2i,P = (σ2

P+ G2P) ·nP

per tant, la variància general queda com

σ2 =(σ2

T + G2T) ·nT +(σ2

P+ G2P) ·nP

nT +nP

− G2

=(502+2002) ·6+(802+2502) ·9

6+9−2302 = 5440

i la desviació tipus,

σ =√

5440≈ 73.76

Problema 1.11 Un professor decideix qualificar els seus alumnes segons el criteri se-güent: suspendrà tot alumne que tingui una nota inferior a la mediana. Si la nota estroba entre la mediana i el percentil P75, tindrà un aprovat; fins al percentil P95, un no-table i, per sobre, un excel·lent. Les notes obtingudes són les següents:

notes nre. d’alumnes

[0,1] 4

(1,2] 3

(2,3] 6

(3,4] 12

(4,5] 19

(5,6] 24

(6,7] 18

(7,8] 8

(8,9] 5

(9,10] 1

Trobeu els intervals de les diferents qualificacions.

46

Page 44: Llibre estadística

Introducció i estadística descriptiva

Solucio

Per tal de calcular els percentils, necessitarem les freqüències acumulades:

xi ni Ni

[0,1] 4 4

(1,2] 3 7

(2,3] 6 13

(3,4] 12 25

(4,5] 19 44

(5,6] 24 68

(6,7] 14 82

(7,8] 11 93

(8,9] 5 98

(9,10] 2 100

Per tal de calcular els percentils amb valors agrupats per intervals, fem servir l’expressió:

Pk = l i−1+

k ·N100

−Ni−1

ni

·ai

Per tant,

P50 = 5+

50·100100

−44

24·1= 5.25

P75 = 6+

75·100100

−68

14·1= 6.50

P95 = 8+

95·100100

−93

5·1= 8.40

i els intervals queden com a

suspens [0,5.25)

aprovat [5.25,6.50)

notable [6.50,8.20)

excel·lent[8.20,10]

47

Page 45: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 1.12 Un equip de futbol italià va fer 26 gols a la lliga, en què la mitjana degols dels equips va ser de 23, amb una desviació tipus de 4 gols. Un altre equip, aquestalemany, va fer 22 gols a la seva lliga, en què la mitjana de gols va ser de 19, amb unadesviació de 3 gols. Quin dels dos equips és més golejador?

Solucio

Per a poder comparar dos valors de poblacions diferents, els hem de tipificar segonsl’expressió:

z=x−µσ

En aquest cas,

z1 =26−23

4= 0.75

z2 =22−19

3= 1

Per tant, l’equip alemany és més golejador.

48

Page 46: Llibre estadística
Page 47: Llibre estadística

Hola

Page 48: Llibre estadística

Elements de probabilitat

“La théorie des probabilités n’est au fond que le bon sens réduit au calcul.”

Pierre Simon Laplace,Théorie analytique des probabilités, 1820.

Els conceptes d’atzar i aleatorietat han estat presents en la humanitat des de les primerescivilitzacions, que vivien sota la incertesa del clima i de l’abastiment d’aliments. Ac-tualment, disciplines com l’economia o la climatologia persegueixen, en gran manera,controlar la incertesa: en el camp de l’economia, per determinar el risc de les inversionsi predir com evolucionarà el mercat; en la climatologia, per estimar com de probablessón determinats escenaris i valorar els possibles efectes del canvi climàtic. La teoria dela probabilitat és la branca de les matemàtiques que s’ocupa de l’estudi dels fenòmensestocàstics, sotmesos a l’atzar.

2.1. Experiencies aleatories i espai mostral

Anomenemexperiència aleatòriaqualsevol experiència el resultat de la qual no podempredir d’una manera exacta. En contrast amb aquest tipus d’experiments, aquells el re-sultat dels quals es pot predir s’anomenenexperiments deterministes.

Definim l’espai mostralΩ associat a una experiència aleatòria com el conjunt de tots elsresultats possibles que es poden obtenir en realitzar l’experiència aleatòria. En particular,anomenemesdeveniment elementalcada un dels elements de l’espai mostralΩ.

L’espai mostral pot ser finit, infinit numerable o infinit no numerable. Per exemple, en elcas del llançament d’un dau de 6 cares, tenim 6 resultats possibles, de manera queΩ ésfinit. En canvi, si demanem a algú que pensi un nombre qualsevol, el conjunt de resultatsés infinit.

En matemàtiques, es diu que un conjunt ésinfinit numerablequan es pot posar en correspon-dènciaun a un(bijectiva) amb el conjunt dels nombres naturals. Per exemple, el conjunt delsnombres parells és un conjunt infinit numerable, ja que es pot establir la bijecció següent:

51

Page 49: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

naturals 7→ parells1 7→ 22 7→ 43 7→ 6

· · · 7→ · · ·

Són exemples de conjunts infinits numerables:

- el conjunt dels nombres naturals,N;- el conjunt dels nombres enters,Z;- el conjunt dels nombres racionals,Q.

Si un conjunt infinit no es pot bijectar amb els nombres naturals, es diu que ésinfinit nonumerable. Són exemples de conjunts infinits no numerables:

- el conjunt dels nombre reals,R;- qualsevol interval dels nombres reals,[a,b]⊂ R, ona< b, a,b∈ R.

Exemple 2.6 Considerem l’experiència aleatòria de llançar a l’aire una moneda tresvegades. En aquest cas, l’espai mostral és

Ω = ccc,cc+,c+c,+cc,c++,+c+,++c,+++,

que és un conjunt format per 8 elements.

2.2. Esdeveniments o successos

Un esdevenimentés qualsevol subconjunt de l’espai mostralΩ, quan aquest és fi-nit o infinit numerable. En aquests casos, el conjunt dels esdeveniments és el conjuntE = P(Ω) de les parts deΩ. Seguint amb els exemples anteriors, alguns successos enel cas de tirar un dau són: que surti parell, que surti 1 (esdeveniment elemental) o quesurti major que 3. Per a l’experiment aleatòri d’escollir un nombre, que el nombre triatsigui natural és un possible esdeveniment.

Exemple 2.7 Considerem l’experiència aleatòria de tirar un dau de 6 cares. En aquestcas, l’espai mostral és

Ω = 1,2,3,4,5,6.

L’esdeveniment “que surti parell” és el subconjunt2,4,6 ⊂ Ω i l’esdeveniment “que sur-ti 1”, el subconjunt1 ⊂ Ω. Per a aquesta experiència, el conjunt d’esdeveniments és:

E = P(Ω) = /0,1,2,3,4,5,6,1,2,1,3,1,4,1,5,1,6,2,3,2,4,2,5,2,6,...1,2,3,4,5,1,2,3,5,6,1,2,4,5,6,1,3,4,5,6,2,3,4,5,6,1,2,3,4,5,6.

52

Page 50: Llibre estadística

Elements de probabilitat

Aquest conjunt té26 elements, que denotem així:

#E = 2#Ω = 64,

on el símbol# representa el cardinal o nombre d’elements d’un conjunt.

Utilitzem la notacióE per representar el conjunt dels esdeveniments d’una experiènciaaleatòria. En particular:

- L’espai mostralΩ l’anomenemesdeveniment segur.- El conjunt buit /0 l’anomenemesdeveniment impossible.

Observació 2.3Si A i B són dos esdeveniments associats a una experiència aleatòria,llavors:

- A∪B (que es llegeix “A unió B”) és l’esdeveniment que es compleix quan es complei-xen l’esdeveniment A o el B (o tots dos).

2.8La zona grisa representala unió dels conjunts i .A B

A BA∪B

- A⊔B (que es llegeix “la unió disjunta de A i B”) és l’esdeveniment que es compleixquan es compleix o bé l’esdeveniment A, o bé l’esdeveniment B (però no tots dosalhora).

2.9La zona grisa representala unió disjunta delsconjunts i .A B

A BA⊔B

- A∩B (que es llegeix “A intersecció B) és l’esdeveniment que es compleix quan escompleixen simultàniament A i B.

2.10La zona grisa representala intersecció delsconjunts i .A B

A BA∩B

53

Page 51: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

- A (que es llegeix “el complementari de A”) és l’esdeveniment que es compleix quanl’esdeveniment A no es compleix; l’esdeveniment complementari.

2.11La zona grisa representa

el complementari delconjunt A A B

ΩA

Diem que dos esdeveniments sónmútuament excloentso incompatiblessi tenen unaintersecció buida. En cas contrari, es diu que els esdeveniments sóncompatibles.

2.3. Axiomatica de la probabilitat

Es diu que una aplicació del conjuntE dels esdeveniments sobre els nombres reals

P : E → R

és una probabilitat si compleix els axiomes següents:

- P(A)≥ 0, ∀A∈ E- P(Ω) = 1- Donada una sèrie de successos mútuament incompatibles,Ai ∩Aj = /0 per ai 6= j,

aleshores es compleix:

P

(∞⋃

i=1

Ai

)=

∑i=1

P(Ai)

Notem que podem definir diferents probabilitats sobre un mateix espai mostral. Unexemple molt clar és el cas de les monedes trucades, en les quals la probabilitat d’un delsdos esdeveniments elementals (cara o creu) és superior a l’altre. Típicament, definiríemla probabilitat sobre l’espai mostral comP(cara) = P(creu) = 1

2, però si la moneda està

trucada la funció de probabilitat que defineix el fenomen és diferent:P(cara) = 12± ǫ i

P(creu) = 12± (−ǫ).

Propietats de la probabilitat

SiguinA i B dos esdeveniments d’una experiència aleatòria. Aleshores,

(i) P( /0) = 0(ii) DonatsA i B incompatibles, aleshoresP(A∪B) = P(A)+P(B)

(iii) P(A) = 1−P(A)(iv) A⊂ B⇒ P(A)≤ P(B)(v) P(A∪B) = P(A)+P(B)−P(A∩B)

54

Page 52: Llibre estadística

Elements de probabilitat

Demostració

(i) 1 = P(Ω) = P(Ω∪ /0∪ /0∪ . . .) = P(Ω)+∞

∑i=1

P( /0)⇒∞

∑i=1

P( /0) = 0⇒ P( /0) = 0

(ii) P(A∪B) = P(A∪B∪ /0∪ /0∪ . . .) = P(A)+P(B)+∞

∑i=1

P( /0) = P(A)+P(B)

(iii) Com queΩ = A∪ A i els conjuntsA i A són incompatibles,

1= P(Ω) = P(A∪ A) = P(A)+P(A)⇒ P(A) = 1−P(A).

(iv) Denotem perB−A=A∩B. Com queA⊂B, B=A∪(B−A), on la unió és disjunta.Per la segona propietat,P(B) = P(A) +P(B− A) i, com que la funcióP és nonegativa,P(A)≤ P(B).

(v) SiguiC = A∩B. Aleshores,C ⊂ B, de manera queP(B−C) = P(B)−P(C). ComqueA∪B= A∪ (B−C) i la unió és disjunta, tenim que

P(A∪B) = P(A)+P(B−C) = P(A)+P(B)−P(C) = P(A)+P(B)−P(A∩B).

2.4. Probabilitat condicionada. Teorema de Bayes

Suposem que sabem que un matrimoni té dos fills i que un d’ells és una nena. És clarque, amb la informació de què es disposa, la probabilitat que tinguin dues filles és1

3, ja

que dels tres casos possibles: (nena,nen), (nen, nena), (nena, nena), només un satisfàque tinguin dues nenes. Suposem ara que, passejant pel carrer, ens hem trobat el matri-moni acompanyat d’una filla. Quina és ara la probabilitat que tots dos fills siguin nenes?Observem que ara només pot passar que el fill que no va amb ells sigui un nen o bé quesigui una nena. De manera que la probabilitat que siguin dues nenes és1

2.

Moltes vegades, és interessant calcular la probabilitat d’un esdevenimentA, condiciona-da al fet que s’hagi verificat un altre esdevenimentB. Aquesta probabilitat la representencomP(A|B) i la definim a partir de la idea que l’espai mostral queda restringit als casosen què es verificaB.

Definició 2.31 (Probabilitat condicionada) La probabilitat que succeeixi l’esdeveni-ment A condicionada al fet que hagi succeït l’esdeveniment B es defineix de la manerasegüent:

P(A|B) = P(A∩B)P(B)

.

Conseqüència directa d’aquesta fórmula és que

P(A∩B) = P(B) ·P(A|B).

Definició 2.32 (Independència)Dos esdeveniments A i B sonindependentsquan el fetque se’n verifiqui un no influeix en la probabilitat que es verifiqui l’altre. És a dir, quan

P(A|B) = P(A)

55

Page 53: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Conseqüència d’aquesta definició és que siA i B són independents aleshores

(PA∩B) = P(A) ·P(B)

Observació 2.4Cal no confondre esdevenimentsincompatiblesamb esdevenimentsin-dependents.

Proposició 2.2 Sigui (Ω,P) un espai de probabilitat, és a dir,Ω un espai mostral i Puna funció de probabilitat sobre aquest espai mostral. Sigui B⊂ Ω tal que P(B) > 0.Aleshores, PB = P(·|B) defineix una funció de probabilitat.

Demostració.Cal comprovar queP(·|B) compleix els tres axiomes d’una probabilitat.En efecte:

(i) DonatA⊂ Ω, PB(A) = P(A|B) = P(A∩B)P(B)

≥ 0, perquèP és una probabilitat.

(ii) PB(Ω) = P(Ω|B) = P(Ω∩B)P(B)

=P(B)P(B)

= 1

(iii) Donada una sèrie de successos mútuament incompatibles,Ai ∩Aj = /0 per ai 6= j;aleshores, es compleix:

P

(∞⋃

i=1

Ai|B)

=P(⋃

Ai ∩B)

P(B)=

1P(B)

∑i=1

P(Ai ∩B) =∞

∑i=1

P(Ai|B).

Teorema 2.1 (de la probabilitat total) Si A1,. . . ,An és una partició deΩ, és a dir,

Ω =n⋃

i=1

Ai, Ai ∩Aj = /0, i 6= j; aleshores, si B és un esdeveniment qualsevol,

P(B) =n

∑i=1

P(Ai) ·P(B|Ai).

2.12Partició de l’espai

mostral en quatreconjunts disjunts A1, A2,

A3 i A4.

Ω

A1 A2 A3 A4

B

Ω

Demostració. Com queA1,. . . ,An és una partició de l’espaiΩ, tenim que

P(B) = P(B∩Ω) = P(B∩(∪n

j=1Aj

))= P

(∪n

j=1 (Aj ∩B))=

n

∑j=1

P(Aj ∩B)

Per definició de probabilitat condicionada,P(Aj ∩B) = P(B|Aj)P(Aj). Per tant,

P(B) =n

∑j=1

P(Aj ∩B) =n

∑j=1

P(B|Aj)P(Aj)

56

Page 54: Llibre estadística

Elements de probabilitat

Exemple 2.8 Es disposa de dues urnes, A i B. La primera conté 3 boles negres i 2 blanques, ila segona 2 negres i 5 blanques. Es llança una moneda a l’aire, de manera que si surt caraes treu una bola de A i si surt creu, de B. Quina és la probabilitat de treure una negra?

Resoldre aquest problema per mitjà de l’ús del teorema de les probabilitats totals és moltsenzill. Considerem A1 = extracció de l’urna A i A2 = extracció de l’urna B. Obser-vem que, quan realitzem l’experiència aleatòria, o bé traurem una bola de A o bé una deB. Per tant, A1 i A2 constitueixen una partició. Notant per N:= treure bola negra, perla fórmula de les probabilitats totals:

P(N) = P(N∩A1)+P(N∩A2) = P(A1)P(N|A1)+P(A2)P(N|A2) =12· 35+

12· 27=

3170

Arbre de probabilitats

Considerem el problema següent: es disposa de dues urnesA i B. La primera conté 1bola negra (n) i 2 blanques (b), i la segona 2 negres i 1 blanca. Es llança una moneda, demanera que si surt cara es treu una bola deA i si surt creu, deB. Quina és la probabilitatde treure una negra?

Per a representar de forma molt adequada aquest tipus d’experiències, es pot realitzarl’esquema següent, anomenatarbre de probabilitats.

2.13Arbre de probabilitats.Cada fulla de l'arbre escalcula com el productede les probabilitats de lesbranques que li arriben.P(A)

A

P(n|A)

P(b|A)

P(A∩n)

P(A∩b)

P(B∩n)

P(B∩b)

P(n|B)

P(b|B)

B

P(B)

Cada fletxa del diagrama és unabrancade l’arbre; a cada branca, li assignem la proba-bilitat que li correspon. Un recorregut des de l’inici de l’experiment fins al final (fulles)s’anomenacamí. La probabilitat d’aquest camí és elproductede les probabilitats de lesbranques que el componen. Un cop estem situats, per exemple, enA, les branques quesurten han de tenir present aquest fer i, per tant,condicionarles probabilitats de les bran-ques que surten. D’aquesta manera, les dues branques que surten deA sónP(n|A) i P(b|A).

Finalment, el que ens demanen és la probabilitat de treure una bola negra. Això és lasuma de les probabilitats de les fulles que tenen una bola negra:

P(n) = P(A∩n)+P(B∩n)= P(A) ·P(n|A)+P(B) ·P(n|B).

57

Page 55: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Teorema 2.2 (de Bayes)Siguin A1,. . . ,An una partició deΩ. Donat B⊂Ω, amb P(B)>0, per a tot i= 1,. . . ,n es compleix:

P(Ai|B) =P(Ai)P(B|Ai)

∑nj=1 P(Aj)P(B|Aj)

Demostració. En virtut del teorema de la probabilitat total i de la definició de probabi-litat condicionada,

P(Ai|B) =P(Ai ∩B)

P(B)=

P(B|Ai)P(Ai)

∑nj=1 P(Aj ∩B)

=P(B|Ai)P(Ai)

∑nj=1 P(B|Aj)P(Aj)

2.5. Nocions de combinatoria

En molts experiments estadístics, el nombre de resultats possibles és tan gran que des-criure’ls tots pot ser massa costós o difícil. Per això, és necessari disposar de mètodesde còmput que determinin el nombre total de resultats possibles i el de determinats es-deveniments. La combinatòria és la part de les matemàtiques que estudia la formacióde subconjunts d’un conjunt finit donat, tenint en compte el nombre i l’ordenació delsseus elements; en conseqüència, també s’ocupa de l’estudi d’algoritmes i fórmules decòmput.

Principi de multiplicacio

El nombre total de maneres diferents de realitzar diverses eleccions successives és elproducte del nombre de formes diferents en què pot fer-se cadascuna d’elles.

Per exemple, suposem que per anar de Madrid a Barcelona hi ha tres rutes diferents: avió,tren o cotxe. Per anar de Barcelona a Sicília es pot prendre l’avió o el vaixell. Aleshores,pel principi de multiplicació, el viatge de Madrid a Sicília, passant per Barcelona, es potfer de 3·2= 6 maneres.

Variacions

Donatsm elementsa1,. . . ,am diferents, anomenemvariacionsd’aquestsm elementsagafats den enn (n≤ m) els diferents grups den elements formats amb elsm, conside-rant dos grups diferents si difereixen en algun dels seus elements o en el seu ordre.En resum, les variacions es caracteritzen per:

(i) No es poden repetir elements.(ii) Importa l’ordre.

(iii) En cada grup no estan inclosos tots elsmelements, llevat quen= m.

Farem servir la notacióVm,n per representar el nombre de variacions dem elements aga-fats den enn. Aquest nombre és

Vn,m= m· (m−1) · (m−2) · · · (m−n+1).

58

Page 56: Llibre estadística

Elements de probabilitat

Demostració. Per obtenir un element deVm,n cal realitzarn eleccions successives. Comque no es poden repetir els elements i l’ordre importa, primer podem escollir entre elsm totals. A la segona tria, entre elsm−1 restants, i així successivament. Pel principi demultiplicació, resulta de forma trivial la fórmula.

Permutacions

Anomenempermutacionsdem elements diferentsa1,. . . ,am totes les possibles orde-nacions d’aquestsmelements.

Les propietats que caracteritzen les permutacions són:

(i) No se’n repeteixen elements.(ii) L’ordre importa.

(iii) A cada grup, estan inclosos tots els elements.

El nombre de permutacions demelements es representa perPm i coincideix amb el nom-bre de variacions demelements agafats demenm, és a dir,

Pm = m!

Combinacions

Donatsm elements diferentsa1,. . . ,am, anomenemcombinacionsd’aquestsm ele-ments presos den en n (n ≤ m) els diferents grups den elements formats amb elsm,considerant que dos grups són diferents si difereixen en algun element.

En resum, les combinacions es caracteritzen perquè:

(i) No se’n repeteixen elements.(ii) L’ordre no importa.

(iii) A cada grup, no estan inclosos tots els elements, excepte quann= m.

Farem servir la notacióCm,n per representar el nombre de combinacions dem elementsagafats den enn. Aquest nombre és

Cm,n =

(mn

)=

m!(m−n)! ·n!

Demostració. Per obtenir un element deVm,n, es fan les dues eleccions consecutives se-güents:

(i) Escollir elsn elements. Això es pot fer deCm,n maneres possibles.(ii) Triar una ordenació delsn elements. Això es pot fer dePn maneres diferents.

Per tant, pel principi de multiplicació:

Vm,n =Cm,n ·Pn =⇒ Cm,n =Vm,n

Pn

=

m!(m−n)!

n!=

m!(m−n)! ·n!

,

tal com volíem veure.

59

Page 57: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Variacions amb repeticio

Disposem dem elements diferentsa1,. . . ,am. Anomenemvariacions amb repeticiód’aquestsmelements agafats den enn (n≤ m) els diferents grups den elements formatsamb elsm, repetits o no, considerant dos grups diferents si difereixen en algun element,en el nombre de cops que es repeteix o en el seu ordre.

En resum, les variacions amb repetició es caracteritzen perquè:

(i) Se’n poden repetir elements.(ii) L’ordre importa.

(iii) A cada grup, poden no estar-hi inclosos tots elsmelements.

Fem servir la notacióVRm,n per representar el nombre de variacions amb repetició demelements agafats den enn. Com que en cada elecció hi hamelements diferents,

VRn,m= mn.

Permutacions amb repeticio

Donatsm elementsa1,. . . ,am entre els quals hi hak1 iguals entre si i diferents de laresta;k2 iguals entre si i diferents de la resta, . . . ikr iguals entre si i diferents de la resta(onk1+k2+ · · ·+kr =m), anomenempermutacions amb repeticiód’aquestsmelementscada una de les maneres diferents d’ordenar-los.

Les permutacions amb repetició es caracteritzen perquè:

(i) A cada grup, s’hi troben tots els elements, repetits el mateix nombre de vegades.(ii) L’ordre importa.

Fem servir la notacióPRk1,k2,...,krm per a representar el nombre de permutacions amb repe-

tició. Aquest nombre és

Pk1,k2,...,kr

m =m!

k1!k2! · · ·kr !

Demostració. Suposem que s’etiqueta cada element amb un número diferent. Per obte-nir una permutació delsn números, es poden fer les dues eleccions següents:

(i) Escollir una permutació amb repetició delsm elements sense mirar-ne el númeroque tenen associat. Això es pot fer dePRk1,k2,...,kr

m maneres diferents.(ii) Permutar cadascun delski números delsr grups d’elements iguals. Això es pot fer

dek1! · · ·kr ! formes.

En conclusió,

m! = PRk1,k2,...,kr

m k1! · · ·kr ! =⇒ PRk1,k2,...,kr

m =m!

k1!k2! · · ·kr !,

tal com volíem veure.

60

Page 58: Llibre estadística

Elements de probabilitat

Combinacions amb repeticio

Donatsm elements diferentsa1,. . . ,am, anomenemcombinacions amb repeticiódelsm elements agafats den en n els diferents grups den elements formats amb elsm dequè es disposa després den extraccions amb reemplaçament. Es considera que dos grupssón diferents si difereixen en algun dels seus elements o en el nombre de vegades que esrepeteixen.

En resum, les combinacions amb repetició es caracteritzen perquè:

(i) Se’n poden repetir elements.(ii) L’ordre no importa.

(iii) A cada grup, poden no estar-hi inclosos tots elsmelements.

Fem servir la notacióCRm,n per representar el nombre de combinacions amb repetició demelements agafats den enn. Aquest nombre és

CRm,n =

(m+n−1

n

)=

(m+n−1)!(m−1)! ·n!

Demostració. Observem que el problema de comptar el nombre de combinacions ambrepetició el podem entendre com el de repartirn boles enm urnes diferents, de maneraque les boles representen el nombre de vegades que surt cada element, i les urnes, elsmelements diferents. Les diferents formes de repartir les boles es poden calcular com lesde construir successions formades pern boles im−1 parets separatòries entre les urnes.D’aquesta manera, obtenim que

CRm,n = PR(m−1),nm+n−1 =

(m+n−1)!(m−1)! ·n!

,

tal i com volíem veure.

Problemes resolts (combinatoria)

Problema 2.1 Tres classes d’estudiants de batxillerat tenen 20, 18 i 25 alumnes, respec-tivament. Es forma un equip amb un estudiant de cada classe. De quantes maneres espot formar l’equip? I si es forma amb tres estudiants de cada classe?

Solucio

Com que l’estudiant que s’escull de cada classe és independent de quins escollim a lesaltres classes, tenim que el nombre de formes d’escollir l’equip és, pel principi de multi-plicació, 20·18·25= 9000.

Si prenem 3 estudiants de cada classe, el que tindrem és que el nombre total d’equipspossibles serà el producte de les formes de triar 3 estudiants de cada classe, és a dir,

(203

)·(

183

)·(

253

)= 2139552000 composicions possibles.

61

Page 59: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 2.2 Donat un conjunt de n·q elements diferents, de quantes maneres es potfer una partició en n subconjunts de q elements?

Solucio

Un cop escollits els primersq elements, n’hem d’escollirq d’entre elsn·q−q= (n−1)qrestants. Després,q d’entre els(n−2)q que encara no s’han agafat, i així successiva-ment. Per tant, pel principi de multiplicació, el nombre de subconjunts és(

nqq

)·((n−1)q

q

)· · ·(

2qq

)(qq

)=

(nq)!q![(n−1)q]!

· [(n−1)q]!q![(n−2)q]!

· · · q!q!

=(nq)!(q!)n

.

Problema 2.3 En una bossa, tenim 25 lletres diferents i en traiem 3 a l’atzar sensereemplaçament. Quantes paraules diferents poden formar-se?

Solucio

Es tracta d’un problema de variacions sense repetició. El nombre de paraules és 25·24·23= 13800.

Problema 2.4 En un congrés, hi ha 6 dones i 4 homes. Si sabem que entre els assistentshi ha quatre parelles, quantes possibilitats tenim a l’hora de conjecturar quines són lesquatres parelles? I si n’hi ha tres?

Solucio

Per al cas de quatre parelles, tenim que els 4 homes estan casats i, per tant, cal saberquines 4 dones estan casades i amb quin home. Fixant una ordenació dels 4 homes,cada llista ordenada de 4 dones escollides entre les 6 formarà una possible conjecturadiferent. Pel principi de multiplicació, el total serà el producte de les maneres d’escollirles 4 dones per les seves ordenacions. Això és

C6,4 ·P4 =

(64

)·4! = 360.

Si només hi ha tres parelles casades, el que cal és primer escollir els homes casats (hi ha(43

)possibilitats) i després seguir el mateix raoament que abans. Per tant, tindrem

(43

)(63

)P3 = 480.

Problema 2.5 Quants resultats diferents es poden obtenir després de llançar cinc ve-gades una moneda a l’aire?

Solucio

Cada tirada té dos possibles resultats, cara o creu. Considerem diferents dos resultatsamb ordres diferents, és a dir,cara,cara,creu,cara,cara 6= cara,cara,cara,cara,creu. Tenim, per tant, dos elements que podem repetir i en volem fer grups de cinc. Pertant, es tracta de variacions amb repetició. El nombre de resultats és, doncs,VR2,5 = 25.

62

Page 60: Llibre estadística

Elements de probabilitat

Problema 2.6 Donades les lletres A, A, A, P, T i T, quantes paraules diferents de sislletres es poden formar?

Solucio

Donades les sis lletres, les diferents paraules les obtindrem ordenant les lletres que enshan donat, és a dir, permutant-les. Com que n’hi ha de repetides, aquest és un problemade permutacions amb repetició. El nombre de paraules diferents que podem formar és:

PR3,2,16 =

6!3!2!1!

= 60.

Problema 2.7 Quantes fitxes té un dòmino?

Solucio

Cada fitxa del dòmino es pot identificar amb un parell de nombres(x,y), ambx,y =0,1,. . . ,6. Per tant, donats set nombres, el problema el podem traduir a fer-ne grups dedos, en els quals es poden repetir nombres i no importa l’ordre, és a dir, el(1,0) és lamateixa fitxa que el(0,1). Es tracta de combinacions amb repetició. El nombre de fixesésCR7,2 = 28.

Problema 2.8 S’ha fet un examen amb deu preguntes de tipus test de resposta cert ofals, i és obligatori contestar totes les preguntes.

(a) De quantes maneres diferents es pot resoldre l’examen?(b) Quantes maneres diferents hi ha d’encertar només una pregunta?(c) I de contestar-ne 4 de certes i 6 de falses?(d) I de contestar-ne k de certes?

Solucio

(a) Tenim dos elements possibles, cert o fals, amb els quals hem de formar grups dedeu respostes, en les quals importa l’ordre. Es tracta, per tant, de variacions ambrepeticióVR2,10= 210.

(b) Donada la solució de l’examen, que vol dir una llista ordenada d’elements cert/fals,les maneres d’encertar només una pregunta són les d’escollir quina pregunta s’encer-ta ja que, com que la resta s’hauran de fallar, queden determinades pel fet que noméspodem tenir dues respostes possibles. Així doncs, es tracta d’escollir un elemententre 10:C10,1= 10.

(c) Tenim 4 certs i 6 falsos a permutar per construir diferents solucions d’examen. Pertant, es tracta de permutacions amb repeticióPR6,4

10 = 210.

(d) Pel que hem vist a l’apartat anterior, les maneres de respondrek certes sónPRk,10−k10 .

Problema 2.9 Disposem d’una baralla de 52 cartes diferents, a repartir entre quatrejugadors. De quantes maneres es pot fer el repartiment? Quants repartiments donaranels quatre asos a un mateix jugador?

63

Page 61: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

Podem pensar que tenim 40 cartes ordenades i, a cada una, li hem d’assignar un número:1, 2, 3 o 4, que fa referència al jugador que la tindrà. Tenim, per tant, que els possiblesrepartiments seran les permutacions amb repetició dels 13 números 1 (les 13 cartes delprimer jugador), els 13 números 2, els 13 números 3 i els 13 números 4. Això és

PR13,13,13,1352 =

52!13!13!13!13!

≈ 5.36·1028.

Per calcular el nombre de repartiments que donaran els quatre asos a un jugador podempensar el problema en dues fases. En primer lloc, cal escollir el jugador que rebrà elsasos. Hi ha

(41

)= 4 possibilitats. En segon lloc, cal repartir les cartes restants seguint el

mateix raonament que abans, però tenint present que ara el nombre total de cartes és 48i que un dels jugadors només n’ha de rebre 9. Per tant, el nombre de repartiments quedonaran tots els asos a un jugador és, pel principi de multiplicació:

4·PR9,13,13,1348 = 4· 48!

9!13!13!13!≈ 5.67·1026.

Problema 2.10 Si n persones s’asseuen aleatòriament en una fila de2n cadires, dequantes maneres poden seure de forma que no hi hagi dues persones assegudes en ca-dires contigües?

Solucio

Observem que, si la primera cadira està ocupada, aleshores totes les cadires imparellesestan ocupades ja que hi han persones i no poden estar assegudes juntes. De la mateixamanera, si la segona està ocupada, totes les parelles ho estaran. Així doncs, el problemaes redueix a escollir si són les cadires parelles o les imparelles les que s’utilitzen (duespossibilitats) i a ordenar de les diferents maneres possibles lesn persones. Per tant, hi ha2·n! formes possibles.

Problemes resolts (probabilitat)

Problema 2.11 Trobeu l’espai mostral associat a les experiències aleatòries següents idigueu, en cada cas, si és finit, infinit numerable o infinit no numerable.

(a) De les famílies que tenen quatre fills, comptar el nombre de nois.(b) El temps de desgast d’un pneumàtic.(c) Escollir tres boles d’una bossa que conté cinc boles blanques, quatre boles negres

i dues boles vermelles.(d) El nombre de vegades que cal llançar una moneda a l’aire fins a obtenir-ne tres

cares seguides.

Solucio

(a) En una família de quatre fills, hi pot haver un, dos, tres, quatre o cap noi; per tant,l’espai mostral ésΩ = 0,1,2,3,4, és a dir, finit.

64

Page 62: Llibre estadística

Elements de probabilitat

(b) El temps de desgast d’un pneumàtic, en ser una magnitud física unidimensio-nal, pot ser qualsevol nombre real positiu; per tant, l’espai mostral és el conjuntΩ = [0,+∞), que és un conjunt infinit no numerable.

(c) El nombre de possibilitats diferents d’extraccions de tres boles d’una bossa d’onzeboles és limitat. L’espai mostral és, doncs, finit i està compost pels elements

Ω = BBB,BBN,BNB,NBB,BNN,NBN,NNB,. . . ,BVV,VBV,VVB.

(d) Com a mínim, hem de llançar la moneda tres vegades, però no podem establir a prioricap límit superior. L’espai mostral és, doncs, el conjunt de tots els nombres naturalsmés grans o iguals a 3:

Ω = 3,4,5,. . ..

Aquest és un conjunt infinit numerable.

Problema 2.12 Considereu l’experiència aleatòria de llançar un dau i una moneda. SiE1 és l’esdeveniment “treure cara” i E2 és “treure 3 o 6”, expresseu en paraules elsignificat de:

(a) E1

(b) E2

(c) E1∩E2

(d) E1∩ E2 = E1−E2

Solucio

(a) L’esdevenimentE1 correspon a l’esdeveniment “no treure cara”, és a dir, “treurecreu”.

(b) L’esdevenimentE2 correspon a l’esdeveniment “no treure ni un 3 ni un 6”, és a dir,“treure un 1, 2, 4 o 5”.

(c) L’esdevenimentE1∩E2 se satisfà quan es compleixen els dos esdevenimentsE1 i E2;per tant, “treure cara i un 3 o cara i un 6”.

(d) L’esdevenimentE1 ∩ E2 se satisfà quan es compleix l’esdevenimentE1, però no elE2; això és, “treure cara i un número diferent al 3 o al 6”. Ho podem expressar tambécom una resta d’esdeveniments:E1−E2.

Problema 2.13 Siguin E, F, i G tres esdeveniments qualssevol d’un espai mostralΩ.Trobeu les expressions, en el llenguatge de conjunts, dels esdeveniments següents:

(a) E i F passen a la vegada, però G no.(b) F passa, però ni E ni G passen.(c) Només passa G.(d) Com a mínim, un d’ells passa.(e) Passen els tres.

Solucio(a) E∩F ∩ G (vegeu la figura 2.14);(b) F ∩ E∩ G (vegeu la figura 2.15);(c) G∩ E∩ F (vegeu la figura 2.16);(d) E∪F ∪G (vegeu la figura 2.17);(e) E∩F ∩G (vegeu la figura 2.18).

65

Page 63: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

2.14i passen a la vegada

però no.E F

GE

F

G

Ω

2.15passa però ni ni

passen.F E G E

F

G

Ω

2.16Només passa .G E

F

G

Ω

2.17Com a mínim un d’ells

passa.E

F

G

Ω

2.18Passen els tres. E

F

G

Ω

66

Page 64: Llibre estadística

Elements de probabilitat

Problema 2.14 Considereu tres esdeveniments A, B i C. Expresseu, en el llenguatge deconjunts, els esdeveniments següents:

(a) Només passa un d’ells.(b) Com a mínim, en passen dos.(c) En passen dos, exactament.(d) No en passen més de dos.(e) En passen menys de dos.(f) Passen A o B, però no tots dos, i C no.

Solucio

(a) (A∩ B∩C)∪ (A∩B∩C)∪ (A∩ B∩C) (vegeu la figura 2.19);(b) (A∩B)∪ (A∩C)∪ (B∩C) o, dit d’altra manera,(A∪B)∩ (A∪C)∩ (B∪C) (vegeu

la figura 2.20);

(c) (A∩B∩C)∪ (A∩ B∩C)∪ (A∩B∩C) (vegeu la figura 2.21);

(d) A∪ B∪C o, equivalentment,A∩B∩C (vegeu la figura 2.22);

(e) (A∩ B∩C)∪ (A∩B∩C)∪ (A∩ B∩C)∪ (A∩ B∩C), o bé ho podem expressar com(A∪ B)∩ (A∪C)∩ (B∪C) (vegeu la figura 2.23);

(f) (A∩ B∩C)∪ (A∩B∩C), o també(A∪B)∩ (A∪ B)∩C (vegeu la figura 2.24).

2.19Només passa un d’ells.A

B

C

Ω

2.20Com a mínim passendos.

A

B

C

Ω

2.21Passen dos exactament.A

B

C

Ω

67

Page 65: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

2.22No passen més de dos. A

B

C

Ω

2.23En passen menys de

dos.A

B

C

Ω

2.24Passen o , però no

tots dos, i no.A B

CA

B

C

Ω

Problema 2.15 Siguin A, B i C tres esdeveniments tals que A∩B⊂C. Demostreu que:

P(C)≤ P(A)+P(B)

Solucio

L’enunciat estableix que l’esdevenimentA∩B està inclòs en l’esdevenimentC; per tant,podem assegurar que

P(A∩B)≤ P(C).

Recordem una de les propietats de la probabilitat:

P(A∪B) = P(A)+P(B)−P(A∩B).

Expressant aquesta propietat comP(A∩B) = P(A)+P(B)−P(A∪B), i substituint-laen la primera expressió, obtenim:

P(C)≥ P(A)+P(B)−P(A∪B) (2.1)

68

Page 66: Llibre estadística

Elements de probabilitat

Recordem ara la propietat següent:

P(A) = 1−P(A)

Podem reexpressar la desigualtatP(C)≤ P(A)+P(B) a demostrar com:

1−P(C)≤ 1−P(A)+1−P(B)

−P(C)≤ 1−P(A)−P(B)

P(C)≥ P(A)+P(B)−1(2.2)

Recuperant la desigualtat (2.1), i sabent queP(A∪B)≤ 1, podem veure finalment

P(C)≥ P(A)+P(B)−P(A∪B)︸ ︷︷ ︸≤1

≥ P(A)+P(B)−1,

és a dir,

P(C)≥ P(A)+P(B)−1,

que és el que volíem veure.

Problema 2.16 Demostreu les expressions següents:

(a) Si A i B són dos esdeveniments, aleshores

P(A∪B)≥ 1−P(A)−P(B)

(b) Si A i B són dos esdeveniments independents de probabilitat no nul·la, per a qualse-vol esdeveniment C tenim

P(C|A) = P(B) ·P(C|A∩B)+P(B) ·P(C|A∩ B)

Solucio

(a) Desenvolupem l’expressió que volem demostrar:

P(A∪B)≥ 1− (1−P(A))− (1−P(B))

P(A∪B)≥ 1−1+P(A)−1+P(B)

P(A∪B)≥ P(A)+P(B)−1

Recordant la igualtat

P(A∪B) = P(A)+P(B)−P(A∩B)

podem deduir que

P(A∪B) = P(A)+P(B)−P(A∩B)︸ ︷︷ ︸≥1

≥ P(A)+P(B)−1,

que és el que volíem veure.

69

Page 67: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Desenvolupem el primer sumand de la segona part de la igualtat:

P(B) ·P(C|A∩B) = P(B) · P(C∩A∩B)P(A∩B)

I, donat queA i B són esdeveniments independents:

P(B) ·P(C|A∩B) = P(B) · P(C∩A∩B)P(A) ·P(B) =

P(C∩A∩B)P(A)

Pel mateix procediment obtenim, i, sabent que siA i B són independents, també hosónA i B:

P(B) ·P(C|A∩ B) =P(C∩A∩ B)

P(A)

I substituint en la igualtat inicial:

P(C|A) = P(C∩A∩B)P(A)

+P(C∩A∩ B)

P(A)=

P(C∩A∩B)+P(C∩A∩ B)P(A)

Si tenim en compte queC∩A es pot expressar com la unió disjunta dels conjuntsC∩A∩B i C∩A∩ B

C∩A= (C∩A∩B)∪ (C∩A∩ B),

aleshores

P(C∩A∩B)+P(C∩A∩ B) = P(C∩A)

Ara podem expressar la igualtat inicial com

P(C|A) = P(C∩A)P(A)

,

que és justament la definició de la probabilitat condicionada.

Problema 2.17 Donats A i B dos esdeveniments independents, demostreu que:

(a) Els esdeveniments A iB també ho són.(b) Els esdevenimentsA i B també ho són.

Solucio

Sabent queA i B són independents, sabem per definició que

P(A|B) = P(A)

P(B|A) = P(B)

P(A∩B) = P(A) ·P(B)

70

Page 68: Llibre estadística

Elements de probabilitat

(a) Suposem queA 6= /0. Per probabilitat total, sabem que

P(A) = P(A∩B)+P(A∩ B)

i, atès queA i B són independents,

P(A) = P(A) ·P(B)+P(A∩ B)

Si dividim l’equació perP(A) (que és diferent de zero en suposar queA 6= /0), tenim:

1= P(B)+P(A∩ B)

P(A)

i, aïllantP(A∩ B),

P(A∩ B) = P(A) · (1−P(B))

P(A∩ B) = P(A) ·P(B)

Per tant,A i B són independents.

En el casA= /0, tenim que

P(A∩ B) = P(A) ·P(B),

en tenirP(A∩ B) = P( /0) = 0 i P(A) ·P(B) = 0, ja queP(A) = 0. En conseqüència,en aquest cas tambéA i B són independents.

(b) Ara sabem queA i B són independents. Seguint el mateix mètode que a l’apartatanterior (i suposant ara queB 6= /0):

P(B) = P(B∩A)+P(B∩ A)

P(B) = P(B) ·P(A)+P(B∩ A)

1 = P(A)+P(B∩ A)

P(B)

P(B∩ A) = (1−P(A)) ·P(B)

P(B∩ A) = P(A) ·P(B)

Per tant,A i B també són independents.

Problema 2.18 Donats els esdeveniments C1, C2 i D tals que Ci ⊂D, i = 1,2 i P(C2)> 0,demostreu que

P(C1)

P(C2)=

P(C1|D)

P(C2|D)

71

Page 69: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

Aplicant la definició de probabilitat condicionada a la part dreta de la igualtat anterior,tenim que

P(C1|D)

P(C2|D)=

P(C1∩D)

P(D)

P(C2∩D)

P(D)

=P(C1∩D)

P(C2∩D)

Sabem que, siCi ⊂ D, i = 1,2, aleshoresCi ∩D =Ci; per tant,

P(C1|D)

P(C2|D)=

P(C1∩D)

P(C2∩D)=

P(C1)

P(C2),

com volíem veure.

Problema 2.19 Considereu els esdeveniments A,B i C tals que

- la probabilitat de cadascun d’aquests esdeveniments és p1;- la probabilitat de la intersecció de dos esdeveniments qualssevol és p2;- la probabilitat de la intersecció dels tres esdeveniments ésp3.

Expresseu el valor de la probabilitat P(A∪B∪C) en funció de p1, p2 i p3.

Ajuda. Per a fer-ho, seguiu els passos següents:

(i) Recordeu la fórmula de la probabilitat de la unió de dos esdeveniments.(ii) Desenvolupeu la probabilitat P(A∪B∪C), considerant l’esdeveniment D= B∪C.

(iii) Recordeu, finalment, que

A∩ (B∪C) = (A∩B)∪ (A∩C)

Solucio

ConsideremP(A∪B∪C). Si tenim en compte queD = B∪C, aleshores podem escriure

P(A∪B∪C) = P(A∪D) = P(A)+P(D)−P(A∩D)

Desfent ara el canviD = B∪C, tenim que

P(A∪B∪C) = P(A)+ P(B∪C)︸ ︷︷ ︸P(B)+P(C)−P(B∩C)

−P(A∩ (B∪C)︸ ︷︷ ︸(A∩B)∪(A∩C)

)

= P(A)+P(B)+P(C)−P(B∩C)−P((A∩B)∪ (A∩C))

= P(A)+P(B)+P(C)−P(B∩C)− [P(A∩B)+P(A∩C)−P(A∩B∩C)]

= P(A)+P(B)+P(C)−P(B∩C)−P(A∩B)−P(A∩C)+P(A∩B∩C)

= p1+ p1+ p1− p2− p2− p2+ p3

= 3p1−3p2+ p3

72

Page 70: Llibre estadística

Elements de probabilitat

Problema 2.20 Es llancen dos daus a l’aire. Estudieu la independència dels esdeveniments:

A= “del primer dau s’obté un nombre parell′′

B= “del segon dau s’obté un nombre senar′′

C= “se n’obtenen dos nombres parells o dos nombres senars′′

SolucioDiem que dos esdevenimentsE1 i E2 són independents si

P(E1|E2) = P(E1)

o, equivalentment,

P(E1∩E2) = P(E1) ·P(E2).

Descrivim qui sónA,B i C:

A= 21,22,23,24,25,26,41,42,43,44,45,46,61,62,63,64,65,66B= 11,21,31,41,51,61,13,23,33,43,53,63,15,25,35,45,55,65C= 11,13,15,31,33,35,51,53,55,22,24,26,42,44,46,62,64,66

Descrivim quines són ara les seves interseccions:

A∩B= 21,23,25,41,43,45,61,63,65A∩C= 22,24,26,42,44,46,62,64,66B∩C= 11,13,15,31,33,35,51,53,55

Les probabilitats d’aquests conjunts són:

P(A) =1836

=12

P(B) =1836

=12

P(C) =1836

=12

P(A∩B) =936

=14

P(A∩C) =936

=14

P(B∩C) =936

=14

Per tant,

P(A∩B) = P(A) ·P(B)P(A∩C) = P(A) ·P(C)P(B∩C) = P(B) ·P(C)

i, en conseqüència, són esdeveniments independents.

73

Page 71: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 2.21 Donat l’espai mostralΩ = (0,2) ⊂ R, es defineix la probabilitat d’unsubinterval obert(a,b) com l’àrea delimitada aR2 pel subinterval i la recta y= kx.

(a) Trobeu el valor de k per tal que es tracti realment d’una probabilitat.(b) Trobeu la probabilitat del subinterval

(14, 1

2

).

Solucio

(a) Considerant la funcióf (x) = kx, podem calcular l’àrea sota la recta com:

∫ b

akxdx=

[kx2

2

]b

a

= k · b2−a2

2,

que es correspon amb la superfície marcada a la figura 2.25.

2.25L`àrea ombrejada

correspon a laprobabilitat del

subinterval ( , ).a b

a b 2

f (x) = kx

(a) Sabem que, per tal queP[(a,b)] sigui realment una probabilitat, és necessari queP(Ω) = 1, és a dir,

P(Ω) = P[(0,2)] = 1

P(Ω) =∫ 2

0kxdx= k · 22−02

2= 1 ⇔ k=

12

Per tant,

P[(a,b)] =12· b2−a2

2=

b2−a2

4

(b) A partir de l’apartat anterior, podem calcularP(

14, 1

2

)com:

P

(14

,12

)=

( 12)2− ( 1

4)2

4=

364

= 0.046875.

Problema 2.22 Donat l’espai mostralΩ = 1,2,. . ., es considera l’aplicació

P : P(Ω)→ R,

tal que P(k) = k ·e−k, k= 1,2,. . . És P una probabilitat?

74

Page 72: Llibre estadística

Elements de probabilitat

Solucio

Per tal queP sigui una probabilitat, és necessari queP(Ω) = 1, és a dir:

∑k=1

k ·e−k = 1

Per calcular la suma d’aquesta sèrie, fixem-nos en la sèrie geomètrica

∑k=1

e−k =∞

∑k=1

(1e

)k

,

que té per suma el nombre

∑k=1

(1e

)k

=1

1− 1e

=e

e−1.

Si definim r = 1e

(on |r|< 1), hem vist que

∑k=1

rk =1

1− r.

Derivant aquesta última expressió en funció der, tenim que

ddr

∑k=1

rk =ddr

11− r

⇔∞

∑k=1

krk−1 =1

(1− r)2

⇔ 1r

∑k=1

krk =1

(1− r)2

⇔∞

∑k=1

krk =r

(1− r)2

⇔∞

∑k=1

ke−k =

1e(

1− 1e

)2 =e

(e−1)2≈ 0.92065

Observem que el resultat és inferior a 1. Deduïm, llavors, queP no és una probabilitat.

Problema 2.23 Llancem una moneda a l’aire dues vegades.

(a) Quina és la probabilitat d’obtenir-ne dues cares?(b) Quina és la probabilitat d’obtenir-ne dues cares si sabem que a la primera tirada

ens ha sortit cara?(c) Quina és la probabilitat d’obtenir-ne dues cares si sabem que en alguna de les dues

tirades ens ha sortit cara?

75

Page 73: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

(a) L’espai mostral d’aquest experiment ésΩ = cc,c+,+c,++, on c =“cara” i+ =“creu”. Els quatre esdeveniments elementals són equiprobables; per tant,P(cc) = 1

4.

(b) Hi ha dos esdeveniments elementals on la primera tirada és cara. El nou espai mos-tral (reduït) és, doncs,Ωr = cc,c+. Dels dos esdeveniments elementals en aquestnou espai mostral, n’hi ha un en què surten dos cares; per tant, la probabilitat és de12.

(c) Hi ha tres esdeveniments elementals on en alguna de les tirades surt cara, cosa queés equivalent a considerar el següent espai mostral reduït:

Ωr = cc,c+,+c.Per tant, la probabilitat d’obtenir dues cares és de1

3.

Problema 2.24 Tenim dotze bombetes, de les quals5 són defectuoses. En traiem3 sensereemplaçament. Calculeu la probabilitat de treure’n una, i només una, de defectuosa.

Solucio

L’arbre de probabilitats per a tres extraccions sense reemplaçament és el de la figura 2.26.

2.26Arbre de probabilitats pera tres extraccions sense

reemplaçament(problema 2.24).

7/12

5/127/11

4/11

3/10

7/10

4/10

6/10

6/11

5/11

4/10

6/10

5/10

5/10

Denotem perDi el fet d’extreure exactamenti bombetes defectuoses. Observem que hiha tres possibilitats d’extreure’n nómes una de defectuosa; per tant:

P(D1) =512

· 711

· 610

+712

· 511

· 610

+712

· 611

· 510

=2144

≈ 0.47727.

76

Page 74: Llibre estadística

Elements de probabilitat

Problema 2.25 Llancem un dau tres vegades. Calculeu la probabilitat d’obtenir-ne cadavegada una puntuació més gran.

Solucio

Els resultats que satisfan la condició imposada són:

A= 123, 124, 125, 126, 134, 135, 136, 145, 146, 156, 234, 235, 236, 245, 246, 256, 345,346, 356, 456

Sumen un total de 20 esdeveniments elementals. Per calcular la probabilitat d’obteniruna combinació qualsevol de tres tirades hem de tenir en compte que, en una tirada, elssis resultats possibles són equiprobables; per tant,

P(k) =16

,k= 1,2,. . . ,6.

Sabem que el resultat d’una tirada és independent del resultat de la tirada anterior; pertant, la probabilitat d’un resultat qualsevol de tres tirades és

P(k1k2k3) =16· 16· 16

, k1,k2,k3 ∈ 1,2,. . . ,6.

Busquem, llavors, la probabilitat que es compleixi un dels 20 esdeveniments elementalsi. atès que són incompatibles, la calculem com

P(A) = P(123)+P(124)+ · · ·+P(456) = 20· 16· 16· 16=

554

≈ 0.092593.

També podem resoldre el problema calculant els resultats que satisfan la condició sobretots els resultats possibles, donat que tots els resultats són equiprobables. Això seria20

63 .

Si el dau tinguésc, c ≥ 3 cares, la probabilitat d’obtenir cada vegada unapuntuació més gran es podria generalitzar de la manera següent:

P(A) = P(123)+ · · ·+P((c−2)(c−1)(c)) =

c−2

∑i=1

i(i +1)2

c3

Problema 2.26 Es llancen dos daus. Si les cares que apareixen són diferents, trobeu laprobabilitat que:

(a) La suma de les cares sigui un nombre parell.(b) La suma sigui superior a 9.

Solucio

En aquest cas, podem fer una taula amb la suma de les possibles tirades per a visualitzar-ne millor totes les possibilitats.

77

Page 75: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

1 2 3 4 5 6

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

(a) Si eliminem els resultats on surt la mateixa cara als dos daus, podem comptar dotzesumes parelles sobre un total de trenta resultats possibles; per tant, la probabilitat ésde 12

30= 2

5= 0.4.

1 2 3 4 5 6

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

(b) L’esdeveniment se satisfà en quatre casos; per tant, la probabilitat és de430= 2

15≈

0.13333.

1 2 3 4 5 6

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

Problema 2.27 Tenim dues capses, una és de la Maria i l’altra, de la Irene. La capsade la Maria té5 discos de Paulina Rubio,3 de Luis Miguel i8 de Raphael; la capsade la Irene té3 discos de Paulina Rubio i5 de Luis Miguel. Llancem un dau; si surt3o 6, escollim un disc a l’atzar de la capsa de la Maria; si surt qualsevol altre número,escollim un disc de la capsa de la Irene. Trobeu la probabilitat que el disc sigui de:

(a) Paulina Rubio(b) Luis Miguel(c) Raphael

Solucio

Si definim “extreure un disc de la capsa de la Maria” i “extreure un disc de la capsa dela Irene” com a dos esdevenimentsM i I que formen una partició de l’espai mostralΩ,

78

Page 76: Llibre estadística

Elements de probabilitat

és a dir,I ∪M = Ω, podem resoldre el problema a partir del teorema de la probabilitattotal:

P(B) =n

∑i=1

P(Ai) ·P(B|Ai),

on B és un esdeveniment qualsevol i⋃n

i=1 Ai = Ω és una partició. Llançant un dau de siscares, s’estableix que, si surt 3 o 6, obrirem la capsa de la Maria i, si surt 1, 2, 4 o 5,obrirem la de la Irene; per tant,P(M) = P(3,6) = 1

3i P(I) = P(1,2,4,5) 2

3.

(a) Si obrim la capsa de la Maria, la probabilitat d’extreure un disc de Paulina Rubio(PR) és de 5

16, mentre que si es tracta de la capsa de la Irene aquesta probabilitat és

de 38. Aleshores,

P(PR) =2

∑i=1

P(Ai) ·P(PR|Ai)

= P(M) ·P(PR|M)+P(I) ·P(PR|I)

=13· 516

+23· 38

=1748

≈ 0.35417.

(b) La probabilitat d’extreure un disc de Luis Miguel obrint la capsa de la Maria és de316

, mentre que a la capsa de la Irene la probabilitat és de58. Tal com hem fet abans:

P(LM) =13· 316

+23· 58=

2348

≈ 0.47917.

(c) La probabilitat d’extreure un disc de Raphael a la capsa de la Maria és de316

, mentreque a la capsa de la Irene és de 0, ja que no n’hi ha cap. Per tant:

P(R) =13· 816

=16≈ 0.16667.

Fixeu-vos, finalment, que

P(PR)+P(LM)+P(R) =1748

+2348

+16= 1.

Problema 2.28 En Carles i en Francesc juguen a dards. La probabilitat que en Carlesfaci diana és1

4, i la del Francesc és1

3. Tots dos llancen el dard dues vegades. Trobeu la

probabilitat que es faci diana almenys un vegada.

Solucio

Denotem perP(C) i P(F) la probabilitat que en Carles i que en Francesc facin diana,respectivament, i perP(D) la probabilitat que es faci diana almenys un vegada. Avaluant

79

Page 77: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

l’experiment segons el nombre de dianes, l’espai mostral ésΩ = 0,1,2,3,4. Hem decalcular la probabilitat de fer una o més dianes; per tant, busquem la probabilitat defer qualsevol nombre de dianes menys zero. Podem calcular aquesta probabilitat comP(D) = P(Ω)−P(0), onP(0) és la probabilitat que ambdós jugadors fallin els seusllançaments. Sabem que la probabilitat d’encertar un llançament és independent de laresta de llançaments; llavors:

P(0) = P(C) ·P(C) ·P(F) ·P(F) = 34· 34· 23· 23=

14

P(D) = P(Ω)−P(0) = 1− 14=

34

Problema 2.29 Per estudis anteriors, sabem que la probabilitat que un adult, major de40 anys, que arriba a un hospital especialitzat en la lluita contra el càncer tingui aquestamalaltia és del0.02. Una prova determinada diagnostica correctament una persona queté càncer el78%dels cops i s’equivoca, amb persones que no tenen càncer, el6%. Pera un adult de més de 40 anys,

(a) Quina és la probabilitat que li diagnostiquin càncer?(b) Quina és la probabilitat que, si li han diagnosticat càncer, veritablement tingui la

malaltia?

Solucio

Si denotem perC el fet que un adult de més de 40 any tingui càncer, i perd el fet que la pro-va diagnostiqui càncer (es tingui o no), podem resumir la informació de l’enunciat com:

P(C) =2

100

P(d|C) =78100

P(d|C) =6

100

(a) Podem obtenirP(d) mitjançant el teorema de la probabilitat total:

P(d) = P(C) ·P(d|C)+P(C) ·P(d|C) = 2100

· 78100

+98100

· 6100

=93

1250= 0.0744

(b) Ens demanen calcularP(C|d) i sabem que:

P(C|d) = P(C∩d)P(d)

Anteriorment, hem calculatP(d) i, sabent queP(C∩d) =P(d∩C) =P(d|C) ·P(C),ens queda:

P(C|d) = P(d|C) ·P(C)P(d)

=78100

· 2100

931250

=1362

≈ 0.20968.

80

Page 78: Llibre estadística

Elements de probabilitat

Problema 2.30 Es denominafiabilitat d’un sistemala probabilitat que aquest sistemafuncioni correctament. Sigui S1 un sistema elèctric format per50 bombetes connectadesen sèrie. La probabilitat que una bombeta funcioni al cap de 100 hores és0.99, i suposemque les bombetes s’espatllen independentment.

(a) Quina és la fiabilitat del sistema S1 després de 100 hores, és a dir, quina és laprobabilitat que el circuit funcioni al cap de 100 hores?

(b) Suposem que, per a més seguretat, connectem un altre circuit S2 en paral·lel ambS1. El nou sistema funcionarà si S1 o S2 funciona. Quina és la fiabilitat d’aquest nousistema al cap de 100 hores?

Solucio

(a) Per tal que el sistemaS1 funcioni, és necessari que totes les bombetes funcionin.Atès que la probabilitat que una bombeta funcioniP(B) és independent de la resta,calculem la fiabilitat del sistema com:

P(S1) = P(B1) ·P(B2) · . . . ·P(Bn) = P(B)n

P(S1) = 0.9950 ≈ 0.60501

(b) En aquest cas, hem de calcularP(S1 ∪S2), denotant perSi el fet que el sistemaSi

funcioni. Observem queS1 i S2 són dos esdeveniments compatibles (però indepen-dents), ja que és possible que ambdós sistemes funcionin a la vegada, és a dir, quefuncionin les 100 bombetes. Llavors:

P(S1∪S2) = P(S1)+P(S2)−P(S1∩S2)

= P(S1)+P(S2)−P(S1) ·P(S2)

= 0.9950+0.9950−0.99100 ≈ 0.84398

Problema 2.31 Una joieria té un sistema d’alarma connectat. La probabilitat que hihagi un robatori és de0.1. Si hi ha un robatori, la probabilitat que l’alarma funcioni(soni) és de0.95. Si no hi ha cap robatori, la probabilitat que funcioni (soni) és de0.03.Calculeu la probabilitat que:

(a) s’activi l’alarma;(b) havent funcionat l’alarma, no hi hagi hagut cap robatori;(c) hi hagi un robatori i l’alarma no funcioni;(d) no havent funcionat l’alarma, hi hagi hagut un robatori.

Solucio

Denotant perR el fet que hi hagi un robatori, i perA el fet que s’activi l’alarma, podemresumir la informació de l’enunciat com:

P(R) =110

P(A|R) =95100

P(A|R) =3

100

81

Page 79: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Per probabilitat total:

P(A) = P(A|R) ·P(R)+P(A|R) ·P(R) = 95100

· 110

+3

100· 910

=61500

= 0.122

(b) Aplicant dues vegades la definició de probabilitat condicionada:

P(R|A) =P(R∩A)

P(A)=

P(A∩ R)P(A)

=P(A|R) ·P(R)

P(A)

=

3100

· 910

0.122=

27122

≈ 0.22131

(c) Resolem la intersecció mitjançant la definició de probabilitat condicionada:

P(A∩R) = P(A|R) ·P(R) = (1−P(A|R)) ·P(R)

=

(1− 95

100

)· 110

= 0.005

(d) Apliquem de nou la definició de probabilitat condicionada:

P(R|A) =P(R∩ A)

P(A)=

P(R∩ A)1−P(A)

=0.005

1−0.122=

5878

≈ 0.0056948

Problema 2.32 Una persona es prepara per fer un viatge amb avió de Barcelona aAlmeria. Amb temor, es dirigeix a la companyia i pregunta quina és la probabilitatque hi hagi almenys una bomba a l’avió. Li responen que aquesta probabilitat és0.1i, angoixada davant el risc, pregunta quina és la probabilitat que hi hagi almenys duesbombes, i li diuen que0.01. Més tranquil·litzada amb aquesta resposta, decideix portar ala bossa una bomba. Des del punt de vista de l’anàlisi de probabilitats, té sentit aquestadecisió?

Solucio

Denotarem perP(B≥1) la probabilitat que hi hagi una bomba o més a l’avió, i perP(B≥2)la probabilitat que n’hi hagi dues o més. Ens hem de preguntar, llavors, quina és laprobabilitat que a l’avió hi hagi dues bombes o més sabent que, com a mínim, n’hi hauràuna, que per definició calculem com:

P(B≥2|B≥1) =P(B≥2∩B≥1)

P(B≥1).

L’esdeveniment “una bomba o més” inclou totes les possibilitats de l’esdeveniment “du-es bombes o més”, és a dir,B≥2 ⊂B≥1; per tant,P(B≥1∩B≥2)=P(B≥2). En conseqüència,

82

Page 80: Llibre estadística

Elements de probabilitat

P(B≥2|B≥1) =P(B≥2)

P(B≥1)=

0.010.1

= 0.1= P(B≥1).

Veiem que la probabilitat que hi hagi una bomba o més a l’avió és la mateixa que laque n’hi hagi dues o més, si ja sabem que n’hi ha una. El nostre viatger podria, doncs,estalviar-se la seva bomba.

Problema 2.33 El Josep diu la veritat nou de cada deu vegades i en Ferran, set de cadanou. S’extreu una bola a l’atzar d’una bossa que contenia cinc boles blanques i vint denegres. Ambdós han dit que la bola extreta és blanca. Quina es la probabilitat que labola extreta siguirealmentblanca?

Solucio

Denotem perJv el fet que en Josep digui la veritat i perFv el fet que en Ferran la digui. Sidenotem també perb el fet que la bola sigui blanca i pern el fet que aquesta sigui negra,podem resumir la informació de l’enunciat com:

P(Jv) =910

P(Fv) =79

P(b) =525

=15

P(n) =2025

=45

Denotarem ara perJb el fet que en Josep digui que la bola extreta és blanca i perFb el fetque en Ferran digui que la bola extreta és blanca. Hem de buscar la probabilitat que labola sigui blanca, sabent que tant en Josep com en Ferran han dit que és blanca, és a dir:

P(b|Jb∩Fb)

Recordem per a aquest cas el teorema de Bayes:

P(Aj |B) =P(Aj) ·P(B|Aj)n

∑i=1

P(Ai) ·P(B|Ai)

on A1,A2,. . . ,An és una partició de l’espai mostralΩ. Per al nostre cas, considerem laparticiób (que la bola extreta sigui blanca),n (que la bola extreta sigui negra), i aplicantel teorema de Bayes tenim

P(b|Jb∩Fb) =P(b) ·P(Jb∩Fb|b)

P(b) ·P(Jb∩Fb|b)+P(n) ·P(Jb∩Fb|n)

Observem que podem simplificar l’expressió “que en Josep i en Ferran diguin que la bolaextreta és blanca sabent que la bola és blanca” com “que en Josep i en Ferran diguin laveritat”. Per tant,

83

Page 81: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

P(Jb∩Fb|b) = P(Jv∩Fv)

De la mateixa manera, podem traduir l’expressió “que en Josep i en Ferran diguin quela bola extreta és blanca sabent que la bola és negra” com “que en Josep i en Ferran nodiguin la veritat”.

P(Jb∩Fb|n) = P(Jv∩ Fv)

El fet que en Josep digui la veritat no influeix que en Ferran digui la veritat; per tant, sónesdeveniments independents. Llavors, podem dir que

P(Jv∩Fv) = P(Jv) ·P(Fv)

P(Jv∩ Fv) = P(Jv) ·P(Fv)

Ara podem escriure l’expressió inicial com

P(b|Jb∩Fb) =P(b) ·P(Jv) ·P(Fv)

P(b) ·P(Jv) ·P(Fv)+P(n) ·P(Jv) ·P(Fv)

=

15· 910

· 79

15· 910

· 79+

45·(

1− 910

)·(

1− 79

) =6371

≈ 0.88732.

Problema 2.34 En una urna, hi ha un total de dotze boles, entre blanques i negres.Sabent que la probabilitat d’escollir dues boles blanques en dues extraccions sense re-emplaçament és1

11, quantes boles negres hi ha a l’urna?

Solucio

Denotant perb el nombre de boles blanques, sabem que la probabilitat de treure unabola blanca en la primera extracció és deb

12. Sabent que la primera bola extreta ha estat

blanca, sabem que ara quedenb− 1 boles blanques i un total d’11 boles; per tant, laprobabilitat que en una segona extracció surti blanca és deb−1

11. Llavors,

b12

· b−111

=111

Si simplifiquem l’expressió, obtenim

b2−b−12= 0

i, resolent l’equació de segon grau,

b1 = 4b2 = −3

El resultat negatiu no té sentit, en aquest cas. Aleshores, sabent que hi ha un total dedotze boles, podem assegurar que a la bossa hi ha 4 boles blanques i 8 de negres.

84

Page 82: Llibre estadística

Elements de probabilitat

Problema 2.35 Quina és la probabilitat que els aniversaris de dotze persones siguinen mesos diferents? I la probabilitat que els aniversaris de sis persones siguin en dosmesos? [Suposeu que tots els mesos tenen el mateix nombre de dies.]

Solucio

Imaginem que anem preguntant a les dotze persones una per una el mes de naixement.La primera persona pot haver nascut en qualsevol dels dotze mesos; per tant, totes lesrespostes possibles (12

12) satisfaran el nostre esdeveniment. Perquè es continui satisfent

l’esdeveniment, la segona persona ha d’haver nascut en algun dels mesos restants, i laprobabilitat que això succeeixi és d’11

12. Seguint amb aquest mètode, l’última persona

hauria d’haver nascut en l’únic mes restant, fet que té una probabilitat d’112

. Per tant,calcularem la probabilitat d’aquest esdeveniment com

P(E) =1212

· 1112

· 1012

· 912

· 812

· 712

· 612

· 512

· 412

· 312

· 212

· 112

·= 12!1212

≈ 0.000053723

Ens demanen també la probabilitat que els aniversaris de sis persones siguin en dos me-sos. Per a aquest càlcul, és útil fer l’arbre de probabilitats de la figura 2.27, del qual s’hanexclòs les possibilitats que no satisfan l’esdeveniment en qüestió.

2.27Arbre de probabilitats del’exercici 2.35.

11/12

1/12

1/12

11/12

2/12

1/12

1/12

1/12

11/12

11/12

11/12

2/12 2/12

2/12

2/122/122/12

2/12 2/12 2/12

Dx

x

x

x

x

x

Hi hem denotat perM el fet d’haver nascut al mateix mes que alguna persona de les quehan estat preguntades anteriorment (elrellotge de la figura 2.27) i perD el fet d’havernascut en un mes diferent (el rellotgeratllat). Observeu que la primera persona nómes espot trobar en el casD, atès que ningú no ha estat preguntat abans. El nostre esdevenimentse satisfà sempre que no succeeixi més de dues vegades l’esdevenimentD.

Calculem la probabilitat que es doni el nostre esdeveniment com la probabilitat de la uniódisjunta de les diferents possibilitats de satisfer-lo:

85

Page 83: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

P(E) = P(DMMMMM⊔DMMMMD⊔ . . .⊔DDMMMM)

i, atès que aquestes possibilitats són incompatibles,

P(E) = P(DMMMMM)+P(DMMMMD)+ . . .+P(DDMMMM)

Substituint els valors, obtindrem

P(E) =112

· 112

· 112

· 112

· 112

+112

· 112

· 112

· 112

· 1112

+ . . .+1112

· 212

· 212

· 212

· 212

i, simplificant l’expressió

P(E) =1

125· (1+11+11·2+11·22+11·23+11·24) =

1913824

≈ 0.0013744.

Problema 2.36 Hi ha 23 estudiants en una classe. Quina és la probabilitat que l’ani-versari de, com a mínim, dos d’ells sigui el mateix dia (dia i mes)? Suposeu que un anyté365dies.

Solucio

Ens demanen la probabilitat que, com a mínim, dos dels 23 hagin nascut el mateix dia o,dit d’una altra manera, la probabilitat que no hagin nascut tots en dies diferents. El camímés ràpid serà calcular la probabilitat que tots hagin nascut en dies diferents (fet quedenotarem comD), i buscar-ne el complementari (D). A partir d’aquí podem treballarcom al primer apartat de l’exercici anterior. La probabilitat que la resposta del segonindividu satisfaci l’esdevenimentD és de364

365; la del tercer, de363

365, i així fins a la de

l’últim, que serà de343365

. Per tant,

P(D) = 1−P(D) = 1− 365365

· 364365

· . . . · 343365

P(D) = 1− 365!342!·36523

= 0.50730.

Nota. Si introduïu aquesta operació a la vostra calculadora, probablementno la podrà resoldre, ja que els resultats de 365! i 342! són nombres moltgrans. Si no disposeu d’un programa de càlcul simbòlic, com ara Maple oMatemàtica, podeu fer servir la combinatòria per transformar l’operació enuna que la vostra calculadora pugui resoldre:

1− 365!342!·36523

= 1− 365!342!·36523

· 23!23!

= 1−(

36523

)· 23!36523

Problema 2.37 Tenim tres joiers idèntics, cadascun dels quals té dos calaixos. El pri-mer joier té un rellotge d’or a cada calaix. El segon té un rellotge de plata a cada calaix.El tercer joier té un rellotge de plata en un calaix i un d’or a l’altre calaix. Escollim un

86

Page 84: Llibre estadística

Elements de probabilitat

joier a l’atzar, n’obrim un calaix i resulta que conté un rellotge de plata. Quina és laprobabilitat que a l’altre calaix hi hagi un rellotge d’or?

Solucio

Denotem perJ1,J2 i J3 el primer, el segon i el tercer joiers, respectivament. Ens demanenla probabilitat que, sabent que en un dels calaixos hi ha un rellotge de plata (és a dir,estem aJ2 o J3), en l’altre calaix hi hagi un rellotge d’or (estaríem, doncs, aJ3). Aquestaprobabilitat condicionada es pot representar com

P(J3|J2∪J3) =P(J3∩ (J2∪J3))

P(J2∪J3)=

P(J3)

P(J2∪J3)=

P(J3)

P(J2)+P(J3)=

13

13+ 1

3

=12.

Problema 2.38 En una bossa, es col·loquen boles vermelles i blanques (almenys unade cada color). Quin és el mínim nombre de boles vermelles i blanques que s’han decol·locar a la bossa perquè la probabilitat de no treure cap blanca coincideixi amb lad’obtenir-ne exactament una de blanca, en realitzar quatre extraccions amb reemplaça-ment?

Solucio

Denotem perV el nombre de boles vermelles i perB el nombre de boles blanques. Atèsque després de cada extracció es reemplaça la bola extreta, el resultat de cada extracció ésindependent de l’anterior. Calculem, llavors, la probabilitat de no treure cap bola blancaen quatre extraccions, és a dir, de treure quatre boles vermelles com

P(4V) =V

V +B· VV +B

· VV +B

· VV +B

=

(V

V +B

)4

La probabilitat d’extreure només una bola blanca la calculem de la mateixa manera, peròtenint en compte que la bola blanca podria sortir en qualsevol posició dintre de les quatreextraccions, és a dir, que hi ha més d’una combinació on només surt una bola blanca, toti que la probabilitat de cadascuna d’aquestes combinacions és la mateixa. Ho calculemcom

P(1B) =

(41

)· BV +B

· VV +B

· VV +B

· VV +B

=

(41

)· BV +B

·(

VV +B

)3

Aquest tipus de distribució de probabilitat s’anomenadistribució binomial.

Sabem, per l’enunciat del problema, queP(4V) = P(1B). És a dir,

(V

V +B

)4

=

(41

)· BV +B

·(

VV +B

)3

⇐⇒ VV +B

= 4· BV +B

⇐⇒ V = 4·B

Les dues probabilitats coincidiran sempre que a la bossa hi hagi 4 boles vermelles per acada bola blanca. Hi haurà d’haver aleshores, com a mínim, cinc boles, una de blanca i iquatre de vermelles.

87

Page 85: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 2.39 Es plantegen sis missions espacials independents a Mart. La probabili-tat estimada d’èxit de cada missió és de0.95. Quina és la probabilitat que almenys cincde les missions tinguin èxit?

Solucio

Denotem per 5E el fet que cinc missions tinguin èxit i per 6E el fet que les sis tinguinèxit. Ens demanen la probabilitat que, com a mínim, cinc tinguin èxit, és a dir:

P(5E∪6E).

Per calcularP(5E), hem de tenir en compte que hi ha diverses combinacions on una deles sis missions fracassa, i que l’esdeveniment 5E preveu totes aquestes combinacions.La probabilitat de cada una d’aquestes combinacions és la mateixa. Es tracta, com en elproblema anterior, d’una distribució binomial; per tant

P(5E) =(

65

)·P(E)5 ·P(E)1

= 6·0.955 ·0.05≈ 0.23213.

Per a la probabilitatP(6E), només existeix una combinació:

P(6E) = 0.956 ≈ 0.73509.

Donat que 5E i 6E són esdeveniments incompatibles:

P(5E∪6E) = P(5E)+P(6E)≈ 0.96723.

Problema 2.40 Suposem que un porter té un clauer amb10claus. Digueu quina de lesprobabilitats següents és més gran:

(a) la probabilitat d’haver de provar més de cinc claus si, quan n’ha provat una clau ino ha obert, la treu del clauer.

(b) la probabilitat d’haver de provar més de cinc claus si, després de provar-ne unaclau, la barreja amb les altres i ho torna a provar.

Solucio

Per intuïció, podem saber quina de les dues probabilitats serà més gran, però hem dedemostrar-ho; per tant, les calcularem.

(a) En aquest cas, no reemplacem la clau; per tant, com a màxim en farem 10 intents.Si denotem per “+5” el fet d’haver de provar més de cinc claus, i perEi el fetd’encertar a lai-èsima elecció de clau, podem dir que

P(+5) = P(E6∪E7∪E8∪E9∪E10)

i, atès que són esdeveniments incompatibles,

P(+5) = P(E6)+P(E7)+P(E8)+P(E9)+P(E10)

88

Page 86: Llibre estadística

Elements de probabilitat

2.28Arbre de probabilitats delproblema 2.40.

1/10

9/10

1/8

7/8

8/9

1/9

6/7

1/7

1/6

5/6

4/5

1/5

2/3

1/3 1/1

1/4

3/4

1/2

1/2

(a) Per calcular-ho, ens pot ser útil fer un arbre de probabilitats com el de la figura 2.28.

Calculem, llavors, la probabilitat d’encertar a la sisena clau com

P(E6) =910

· 89· 78· 67· 56· 15=

110

i, de la mateixa manera,

P(E7) =910

· 89· 78· 67· 56· 45· 14=

110

P(E8) =910

· 89· 78· 67· 56· 45· 34· 13=

110

P(E9) =910

· 89· 78· 67· 56· 45· 34· 23· 12=

110

P(E10) =910

· 89· 78· 67· 56· 45· 34· 23· 12· 11=

110

Per tant,

P(+5) =110

+110

+110

+110

+110

=510

=12

En aquest cas, podríem haver calculatP(+5) de forma més ràpida. Si assignem acada clau una posició entre l’1 i el 10, i les anem provant una a una, és fàcil veureque totes tenen la mateixa probabilitat de ser la correcta. Per tant, veiem que

P(E6) = P(E7) = P(E8) = P(E9) = P(E10) =110

,

i llavors

P(+5) = P(6)+P(7)+P(8)+P(9)+P(10) = 5· 110

=12

.

89

Page 87: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Ara reemplacem cada clau que provem; per tant, no podem establir un màxim d’in-tents. L’esdeveniment+5 succeirà sempre que els cinc primers intents siguin fallits.La probabilitat de fallar en un intent qualsevol val9

10, ja que al clauer sempre hi ha

10 claus de les quals 9 no obren. Aleshores,

P(+5) = P(E6∪E7∪· · ·)= 1−P(E1∪E2∪E3∪E4∪E5)

= 1−P(E1)−P(E2)−P(E3)−P(E4)−P(E5)

= 1− 110

− 910

· 110

−(

910

)2

· 110

−(

910

)3

· 110

−(

910

)4

· 110

= 0.59049

Veiem que la probabilitat d’haver de provar més de cinc claus és més gran si reemplaçemcada vegada la clau provada.

Problema 2.41 En una escola, hi ha matriculats550 alumnes a primer,300 a segoni 150a tercer (es compta cada alumne una sola vegada en el curs inferior de totes lesassignatures que tingui). El70%dels alumnes de primer estan matriculats en més de vuitassignatures. El90%dels alumnes de segon estan matriculats en més de8 assignatures.El 30%d’alumnes de tercer està matriculat en més de8 assignatures. Es demana trobarla probabilitat que:

(a) un alumne estigui matriculat en més de8 assignatures;(b) un alumne de primer estigui matriculat en més de8 assignatures;(c) un alumne estigui matriculat en més de8 assignatures i sigui de primer;(d) un alumne que estigui matriculat en més de8 assignatures sigui de primer

Solucio

Denotem perV el fet que un alumne estigui matriculat en més de vuit assignatures, iperAi el fet que un alumne sigui del cursi-èsim,i = 1,2,3. Sabent que hi ha un total de1000 alumnes, podem resumir la informació de l’enunciat com

P(A1) =5501000

= 0.55, P(V|A1) = 0.70

P(A2) =3001000

= 0.30, P(V|A2) = 0.90

P(A3) =1501000

= 0.15, P(V|A3) = 0.30

(a) Per probabilitat total:

P(V) = P(A1) ·P(V|A1)+P(A2) ·P(V|A2)+P(A3) ·P(V|A3)

= 0.55·0.7+0.3·0.9+0.15·0.3= 0.70.

(b) Ens ho diu directament l’enunciat:P(V|A1) = 0.70.

90

Page 88: Llibre estadística

Elements de probabilitat

(c) Aplicant la definició de probabilitat condicionada:

P(V ∩A1) = P(V|A1) ·P(A1) = 0.7·0.55= 0.385

(d) De nou, per probabilitat condicionada:

P(A1|V) =P(A1∩V)

P(V)=

0.3850.70

= 0.55.

Problema 2.42 Un estudiant contesta una pregunta que té quatre possibles solucionsen un examen d’opció múltiple. Suposem que la probabilitat que l’estudiant sàpiga laresposta a la pregunta és de0.8 i que la probabilitat que hagi de contestar a l’atzar ésde0.2. Suposem, a més, que la probabilitat de seleccionar la resposta correcta a l’atzarés de0.25. Si l’estudiant contesta correctament la pregunta, quina és la probabilitat querealment sàpiga la resposta correcta?

Solucio

Si denotem perC el fet que l’estudiant contesti correctament i perSel fet que en sàpigala resposta, podem expressar la informació de l’enunciat com

P(S) =810

P(S) =210

P(C|S) =14

Hem de buscar la probabilitat que l’estudiant en sàpiga la resposta sabent que ha contestatcorrectament, això és,P(S|C). Segons el teorema de Bayes:

P(S|C) = P(S)P(C|S)P(C)

Si l’estudiant en sap la resposta, sempre respondrà correctament; per tant:

P(C|S) = 1

Llavors, ens cal conèixerP(C), i aquesta probabilitat la podem obtenir mitjançant laprobabilitat total:

P(C) = P(C|S) ·P(S)+P(C|S) ·P(S) = 14· 210

+1· 810

=1720

= 0.85

Finalment,

P(S|C) = P(S)P(C|S)P(C)

=

810

·10.85

=1617

≈ 0.94118

91

Page 89: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 2.43 El Joan és el responsable d’una aula informàtica de la UPC i no es potconfiar en ell: la probabilitat que oblidi fer el manteniment d’un PC en absència del capés de2

3.

El PC no està segur: si el Joan li fa un manteniment, té la mateixa probabilitat d’espat-llar-se que de funcionar correctament, però només un0.25de probabilitats que funcionicorrectament si no en fa el manteniment.

(a) Quina és la probabilitat que un ordinador funcioni correctament quan el cap torni?(b) En tornar, el cap troba un PC espatllat. Quina és la probabilitat que en Joan no en

fes el manteniment?

Solucio

Denotant perM el fet que en Joan faci el manteniment del PC i perF el fet que un PCfuncioni, tenim

P(M) =23

P(F|M) = P(F|M) =12

P(F|M) =14

(a) Es tracta d’un càlcul de probabilitat total:

P(F) = P(F|M) ·P(M)+P(F|M) ·P(M)

=14· 23+

12· 13=

13

,

ja queP(M) = 1−P(M) = 1− 23=

13

.

(b) Aplicant el teorema de Bayes:

P(M|F) =P(M)P(F|M)

P(F)=

P(M)(1−P(F|M))

1−P(F)

=

34· 23

1− 13

=34

Problema 2.44 Una fàbrica de blocs de ciment treu partides de200 blocs. Amb elsexcedents de producció, ha format una partida on20 dels blocs són defectuosos. Esrealitza un control de qualitat, on un dels empleats de la fàbrica selecciona tres dels200blocs alhora i en comprova la qualitat. Determineu la probabilitat que

(a) el primer bloc sigui defectuós(b) el segon bloc sigui defectuós

92

Page 90: Llibre estadística

Elements de probabilitat

(c) el segon bloc sigui defectuós, sabent que el primer ha sigut defectuós(d) els dos primers blocs siguin defectuosos(e) els tres blocs siguin defectuosos(f) cap dels tres blocs sigui defectuós(g) almenys un bloc sigui defectuós

Solucio

Denotem perDi el fet que l’i-èssim bloc sigui defectuós, per ai = 1,2,3. Ens serà útil,en aquest cas, fer un arbre de probabilitats condicionades (vegeu la figura 2.29).

2.29Arbre de probabilitats delproblema 2.44.

180/200

20/200180/199

19/199

18/198

180/198

19/198

179/198

179/199

20/199

19/198

179/198

20/198

178/198

(a) Com veiem a l’arbre que hem realitzat, aquesta probabilitat ésP(D1) =20200

=110

.

(b) Farem servir probabilitat total:

P(D2) = P(D2|D1) ·P(D1)+P(D2|D1) ·P(D1) =19199

· 20200

+20199

· 180200

=110

93

Page 91: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(c) Observant la figura, veiem que aquesta probabilitat és de

P(D2|D1) =19199

≈ 0.095477

(d) Segons la definició de probabilitat condicionada:

P(D1∩D2) = P(D1) ·P(D2|D1) =20200

· 19199

≈ 0.0095477

(e) De nou, per probabilitat condicionada:

P(D1∩D2∩D3) = P(D1) ·P(D2|D1) ·P(D3|D1∩D2)

=20200

· 19199

· 18198

= 0.00086798

(f) De la mateixa manera que al punt anterior:

P(D1∩ D2∩ D3) = P(D1) ·P(D2|D1) ·P(D3|D1∩ D2) =180200

· 179199

· 178198

= 0.72778

(g) Ens demanen la probabilitat que un, dos o els tres siguin defectuosos. La maneramés fàcil de calcular-ho és mitjançant el fet complementari, que és que cap siguidefectuós. Llavors,

P(D1∪D2∪D3) = P(D1∩ D2∩ D3) = 1−P(D1∩ D2∩ D3)≈ 0.27222

Problema 2.45 Realitzeu de nou el problema anterior, tenint en compte que ara el con-trol de qualitat el fan tres empleats diferents: un de la fàbrica (al matí), un distribuïdor(al migdia) i el comprador (a la tarda), de manera que cadascun d’ells agafa un blocsense saber quin bloc ha agafat l’empleat anterior. Determineu, a més,

(h) la probabilitat d’admetre el lot per aquest procediment, sabent que ha estat admèspel procediment del problema anterior

Solucio

El fet que ara el control de qualitat el facin tres empleats diferents i en moments diferentsfa que les eleccions dels blocs siguin independents.

(a) Com en el cas anterior, aquesta probabilitat és de

P(D1) =20200

=110

.

(b) El bloc analitzat es torna a afegir a la partida inicial. Per tant, la probabilitat que unbloc analitzat sigui defectuós serà sempre de

P(Di) =110

, i = 1,2,3.

94

Page 92: Llibre estadística

Elements de probabilitat

(c) Cada selecció és independent de l’anterior; per tant, de nou

P(D2|D1) = P(D2) =110

.

(d) Sabent que són esdeveniments independents:

P(D1∩D2) = P(D1) ·P(D2) =110

· 110

=1

100

(e) Igual que al punt anterior:

P(D1∩D2∩D3) = P(D1) ·P(D2) ·P(D3) =

(110

)3

=1

1000

(f) Si els esdevenimentsDi són independents, també ho seran els seus complementarisDi. Aleshores,

P(D1∩ D2∩ D3) = P(D1)P(D2)P(D3) = (1−P(D1))(1−P(D2))(1−P(D3))

=

(910

)3

= 0.729

(g) Com hem fet al problema anterior,

P(D1∪D2∪D3) = P(D1∩ D2∩ D3) = 1−P(D1∩ D2∩ D3) = 0.271

(h) El fet que el lot hagi estat admès pel procediment del problema anterior no condi-ciona l’admissió del lot pel segon procediment. Per tant, els dos procediments sónindependents. Aleshores, la probabilitat que el lot sigui admès, és a dir, que cap delstres blocs sigui defectuós, és

P(D1∩ D2∩ D3) = P(D1)P(D2)P(D3) = (1−P(D1))(1−P(D2))(1−P(D3))

=

(910

)3

= 0.729

Problema 2.46 En una capsa, hi ha3 paquets de bombetes de 60 W i5 paquets de 120W per fer la instal·lació elèctrica d’un pis. Les de 60 W són per al segon pis i les de 120W per al primer. L’aprenent no sap que hi ha bombetes de diferent potència i agafa3paquets per il·luminar el segon pis. Quina és la probabilitat que la primera bombeta queposin al primer pis sigui de 120 W?

Solucio

Denotem perA el fet d’agafar una capsa de bombetes de 60 W i perB el fet d’agafar unade les bombetes de 120 W. El que ens demanen és la probabilitat que la quarta capsa queagafem fent extraccions sense reemplaçament sigui de bombetes de 120 W. En aquestcas, ens és útil fer un arbre de probabilitats (vegeu la figura 2.30).

95

Page 93: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

2.30Arbre de probabilitats del

problema 2.46.

5/8

3/85/7

2/7

1/6

5/6

2/6

4/6

4/7

3/7

2/6

4/6

3/6

3/6

5/5

4/5

4/5

3/5

4/5

3/5

3/5

2/5

60

60

60

60

60

60

60

120

120

120

120

120

120

120

120

120

120

120

120

120

120

120

A l’arbre de la figura 2.30, s’ha eliminat la possibilitat de treure una capsa de 60 W enl’última extracció, ja que per a la probabilitat que volem calcular no ens interessa.

Calculem, doncs, la probabilitat d’agafar una capsa de 120 W a la quarta extracció com lasuma de totes les seqüències de quatre extraccions acabades en aquest tipus de bombetes.Es tracta, per tant, d’un càlcul de probabilitat total. A partir de l’arbre:

P(B4) =38· 27· 16· 55+

38· 27· 56· 45+

38· 57· 26· 45

+38· 57· 46· 35+

58· 37· 26· 45+

58· 37· 46· 35

+58· 47· 36· 35+

58· 47· 36· 25=

58

Problema 2.47 En una capsa, tenim n resistències de les quals m són defectuoses. D’a-questa capsa, n’agafem tres resistències. Cada vegada que traiem una resistència, sisurt defectuosa, en posem r més de no defectuoses. Quina és la probabilitat de treuretres resistències defectuoses?

96

Page 94: Llibre estadística

Elements de probabilitat

Solucio

Denotem perDi el fet de treure una resistència defectuosa a lai-èsima extracció. Cadaextracció no és independent de l’anterior; per tant:

P(D1∩D2∩D3) = P(D1) ·P(D2|D1) ·P(D3|D1∩D2)

A la primera extracció, sabem que hi hamsobre un total den resistències:

P(D1) =mn

En haver sortit defectuosa la primera resistència, s’afegeixenr resistències no defectuo-ses. Com que n’hem tret una, ara hi hauràn−1+ r resistències a la capsa, de les qualsm−1 són defectuoses.

P(D2|D1) =m−1

n−1+ r

A la tercera extracció, tindremm−2 resistències defectuoses per un total den−2+2rresistències que hi haurà a la capsa.

P(D3|D1∩D2) =m−2

n−2+2r

Finalment,

P(D1∩D2∩D3) =m· (m−1) · (m−2)

n· (n−1+ r) · (n−2+2r)

Problema 2.48 Una capsa conté5 claus defectuosos i4 d’acceptables; una altra enconté4 de defectuosos i5 d’acceptables. Es trasllada un clau de la primera capsa a lasegona i, a continuació, se’n treu un de la segona.

(a) Quina és la probabilitat que sigui acceptable?(b) Quina és la probabilitat que, sabent que és defectuós, provingui de la primera cap-

sa?Solucio

(a) Denotem perA1 el fet de treure un clau acceptable a la primera extracció, és a dir, al’extracció que fem de la primera capsa. Veieu que el fet de treure un clau defectuósel denotem perA1, ja que són esdeveniments complementaris. Tindrem:

P(A1) =49

P(A1) =59

97

Page 95: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) D’altra banda, denotem perA2 el fet de treure un clau acceptable a la segona ex-tracció, la que fem de la segona capsa havent ja traspassat el clau de la primeracapsa. De nou queda denotat perA2 el fet de treure un clau defectuós a la segonaextracció. Llavors el que ens demanen és trobarP(A2). Hem de preveure dues pos-sibilitats: que el clau traspassat sigui acceptable i que aquest sigui defectuós. Si ésacceptable, a la segona capsa tindrem 6 claus acceptables i 4 de defectuosos. Pertant, la probabilitat de treure’n un d’acceptable a la segona extracció si sabem quea la primera ha sortit acceptable serà

P(A2|A1) =610

Si el clau traspassat és defectuós, a la segona capsa en tindrem 5 de defectuosos i5 d’acceptables; per tant, la probabilitat de treure’n un d’acceptable en aquest casserà

P(A2|A1) =510

Per probabilitat total, podem calcularP(A2) com:

P(A2) = P(A2|A1) ·P(A1)+P(A2|A1) ·P(A1)

=610

· 49+

510

· 59=

4990

≈ 0.54444

(b) Denotem ara perC1 el fet que el clau extret a la segona extracció sigui inicialmentde la primera capsa. Ens demanen, per tant,

dsP(C1|D2)

Aplicant el teorema de Bayes:

P(C1|A2) =P(C1)P(A2|C1)

P(A2)

La probabilitat que el clau de la segona extracció sigui defectuós sabent que és de laprimera capsa, és la probabilitat que el clau de la primera extracció sigui defectuós,és a dir,

P(A2|C1) = P(A1) =59

Sabem d’altra banda, que a la segona capsa tenim 10 claus, dels quals només unpertany a la primera capsa; per tant,

P(C1) =110

A l’apartat anterior, hem calculatP(A2); per tant, podem conèixer la probabilitatque a la segona extracció surti defectuós:

98

Page 96: Llibre estadística

Elements de probabilitat

(a) P(A2) = 1−P(A2) = 1− 4990

=4190

Substituint els valors,

P(C1|A2) =

110

· 59

4190

=541

≈ 0.12195

Problema 2.49 Es llança un dau equilibrat i el nombre obtingut és el nombre de bolesblanques que posem en una urna. A continuació, es torna a llançar el dau i es repeteixl’operació introduint-hi ara boles negres. Finalment, traiem una bola de l’urna. Quinaés la probabilitat que sigui blanca?

Solucio

Si denotem perDbi el fet de treure uni en llançar el primer dau (per tant,i serà el nombre de

boles blanques), i perDnj el fet de treure unj en llançar el segon dau (j serà el nombre de

boles negres), per a cada combinació de resultats la probabilitat de treure bola blanca serà

P(B|Dbi ∩Dn

j ) =i

i + j

Per probabilitat total, sabem que

P(B) =6

∑i=1

6

∑j=1

P(B|Dbi ∩Dn

j ) ·P(Dbi ∩Dn

j )

El resultat dels dos llançaments de dau són independents, i els sis resultats de cada tiradasón equiprobables. Llavors, per a qualsevol combinació resultant, la probabilitat és lamateixa:

P(Di ∩D j) = P(Di) ·P(D j) =16· 16=

136

Per tant, calculem la probabilitat de treure una bola blanca com:

P(B) =6

∑i=1

6

∑j=1

ii + j

· 136

=12

El resultat obtingut era previsible, ja que en fer servir el mateix dau per a determinar elnombre de boles blanques que per a determinar-ne el de boles negres, el problema es potconsiderar simètric, és a dir,P(B) =P(N), i atès que són esdeveniments complementaris,P(B)+P(N) = 1, tenim queP(B) = 1

2.

Problema 2.50 Es tenen N urnes, cada una de les quals conté4 boles blanques i6 denegres, i una altra urna amb5 boles blanques i5 boles negres. Es pren una urna a l’atzarentre les N+1 i se’n treuen dues boles, que resulten ser negres. La probabilitat que enaquesta urna hi quedin5 boles blanques i3 de negres és de1

7. Calculeu el valor de N.

99

Page 97: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

Denotem perU1 el fet d’escollir una de lesN urnes, i perU2 el fet d’escollir l’altra urna.Denotem també pernn el fet de treure dues boles negres d’una urna. L’enunciat ens diuque la probabilitat que a la urna quedin 3 boles negres i 5 de blanques si n’hem tret duesnegres, és a dir, la probabilitat que haguem triat la urna amb 5 boles de cada color sin’hem tret dues boles negres, és d’1

7:

P(U2|nn) =17

Aplicant el teorema de Bayes

P(U2|nn) =P(U2)P(nn|U2)

P(nn)

La probabilitat dels esdevenimentsU1 i U2 és

P(U1) =N

N+1

P(U2) =1

N+1

Podem calcular fàcilment la probabilitat de treure dues boles negres si sabem quina urnahem triat:

P(nn|U1) =610

· 59=

13

P(nn|U2) =510

· 49=

29

La probabilitat de treure dues boles blanques dependrà de quina urna hem triat; per tant,podem fer servir el teorema de la probabilitat total:

P(nn) = P(nn|U1) ·P(U1)+P(nn|U2) ·P(U2) =13· NN+1

+29· 1N+1

Substituint-ho, tindrem

P(U2|nn) =1

N+1· 2

913· N

N+1+ 2

9· 1

N+1

=2

3N+2

Per tant, hem de resoldre l’equació

23N+2

=17

⇒ N = 4

Problema 2.51 S’ha llançat un nombre indeterminat de daus i la suma dels punts ob-tinguts és quatre. Calculeu la probabilitat que s’hagi jugat amb dos daus.

100

Page 98: Llibre estadística

Elements de probabilitat

Solucio

Denotem perDi el fet que s’hagin fet serviri daus, oni = 1,2,3,4, ja que com a màximes poden haver fet servir 4 daus. Per tant, sabem queP(Di) =

14

Denotem també perSi elfet que la suma dels resultats dels daus sigui igual ai. Ens demanen, llavors,P(D2|S4), iaplicant el teorema de Bayes tenim que

P(D2|S4) =P(D2)P(S4|D2)

P(S4)

Calculem la probabilitat de treure una suma en concret en una tirada dei daus com elnombre de casos favorables sobre el nombre de casos totals. Haurem de veure, doncs,per a cada nombre de daus les possibilitats que sumen 4. Considerem els esdevenimentscondicionats següents:

S4|D1 = 4S4|D2 = 13,22,31S4|D3 = 112,121,211S4|D4 = 1111

i sabem, mitjançant variacions amb repetició, que el nombre de possibilitats en cada casés:

VR6,i = 6i

Per tant,

P(S4|D1) =16

P(S4|D2) =362

P(S4|D3) =363

P(S4|D4) =164

Per a calcularP(S4), fem servir probabilitat total:

P(S4) = P(S4|D1) ·P(D1)+P(S4|D2) ·P(D2)+P(S4|D3) ·P(D3)+P(S4|D4) ·P(D4)

=16· 14+

362

· 14+

363

· 14+

164

· 14=

3435184

Substituint els valors,

P(D2|S4) =14· 3

363435184

=108343

≈ 0.31487

101

Page 99: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 2.52 L’Anna, el Jordi i la Laia, per aquest ordre, llancen una moneda al’aire. El primer que treu una cara guanya. Quines són les seves probabilitats respectivesde guanyar?

Solucio

Denotem perGA el fet que guanyi l’Anna, perGJ el fet que guanyi el Jordi i perGL el fetque guanyi la Laia. Perquè l’Anna guanyi, ha de surtir cara al primer llançament. Peròtambé guanyarà si treu creu, surten dues creus més i, després, ella treu cara. I també hofarà si surten sis creus i ella treu una cara, i així succesivament. Per tant,

GA = (c)∪ (+++c)∪ (+ · · ·+︸ ︷︷ ︸6 vegades

c)∪ (+ · · ·+︸ ︷︷ ︸9 vegades

c)∪· · ·

i atès que cada combinació és incompatible amb la resta,

P(GA) = P(c)+P(+++c)+P(+ · · ·+︸ ︷︷ ︸6 vegades

c)+P(+ · · ·+︸ ︷︷ ︸9 vegades

c)+· · ·

La probabilitat que en llançar una monedai vegades surti una combinació concreta deresultats és( 1

2)i, és a dir,

P(c) =12

P(+++c) =

(12

)4

P(+ · · ·+︸ ︷︷ ︸6 vegades

c) =

(12

)7

i així successivament. Llavors, busquem

P(GA) =12+

(12

)4

+

(12

)7

+ · · ·=∞

∑i=0

(12

)1+3i

Per resoldre aquest sumatori, hem de saber que la suma d’una progressió geomètrica de

raór amb|r|< 1 és∞∑i=0

r i =1

1− r. Si reescrivim el nostre sumatori,

P(GA) =∞

∑i=0

(12

)1+3i

=12

∑i=0

(12

)3i

=12

∑i=0

(123

)i

=12· 1

1− 123

=47

102

Page 100: Llibre estadística

Elements de probabilitat

Les combinacions que fan guanyador en Jordi són

GJ = (+c)∪ (++++c)∪ (+ · · ·+︸ ︷︷ ︸7 vegades

c)∪· · ·

Per tant,

P(GJ) = P(+c)+P(++++c)+P(+ · · ·+︸ ︷︷ ︸7 vegades

c)+· · ·

=

(12

)2

+

(12

)5

+

(12

)8

+ · · ·

=122

∑i=0

(123

)i

=14· 1

1− 123

=27

I, pel mateix mètode,

GL = (++c)∪ (+ · · ·+︸ ︷︷ ︸5 vegades

c)∪ (+ · · ·+︸ ︷︷ ︸8 vegades

c)∪· · ·

P(GL) = P(++c)+P(+ · · ·+︸ ︷︷ ︸5 vegades

c)+P(+ · · ·+︸ ︷︷ ︸8 vegades

c)+· · ·

=

(12

)3

+

(12

)6

+

(12

)9

+ · · ·

=123

∑i=0

(123

)i

=18· 1

1− 123

=17

Problema 2.53 L’Oriol llança una moneda a l’aire fins que treu una cara. A continua-ció, la Clàudia llança la mateixa moneda fins que treu una cara. Calculeu la probabilitatque la moneda s’hagi llançat un total de n vegades.

Solucio

El problema plantejat és equivalent al de llançar una moneda a l’aire fins que surten duescares. En aquest cas, les primeres tirades de la moneda les fa l’Oriol, i les últimes tiradesles fa la Clàudia.

Observem, per un moment, un dels casos favorables en 5 tirades:

++c︸ ︷︷ ︸Oriol

+c︸︷︷︸Clàudia

Observem que l’última tirada és sempre una cara, i que en les quatre anteriors només hiha una cara.

103

Page 101: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Quina és la probabilitat d’aquest cas particular? En aquest cas, atès que la moneda ésequiprobable, la probabilitat és

P(++c+c) =(

12

)5

=132

Però com aquest cas favorable en 5 tirades n’hi ha més:

c+++c+c++c++c+c

...

Quants són, exactament? Són, de fet, el nombre de maneres diferents que tenim de col-locar les tres creus en quatre posicions, és a dir,

C4,3 =

(43

)= 4

Per tant, la probabilitat que la moneda s’hagi llançat un total de 5 vegades és

4· 132

=18.

I la probabilitat que la moneda s’hagi llançatn vegades?

Veiem que la probabilitat de qualsevol combinació concreta den llançaments de monedaserà sempre de( 1

2)n. Veiem també que el nombre de combinacions per a un nombre de

llançaments determinat depèn de quan tregui cara l’Oriol, ja que la Clàudia sempre latraurà en última posició. Per tant, per an llançaments l’Oriol pot treure cara al primerllançament, o al segon, o al tercer,. . . i així fins al penúltim, és a dir, eln−1, i tots ellsseran esdeveniments diferents amb el mateix nombre de llançaments i que satisfan lescondicions de l’enunciat.

En aquest cas general, tenim, doncs,

(n−1

1

)·(

12

)n

= (n−1)

(12

)n

.

Problema 2.54 S’introdueixen tres boles a l’atzar i de forma independent en cinc urnes.

(a) Calculeu la probabilitat que les tres boles estiguin a la mateixa urna(b) Calculeu la probabilitat que no hi hagi cap urna que contingui dues boles.

Solucio

Ens serà més fàcil resoldre aquest problema si interpretem que estem escollint tres urnesde cinc possibles amb possibilitat de repetir. Per tant, l’esdeveniment 131 significa que

104

Page 102: Llibre estadística

Elements de probabilitat

la primera bola ha anat a la primera urna; la bola dos a la tercera urna, i l’última bolaa la primera urna de nou. Atès que cada introducció és independent, la probabilitat dequalsevol conjunt de tres introduccions serà1

5· 1

5· 1

5= 1

53 =1

125.

(a) Denotem perT el fet que les tres boles acabin a la mateixa urna. Segons la notaciódefinida, això és

T = 111,222,333,444,555

i, atès que els esdeveniments són incompatibles,

P(T) = P(111∪222∪333∪444∪555)= P(111)+P(222)+P(333)+P(444)+P(555)

= 5· 153

=125

(b) Quan fem l’experiment proposat, hi ha tres possibilitats quant a la distribució de lesboles: que les tres quedin juntes (fet que hem denotat perT), que les tres quedinseparades (fet que denotem perS) i que quedin dues en una urna i una en una altra(fet que denotem perD). Ens demanenP(D), i sabem que entreT,D i Ses preveuentotes les possibilitats de l’espai mostral; per tant,

P(D) = P(T)+P(S)

A l’apartat anterior, ja hem calculatP(T). Per calcularP(S), hem de buscar quantescombinacions de tres urnes satisfan l’esdevenimentS. Ho podem calcular mitjançantles variacions

V5,3 = 5·4·3= 60

Llavors, igual que hem fet en calcularP(T),

P(S) = P(123)+P(124)+P(125)+ · · ·+P(456) = 60· 153

=1225

I, finalment,

P(D) = P(T)+P(S) =125

+1225

=1325

Problema 2.55 El temari d’un examen està compost per100temes. L’examen consisteixen l’exposició a l’atzar de dos temes. Per aprovar, cal contestar correctament els dos te-mes. Quin és el nombre mínim de temes que cal estudiar perquè la probabilitat d’aprovarsigui superior a la probabilitat de suspendre?

Solucio

Denotem perA el fet d’aprovar l’examen; perSi el fet d’haver estudiat eli-èsim tema queens preguntin, i pern el nombre de temes que ens sabem. Necessitem que la probabilitatd’aprovar sigui superior a la de no aprovar.

105

Page 103: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

P(A)> P(A) = 1−P(A) ⇒ 2·P(A)> 1 ⇒ P(A)>12

Per tant, calcularem quin valor den fa queP(A) = 12, i sabrem que ens cal l’enter imme-

diatament superior. Per aprovar, hem d’haver estudiat els dos temes que ens demanin.Llavors

P(A) = P(S1∩S2) = P(S1) ·P(S2|S1)

Hi ha un total de 100 temes, dels quals haurem estudiatn, per tant,

P(S1) =n

100

Atès que el segon tema que ens preguntin no pot coincidir amb el primer, un cop respostel primer ens quedarann−1 temes coneguts per un total de 99 temes possibles:

P(S2|S1) =n−199

Substituint les dades,

P(A) = P(S1) ·P(S2|S1) =n

100· n−1

99

Per tant, hem de resoldre l’equació

n100

· n−199

=12

⇐⇒ 2n2−2n−9900= 0

que té dues solucions:

n1 = 70.858

n2 = −69.858

El valor negatiu no té sentit, en aquest cas. El valor positiu correspon al nombre detemes que igualaria la probabilitat d’aprovar amb la de suspendre; per tant, 71 és elnombre mínim de temes que hem d’estudiar per a tenir més opcions d’aprovar que desuspendre. Ho podem comprovar:

P(A70) =70100

· 6999

≈ 0.48788

P(A71) =71100

· 7099

≈ 0.50202

Problema 2.56 Suposem que el temari d’un examen té50 lliçons i que ens n’hem pre-parat15. A l’examen, se seleccionen aleatòriament5 lliçons.

(a) Calculeu la probabilitat que ens sapiguem les5 lliçons.(b) Si per aprovar cal contestar, com a mínim, tres lliçons, calculeu la probabilitat

d’aprovar l’examen.

106

Page 104: Llibre estadística

Elements de probabilitat

Solucio

(a) Denotem perSi el fet de saberi lliçons de les cinc que entren a l’examen, i perLi elfet de saber lai-èsima pregunta de les cinc de l’examen. Per tant, en aquest cas hemde trobar

P(S5) = P(L1∩L2∩L3∩L4∩L5)

La probabilitat que ens sapiguem la segona lliçó depèn de si ens sabem la primera, iaixí successivament; per tant,

P(S5) = P(L1) ·P(L2|L1) ·P(L3|L1∩L2) ·P(L4|L1∩L2∩L3) ·P(L5|L1∩L2∩L3∩L4)

Si sabem 15 de les 50 lliçons, la probabilitat de saber la primera lliçó serà de1550

. Pera la segona, ens quedaran 49 lliçons possibles, de les quals en sabrem 14; per tant,la probabilitat de saber la segona lliçó si sabíem la primera serà de14

49. Seguint amb

aquest raonament, tindrem

P(S5) =1550

· 1449

· 1348

· 1247

· 1146

≈ 0.0014173

(b) Si hem de contestar tres lliçons o més per aprovar, calcularem aquesta probabilitatcom

P(A) = P(S3∪S4∪S5) = P(S3)+P(S4)+P(S5)

Ja hem calculatP(S5). Per calcularP(S4), fem servir el mateix sistema, però enaquest cas veiem que hi ha diverses combinacions: podríem no saber la primerapregunta, o la segona, o la tercera. . . ; per tant,

P(S4) =

P((L1∩L2∩L3∩L4∩L5)∪ (L1∩ L2∩L3∩L4∩L5)∪ . . .∪ (L1∩L2∩L3∩L4∩ L5))

La probabilitat de cada una d’aquestes combinacions és la mateixa; per tant,calculant-ne una sabrem el valor de la resta. Si calculem la primera com ho hemfet abans, tindrem

P(L1∩L2∩L3∩L4∩L5) =

P(L1) ·P(L2|L1) ·P(L3|L1∩L2) ·P(L4|L1∩L2∩L3) ·P(L5|L1∩L2∩L3∩L4)

=3550

· 1549

· 1448

· 1347

· 1246

Aleshores, ens cal conèixer el nombre de combinacions diferents que podem fer decinc elements on quatre són iguals, i això ve donat perC5,4. Per tant,

P(S4) =

(54

)· 3550

· 1549

· 1448

· 1347

· 1246

107

Page 105: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Si calculemS3 pel mateix mètode, obtindrem

P(S3) =

(53

)· 3550

· 3449

· 1548

· 1447

· 1346

i, ajuntant-ho tot,

P(A) =

(53

)· 35

50· 34

49· 15

48· 14

47· 13

46+

(54

)· 35

50· 15

49· 14

48· 13

47· 12

46+

1550

· 1449

· 1348

· 1247

· 1146

≈ 0.15174

Problema 2.57 El 20%dels ordinadors d’una empresa són portàtils i la resta, de so-bretaula. Dels portàtils, el10% tenen una memòria RAM de8 Gb, el20% tenen unamemòria de4 Gb i la resta tenen1 Gb. Dels ordinadors de sobretaula, el30%tenen unamemòria RAM de8 Gb, el50% tenen una memòria de4 Gb i la resta tenen1 Gb. Esdemana:

(a) Trobeu la probabilitat que un ordinador tingui8 Gb.(b) Trobeu la probabilitat que un ordinador tingui8 Gb i sigui portàtil.(c) Trobeu la probabilitat que un ordinador que tingui8 Gb sigui portàtil.

Solucio

Denotem perL el fet que un ordinador sigui portàtil i periG el fet que un ordinadortingui una memòria RAM dei Gb. Llavors, podem expressar les dades de l’enunciatcom

P(L) =210

P(L) =810

P(8G|L) =110

P(8G|L) =310

P(4G|L) =210

P(4G|L) =510

P(1G|L) =710

P(1G|L) =210

(a) Per probabilitat total,

P(8G) = P(8G|L) ·P(L)+P(8G|L) ·P(L) = 110

· 210

+310

· 810

=26100

(b) Per la definició de probabilitat condicionada,

P(8G∩L) = P(8G|L) ·P(L) = 110

· 210

=2

100

108

Page 106: Llibre estadística

Elements de probabilitat

(c) De nou, mitjançant la definició de probabilitat condicionada,

P(L|8G) =P(L∩8G)

P(8G)=

210026100

=226

≈ 0.076923

Problema 2.58 Una capsa conté dues monedes normals i una moneda trucada, que tédues cares.

(a) Escollim una moneda a l’atzar i es llança dues vegades a l’aire. Quina és la proba-bilitat que surtin dues cares?

(b) Escollim una moneda a l’atzar i es llança tres vegades a l’aire. Quina és la proba-bilitat que surtin tres cares?

(c) Escollim una moneda a l’atzar i es llança tres vegades a l’aire. Si n’obtenim trescares, quina és la probabilitat que sigui la moneda trucada?

Solucio

(a) Segons l’enunciat, podem considerar que l’espai mostral està dividit en dues parts:moneda no trucada (que representem perT) i moneda trucada (que representem perT). Atès que tenim dues monedes no trucades, d’un total de tres monedes, la proba-bilitat de considerar una moneda no trucada ésP(T) = 2

3, mentre que la probabilitat

de considerar una moneda trucada ésP(T) = 13. Pel teorema de la probabilitat total,

tenim que la probabilitat de treure dues cares és

P(cc) = P(cc|T)P(T)+P(cc|T)P(T)

=14· 23+1· 1

3=

12.

(b) De forma similar a l’apartat anterior, tenim que

P(ccc) = P(ccc|T)P(T)+P(ccc|T)P(T)

=18· 23+1· 1

3=

512

.

(c) En aquest cas, ens demanenP(T|ccc). Aplicant el teorema de Bayes,

P(T|ccc) =P(T)

P(ccc) ·P(ccc|T)

=13512

·1=45.

109

Page 107: Llibre estadística

Hola

Page 108: Llibre estadística

Variables aleatòries

“Gott würfelt nicht.”

Albert Einstein en una carta a Max Born

Moltes vegades, els esdeveniments elementals o els resultats d’una experiència aleatòrias’expressen en forma numèrica, com és el cas del llançament d’un dau. Però hi ha experi-ments, com ara el llançament d’una moneda o d’un dard a una diana, que donen resultatsno numèrics, cosa que dificulta el plantejament d’un possible estudi quantitatiu dels tretsmés característics dels esdeveniments. Gràcies a les variables aleatòries, es pot assignarun nombre real a cada resultat d’una experiència aleatòria, i així es pot fer un tractamentmatemàtic més còmode de les característiques d’aquests resultats.

3.1. Conceptes basics

Siguiξ una experiència aleatòria com, per exemple, el llançament d’una moneda a l’aire,i Ω el seu espai mostral.S’anomenavariable aleatòriatota aplicacióX de l’espai mostralΩ sobre els reals

X : Ω → R,

de forma que s’assigna un nombre real a cada esdeveniment elemental.

Si el recorregutX(Ω) o conjunt de valors que pot prendre la variable aleatòria és finit onumerable, es diu que la variable aleatòriaX ésdiscreta.

Denotem perX(Ω) = x1,x2,. . . ,xn el recorregut deX si aquest és finit. En el cas que elrecorregut sigui numerable, el denotem perX(Ω) = x1,x2,. . ..

Si X(Ω) és un conjunt infinit no numerable, es diu que la variable aleatòriaX éscontínua.

111

Page 109: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Observació 3.5Notem que una variable aleatòria no és una característica intrínsecade l’experiència aleatòria ni del seu espai mostral. Sobre un mateix espai mostral, podenhaver-hi definides tantes variables aleatòries com aplicacions X deΩ sobreR.

Exemple 3.9 Considerem l’experiència aleatòriaξ de llançar dues vegades una mone-da a l’aire. L’espai mostral associat a aquesta experiència és

Ω = cc,c+,+c,++.

Una possible variable aleatòria és

X1 : Ω → Rcc 7→ 2

c+ 7→ 1+c 7→ 1++ 7→ 0

però una altra variable aleatòria seria

X2 : Ω → Rcc 7→ 1

c+ 7→ 0+c 7→ 0++ 7→ 1

Fixeu-vos que la variable X1 compta el nombre de cares, mentre que X2 està associadaal fet d’obtenir dos resultats idèntics en els dos llançaments.

Observació 3.6Per a una variable aleatòria discreta, la imatge inversa X−1(xi) de cadaelement xi de X(Ω) és un esdeveniment i, com a tal, té associada una probabilitat. Perexemple, si considerem la variable X, que compta la suma del llançament de dos dausde sis cares, aleshores X−1(3) = (2,1),(1,2), que té probabilitat1

18.

Exemple 3.10Sigui l’esdevenimentξ fer tres tirades d’una moneda. Aleshores, l’espaimostral és

Ω = ccc,cc+,c+c,+cc,c++,+c+,++c,+++

Ens pot interessar recollir per mitjà d’una variable el nombre de cares que han sortit.Aquesta variable és Y= ∑3

i=1 Xi, amb Xi definida com Xi(ξ) = 1 si ha sortit cara en elllançament i-èsim, i Xi(ξ) = 0 altrament.

3.2. Algebra de variables aleatories

El conjunt de variables aleatòries real d’un espai mostralF = X : Ω→R té estructurad’àlgebra, és a dir:

(i) DonadesX, Y ∈ F , la sumaX+Y ∈ F .(ii) DonadaX ∈ F i λ ∈ R, λX ∈ F .

(iii) DonadesX, Y ∈ F , el producteXY∈ F .

112

Page 110: Llibre estadística

Variables aleatòries

(iv) La variable 1F definida per 1F (s) = 1 per a tots∈ Ω, pertany aF .(v) DonadaX ∈ F , amb P(X= 0) = 0, 1F

X∈ F .

(vi) DonadesX, Y ∈ F , el màxim max(X,Y) i el mínim min(X,Y) ∈ F .

Exemple 3.11Sigui l’esdevenimentξ fer dues tirades d’una moneda. Aleshores l’espaimostral és

Ω = cc,c+,+c,++

Considerem la variable aleatòria X1, que val 1 si en elprimer llançament ha sortit carai 0 altrament:

X1 : Ω → Rcc 7→ 1

c+ 7→ 1+c 7→ 0++ 7→ 0

Considerem també la variable aleatòria X2, que val 1 si en elsegonllançament ha sortitcara i 0 altrament:

X2 : Ω → Rcc 7→ 1

c+ 7→ 0+c 7→ 1++ 7→ 0

La variable X= X1+X2 és tal que

X(s) = X1(s)+X2(s), s∈ Ω

i, en consequència,

X : Ω → R

cc 7→ X(cc) =X1(cc)+X2(cc) =1+1= 2c+ 7→ X(c+) =X1(c+)+X2(c+) = 1+0= 1+c 7→ X(+c) =X1(+c)+X2(+c) = 0+1= 1++ 7→ X(++) = X1(++)+X2(++) = 0+0= 0

Observació 3.7La composició de variables aleatòries és també una variable aleatòria.

L’esdevenimentX−1(a), és a dir,X−1(a) = s∈ Ω | X(s) = a el denotem perX = a:

(X = a)≡ X−1(a) = s∈ Ω | X(s) = a

De la mateixa manera,X−1([a,b]), és a dir,s∈ Ω | a ≤ X(s) ≤ b el denotem pera≤ X ≤ b:

(a≤ X ≤ b)≡ X−1([a,b]) = s∈ Ω | a≤ X(s)≤ b

113

Page 111: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Exemple 3.12Considerem l’experiència aleatòriaξ de llançar dues vegades una mo-neda a l’aire. L’espai mostral associat a aquesta experiència és

Ω = cc,c+,+c,++.

La variable aleatòria X, que compta el nombre de cares, és

X : Ω → Rcc 7→ 2

c+ 7→ 1+c 7→ 1++ 7→ 0

Aleshores,

(X = 0) = X−1(0) = ++(X = 1) = X−1(1) = c+,+c(X = 2) = X−1(2) = cc

Noteu que, si en aquest cas X(Ω) = 0,1,2, aleshores

Ω = (X = 0)∪ (X = 1)∪ (X = 2)

essent, a més, esdeveniments incompatibles, és a dir,

(X = i)∩ (X = j) = /0, i 6= j, i, j = 0,1,2

3.3. Distribucions de probabilitat

La distribució de probabilitato funció de probabilitatassociada a una variable aleatòriadiscretaX, definida sobre un espai mostralΩ, és l’aplicacióf que fa correspondre a cadaelementxi deX(Ω) la probabilitat que la variableX prengui aquest valor o, el que és elmateix, la probabilitat de l’esdevenimentX−1(xi):

f : X(Ω) → R

xi 7→ f (xi) = P(X = xi)

Podem estendre aquesta funció a tots els reals fàcilment,fe : R→ R, si considerem

fe(x) =

f (x), x∈ X(Ω)

0, x 6∈ X(Ω).

En el fons, identifiquemf amb fe.

Exemple 3.13En el cas de la tirada d’un dau de sis cares, si definim la variable alea-tòria X com el resultat de la tirada, la funció de probabilitat fe és

fe(x) =

16, x= 1,2,3,4,5,6

0, altrament

114

Page 112: Llibre estadística

Variables aleatòries

Propietats de la funcio de probabilitat

La funció de probabilitat compleix dues propietats que, a la vegada, la caracteritzen:

(i) 0 ≤ f (x)≤ 1, per a totx∈ R.(ii) ∑∞

i=1 f (xi) = 1.

Observació 3.8La suma de tots els valors que pren la distribució de probabilitat és lasuma de les probabilitats que es donin tots i cada un dels valors de la variable aleatòria.I, com que representen esdeveniments mútuament excloents, podem afirmar que

∑i

f (xi) = ∑i

P(X = xi) = 1.

La funció de distribucióo distribució de probabilitat acumuladaassociada a una variablealeatòria discretaX, definida sobre un espai mostralΩ, és l’aplicacióFX que fa corres-pondre a cada elementx deX(Ω) la probabilitat que la variableX prengui un valor méspetit o igual ax:

FX : X(Ω) → R

x 7→ F(x) = P(X ≤ x) = ∑xk≤x

P(X = xk)

De la mateixa manera que ho hem fet amb la funció de probabilitat, podem estendre lafuncióFX aFe : R→ R. En aquest cas, també identifiquemF = Fe.

Exemple 3.14En el cas de la tirada d’un dau de sis cares, si definim la variable alea-tòria X com el resultat de la tirada, la funció de probabilitat fe és

fe(x) =

16, x= 1,2,3,4,5,6

0, altrament

Aleshores, la seva funció de distribució és

F(x) =

0, x< 11/6, 1≤ x< 22/6, 2≤ x< 33/6, 3≤ x< 44/6, 4≤ x< 55/6, 5≤ x< 61, 1≤ x≥ 6

Propietats de la funcio de distribucio

Les propietats més importants de la funció de distribució són

(i) 0 ≤ FX(x)≤ 1, per a totx∈ R.

(ii) F és monòtona creixent.

115

Page 113: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(iii) limx→∞

FX(x) = 1 i limx→−∞

F(x) = 0.

(iv) P[a< X ≤ b] = FX(b)−FX(a).

(v) FX és contínua per la dreta.

Demostració

(i) Per a totx ∈ R, FX(x) = P(X ≤ x) ∈ [0,1], atès queP és una probabilitat iX ésvariable aleatòria.

(ii) Donatx≤ y, és clar que el conjuntX ≤ x està contingut enX ≤ y. Per tant,

FX(x) = P(X ≤ x)≤ P(X ≤ y) =FX(y).

(iii) D’una banda, és clar que limx→∞

X ≤ x= Ω, ja que el recorregut deX està contingut

en els reals i, per tant, si és finit té màxim i, si és numerable per l’axioma delsuprem, té suprem menor o igual a infinit. D’altra banda, lim

x→−∞X ≤ x = /0, atès

que, si el recorregut és fitat, té mínim i, si és numerable per l’axioma de l’ínfim,té infím que serà major o igual a menys infinit. La propietat resulta del fet queP(Ω) = 1 i P( /0) = 0.

(iv) FX(b)−FX(a) = P(X ≤ b)−P(X ≤ a) = P(X ≤ a)+P(a< X ≤ b)−P(X ≤ a)

= P(a< X ≤ b).

(v) Donada una successió decreixentxn tal que

limn→∞

xn= x,

tenim que

limn→∞

X ≤ xn= X ≤ x,

de manera queFX és contínua per la dreta.

Observació 3.9Suposant que els valors del recorregut de X estan ordenats de menor amajor, podem expressar també la funció de distribució com

F(xi) =i

∑k=1

P(X = xk).

Observació 3.10Les funcions de distribució i de probabilitat d’una variable aleatòriadiscreta es poden relacionar de la manera següent:

1. F(x) = ∑xi≤x

f (xi), per a tot x∈ R.

2. f(xk) = F(xk)−F(xk−1), per a k= 2,3,. . . i considerant f(x1) = F(x1).

116

Page 114: Llibre estadística

Variables aleatòries

3.4. Caracterıstiques d’una variable aleatoria discreta

Quan un estudiant rep un conjunt de notes, el primer que es planteja és fer-ne la mitjana,és a dir, trobar el resultat que s’espera que tregui als seus exàmens: l’esperança de lavariable. Tot i això, aquesta característica no ens aporta massa informació, ja que dosestudiants poden tenir una mitjana de 7 però a partir de notes diferents. El primer pothaver tret un 6.5 i un 7.5, mostrant una bona regularitat, mentre que el segon podria tenirun 4 i un 10. Per tant, una segona característica interessant a estudiar en les variablesaleatòries discretes és com es desvien de la mitjana, la seva variància.

En aquesta secció, presentem un estudi rigurós d’aquestes dues i d’altres característiquesfonamentals d’una variable aleatòria.

Esperanca matematica

Anomenemesperança matemàticao mitjanad’una variable aleatòriaX amb recorregutX(Ω) = x1,x2,. . . ,xk el nombre

E(X) = µ=k

∑i=1

xi · f (xi) =k

∑i=1

xi ·P[X = xi].

Si el recorregut de la variable aleatòria discreta és infinit numerable, aleshoresk= ∞ i lasuma es converteix en una sèrie numèrica.

Propietats de l’esperanca

(i) Si a≤ X ≤ b, l’esperança deX existeix i, a més,a≤ E(X)≤ b.

(ii) Si X ≥ 0, l’esperança deX, si existeix, també és positiva.

(iii) Donada una variableX (amb esperança) iλ ∈ R, E(λX) = λX.

(iv) Donades dues variablesX i Y (amb esperança),E(X+Y) = E(X)+E(Y).

(v) Si existeix l’esperança d’una variable aleatòriaX, aleshores|E(X)| ≤ E(|X|).(vi) Si la funció de probabilitat deX és simètrica respecte dea, l’esperança, si existeix,

val a.

Demostració

(i) Suposem que la variable té un recorregut finit, és a dir,X(Ω) = x1,. . . ,xn (el casinfinit no numerable és absolutament idèntic canviantn per+∞). Aleshores, sabentquea≤ xi ≤ b per a toti = 1,2,. . . ,n, tenim que

(iii)n

∑i=1

aP(X = xi)≤n

∑i=1

xiP(X = xi)≤n

∑i=1

bP(X = xi),

que és equivalent a

an

∑i=1

P(X = xi)

︸ ︷︷ ︸1

≤n

∑i=1

xiP(X = xi)≤ bn

∑i=1

P(X = xi)

︸ ︷︷ ︸1

,

117

Page 115: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(iii) és a dir,

a≤ E(X)≤ b.

L’existència de l’esperança és garantida, fins i tot en el cas numerable, ja que lasèrie corresponent seria de termes positius i estaria fitada superiorment perb.

(ii) Si existeix l’esperança, la demostració és directa aplicant l’apartat (i), consideranta= 0 i b=+∞.

(iii) Suposem que existeix l’esperança de la variable aleatòriaX, és a dir,

E(X) =n

∑i=1

xiP(X = xi),

aleshores, tenim que

E(λX) =n

∑i=1

λxiP(X = xi) = λn

∑i=1

xiP(X = xi) = λE(X).

(iv) Per definició, tenim que

E(X+Y) =n

∑i=1

m

∑j=1

(xi +yj)P(X = xi)P(Y = yj)

=n

∑i=1

m

∑j=1

xiP(X = xi)P(Y = yj)+n

∑i=1

m

∑j=1

yjP(X = xi)P(Y = yj)

=m

∑j=1

P(Y = yj)n

∑i=1

xiP(X = xi)+n

∑i=1

P(X = xi)m

∑j=1

yjP(Y = yj)

=m

∑j=1

P(Y = yj)E(X)+n

∑i=1

P(X = xi)E(Y)

= E(X)m

∑j=1

P(Y = yj)+E(Y)n

∑i=1

P(X = xi)

= E(X)+E(Y).

(v) Sabem que, per a qualsevol nombres realsa i b, es té

|a+b| ≤ |a|+ |b|.

Aleshores, fent servir aquesta propietat, tenim que

|E(X)|=∣∣∣∣

n

∑i=1

xiP(X = xi)

∣∣∣∣ ≤n

∑i=1

|xiP(X = xi)|

=n

∑i=1

|xi|P(X = xi) = E(|X|).

118

Page 116: Llibre estadística

Variables aleatòries

(vi) Sigui xi | i ∈ I el recorregut deX. Considerem la variableY = X−a. Aleshores,el seu recorregut ésyi = xi −a‖ i ∈ I. Com que la funció de probabilitat deX éssimètrica respecte dea, la deY ho és respecte de zero, de manera que

P(Y = yi) = P(Y =−yi).

Per tant, en el sumatori que defineix l’esperança, els termes

yi ·P(Y = yi) i −yi ·P(Y = yi)

es cancel·len, de manera queE(Y) = 0, i per les propietats (i), de la qual es desprènque l’esperança d’una constant és la constant, i (iv), obtenim queE(X) = a.

Observació 3.11Si X(Ω) és finit, és tal que#Ω = n i tots els valors xi que pot pren-dre la variable aleatòria tenen la mateixa probabilitat f(xi) =

1n, aleshores l’esperança

matemàtica és la mitjana aritmètica.

Observació 3.12L’esperança matemàtica és una mesura de latendència centralde lavariable aleatòria.

Variancia

La variànciad’una variable aleatòria discretaX ambE(X) = µ es defineix com

VAR(X) = E[(X−µ)2] =∞

∑i=1

(xi −µ)2 ·P[X = xi].

Propietats

(i) Resultat de Steiner:VAR(X) = E(X2)− [E(X)]2.

(ii) La variància d’una variable és zero si i només si és constant.

(iii) VAR(a·X) = a2 ·VAR(X).

(iv) VAR(a+X) =VAR(X).

Demostració

(i) VAR(X) = E[(X−E(X))2] = E(X2−2XE(X)+ [E(X)]2)

= E(X2)−2E(X)E(X)+ [E(X)]2

= E(X2)− [E(X)]2

(ii) Donada una variableX = a, amba constant,E(X) = a. Per tant,

E[(X−E(X))2] = E[(a−a)2] = E(0) = 0.

Recíprocament, si

VAR(X) = E[(X−E(X))2] =n

∑i=1

(xi −E(X))2 = 0,

119

Page 117: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

aleshores, com que es tracta d’un sumatori de termes més gransque 0 o iguals, escompleix que és 0 només si tots els termes ho són, és a dir, només siX és constant.

(iii) VAR(a·X) = E[(a·X−E(a·X))2] = E[(a·X−aE(X))2]

= E[a2(X−E(X)2] = a2 ·VAR(X).

(iv) VAR(a+X) = E[(a+X−E(a+X))2] = E[(a+X−a−E(X))2]

= E[(X−E(X))2] =VAR(X).

Moments

Anomenemmoment centrat respecte de l’origen d’ordre ko moment no central

αk = E(Xk).

Anomenemmoment centrat respecte de la mitjana d’ordre ko moment central

µk = E[(X−E(x))k] = E[(X−µ)k].

Cal destacar que, per a la definició dels moments, cal que les variablesXk estiguin defi-nides.

Observació 3.13També podem definir l’esperança com el moment no central d’ordre1 i la variància com el moment central d’ordre 2.

Desviacio tipus

La desviació tipusd’una variable aleatòriaX es defineix com l’arrel quadrada de la sevavariància

σX =√

VAR(X).

Observació 3.14La variància i la desviació tipus mesuren com es dispersa, s’allunya,o es desvia la variable respecte de la seva mitjana. Així, una variància o desviaciótipus gran indica que la variable pren valors molt allunyats respecte de la mitjana. Al’exemple inicial, la variància de les notes de l’alumne que té un4 i un 10 és9, mentreque la de l’alumne que ha tret un6.5 i un 7.5 és0.25.

Coeficient de variacio

El coeficient de variació, com a mesura relativa de la dispersió, es defineix com

CVX =σX

µX

.

3.5. Variables aleatories contınues

Funcio de densitat

Anomenemfunció de densitat de probabilitatde la variable aleatòria contínuaX la fun-ció

120

Page 118: Llibre estadística

Variables aleatòries

f : R→ R

que compleix les condicions següents:

1. f (x)≥ 0, ∀x∈ R.

2.∫ ∞−∞ f (x)dx= 1.

3. P(a< X < b) =∫ b

a f (x)dx.

3.1L’àrea sota la corbad’una funció de densitatés sempre 1.f (x)

3.2La probabilitat

( < < ) es calculacom l’àrea delimitadaentre la gràfica de lafunció de densitat ( ) iles rectes = i = .

P a X b

f xx a x b

P(a< X < b)

a b

Funcio de distribucio

La funció de distribució F(x) d’una variable aleatòria contínuaX de funció de densitatf (x) es defineix com

F(x) = P(X ≤ x).

és a dir,

F(x) =∫ x

−∞f (t)dt.

121

Page 119: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.3La funció de distribució

d’una variable aleatòriacontínua de funció de

densitat ( ) avaluada enel punt es defineix com

l’àrea acumulada al’esquerra del punt .

F

Xf x

x

x

F(x) =∫ x

−∞f (t)dt

x

Propietats de la funcio de distribucio

(i) F(x) és creixent.

(ii) F(x) és no negativa.

(iii) F(x) és contínua.

(iv) F(x) és derivable. La seva derivada és, de fet, la funció de densitat

f (x) =dF(x)

dx.

(v) Els límits asimptòtics són

limx→−∞

F(x) = 0, limx→∞

F(x) = 1.

(vi) Es verificaP(a< X < b) = F(b)−F(a).

3.4Límits asimptòtics de tota

funció de distribució.

limx→+∞

F(x) = 1

limx→−∞

F(x) = 0

F(x)

122

Page 120: Llibre estadística

Variables aleatòries

3.5Tota funció dedistribució verifica

( < < ) = ( ) - ( ).P a X b F b F a

aa bb

P(a< X < b)P(a< X < b)

F(b)

F(a)

3.6. Caracterıstiques d’una variable aleatoria contınua

De la mateixa manera que en el cas discret, les característiques més rellevants de lesvariables aleatòries contínues són les que indiquen el seu comportament esperat i la sevadesviació respecte d’aquell. És clar, però, que la seva definició serà diferent, ja que nopodem plantejar sumatoris indexats en conjunts no numerables.

Esperanca matematica

Anomenemesperança matemàticao mitjanad’una variable aleatòria contínuaX el nom-bre

E(X) = µ=

∫ ∞

−∞x · f (x)dx.

Com en el cas discret, aquest paràmetre indica la tendència central de la variable aleatò-ria, és a dir, el valor al voltant del qual es distribueix.

Observació 3.15La integral que defineix l’esperança és, en molts casos, una integralimpròpia de primera espècie. Cal doncs, calcular-la de la manera següent:

E(X) =

∫ ∞

−∞x · f (x)dx= lim

b→∞

∫ 0

−bx · f (x)dx+ lim

b→∞

∫ b

0x · f (x)dx

Les propietats de l’esperança per a variables contínues són les mateixes que per a varia-bles discretes.

Variancia

La variànciad’una variable aleatòria contínuaX es defineix com

VAR(X) = E[(X−µ)2] =

∫ ∞

−∞(x−µ)2 · f (x)dx.

123

Page 121: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Les seves propietats són les mateixes que les de la variància definida per a variablesdiscretes.

La resta de característiques que s’han especificat per a les variables discretes (desviaciótipus, moments i coeficient de variació) es defineixen de la mateixa manera per a lesvariables discretes. Només cal tenir present que el càlcul de l’esperança i la variància ésdiferent.

3.7. Tipificacio de variables

Moltes vegades, es mesura una mateixa magnitud en diferents unitats o en diferentssituacions; per poder comparar-ne els resultats, hem de tipificar la variable. Donada unavariableX contínua o aleatòria, es diu queZ∗ és la variable tipificada si

Z∗ =X−µX

σX

;

la variableZ∗ té ara una esperança 0 i una desviació tipus 1.

Exemple 3.15La puntuació que un candidat obté en el primer exercici d’una oposicióés una variable aleatòria amb funció de densitat

f1(x) =

x20

, 0≤ x< 410−x

30, 4≤ x≤ 10

0, altrament

i la que obté en el segon exercici es distribueix segons la densitat

f2(x) =

x25

, 0≤ x< 510−x

25, 5≤ x≤ 10

0, altrament

Si un opositor obté unes qualificacions de 6 i 7 en el primer exercici i en el segon, respec-tivament, en quin dels dos n’ha aconseguit un resultat millor amb relació a l’actuaciógeneral dels candidats?

Per poder resoldre el problema ens, cal poder comparar les dues puntuacions respectede la resta de candidats. Per això, cal tipificar-les.

En primer lloc, calculem l’esperança i la variància de les variables X1 =nota delscandidats al primer exercici i X2 =nota dels candidats al segon exercici.

µX1= E(X1) =

∫ ∞

−∞x f1(x) dx=

∫ 4

0

x2

20dx+

∫ 10

4

10x−x2

30dx=

143

µX2= E(X2) =

∫ ∞

−∞x f2(x) dx=

∫ 5

0

x2

25dx+

∫ 10

5

10x−x2

25dx= 5

124

Page 122: Llibre estadística

Variables aleatòries

Per al càlcul de les variàncies, recordem el resultat de Steiner: VAR(X) = E(X2)−(E(X))2.

E(X21 ) =

∫ ∞

−∞x2 f1(x) dx=

∫ 4

0

x3

20dx+

∫ 10

4

10x2−x3

30dx= 26

E(X22 ) =

∫ ∞

−∞x2 f2(x) dx=

∫ 5

0

x3

25dx+

∫ 10

5

10x2−x3

25dx=

1756

De manera que

σ2X1

= VAR(X1) = 26−(

143

)2

=389

σ2X2

= VAR(X2) =1756

−52 =256

Finalment, les puntuacions tipificades són

Z1 =6− 14

3√383

≈ 0.64889 Z2 =7−5

5√6

≈ 0.97979

Com que Z2 > Z1, l’opositor ho ha fet millor en el segon exercici.

3.8. Teorema de Txebitxev

SiguiX una variable aleatòria ambE(X) = µ i VAR(X) = σ2, i k> 0. Aleshores,

P(|X−µ|< kσ) = P(µ−kσ < X < µ+kσ)≤ 1− 1k2

,

o, equivalentment,

P(|X−µ| ≥ k)≤ σ2

k2

3.6Per a qualsevoldistribució, làreaombrejada és inferior a

1 _ 1k2

µ−kσ µ+kσ

A≤ 1− 1k2

125

Page 123: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

s2

k2

3.7Representació equivalent

del teorema deTxebitxev: l’àrea de la

regió ombrejada ésinferior a

µ−k µ+k

A≤ σ2

k2

Demostració. SiguiA= |X−E(X)| ≥ k. Considerem la variable

Y = (X−E(X))2 = (X−E(X))2 ·1A(X)+(X−E(X))2 ·1A(X)

on1A és la funció indicadora del conjuntA, és a dir,1A(x) = 1, six∈ A, i zero altrament,i 1A la funció indicadora del conjuntA.

Aleshores,

VAR(X) = E(Y) = E(Y ·1A(X)+Y ·1A(X)) = E(Y ·1A(X))+E(Y ·1A(X))

≥ E(Y ·1A(X))≥ E(k2 ·1A(X)) = k2 ·P(A) = k2 ·P(|X−E(X)| ≥ k)

En conclusió,

VAR(X)

k2≥ P(|X−E(X)| ≥ k)

Observacions

- El teorema de Txebitxev dóna una aproximació, conservadora iper defecte, de laprobabilitat de trobar un valor de la variable aleatòria dintre de l’interval d’amplitudkσ centrat en la seva mitjana.

- Aquesta imprecisió és deguda al fet que no en coneixem la distribució de probabilitat.- N’hi ha prou de conèixer la mitjana i la desviació tipus per establir una fita inferior

d’aquesta probabilitat.- Observem que, per a qualsevol variable aleatòria, independentment de la distribució

de probabilitat, tenim que

P(µ−2σ < X < µ+2σ)≥ 34

,

P(µ−3σ < X < µ+3σ)≥ 89.

126

Page 124: Llibre estadística

Variables aleatòries

Exemple 3.16Abans de construir un cinema nou, es fa la previsió que el nombre mit-jà de persones que poden assistir en una sessió és de 1.200, amb una desviació tipusde 18 persones. Quina ha de ser la capacitat del cinema per poder assegurar que laprobabilitat que els assistents puguin entrar-hi sigui del 80%?

Sigui X la variable aleatòria que indica el nombre d’assistents que poden entrar al cine-ma i m el nombre de places que es pretén construir. Es vol assegurar que la probabilitatque el nombre d’assistents X sigui superior al nombre de places m sigui, com a molt, de0.2, és a dir,

P(X ≥ m)≤ 0.2.

Si desenvolupem aquesta probabilitat, tenim que

P(X ≥ m) = P(X−µ≥ x−µ)≤ P(X−µ≥ m−µ∪X−µ≤−m+µ)= P(|X−µ| ≥ m−µ)≤ σ2

(m−µ)2 ≤ 0.2.

Aleshores, el valor de m que satisfà aquesta última desigualtat és m= 1241.

3.8Per a resoldre l’exemple3.16, es considera ladesigualtat d’àreesrepresentada en aquestafigura.

m−µm−µ −m+µ

X−µX−µ

3.9. Vectors aleatoris discrets

Anomenemvectors aleatoris discretso variables aleatòries discretes multidimensionalsles funcions

X = (X1,. . . ,Xn) : Ω → Rn

en quèXi és una variable aleatòria discreta per a toti.

Probabilitat conjunta de vectors aleatoris discrets

Siguin X1,. . . ,Xn variables aleatòries discretes. Lafunció de probabilitat compostadeX = (X1,. . . ,Xn) es determina com

fX=(X1,...Xn)(x1,. . . ,xn) = P[X = (x1,. . . ,xn)] = P(X1 = x1,. . . ,Xn = xn)

127

Page 125: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

La funció de probabilitat acumulada deX és defineix de manera anàloga, és a dir,

FX=(X1,...Xn)(x1,. . . ,xn) = P[X ≤ (x1,. . . ,xn)] = P(X1 ≤ x1,. . . ,Xn ≤ xn)

Notem que, si les variables són independents,

P[X = (x1,. . . ,xn)] =n

∏i=1

P[Xi = xi ]

P[X ≤ (x1,. . . ,xn)] =n

∏i=1

P[Xi ≤ xi ]

3.10. Vectors aleatoris continus

Anomenemvectors aleatoris continuso variables aleatòries multidimensionals les fun-cions

X = (X1,. . . ,Xn) : Ω → Rn

en quèXi és una variable aleatòria contínua per a toti.

En aquesta secció, ens centrem en l’estudi de variables bidimensionals, però tot el modelteòric que s’hi exposa es pot aplicar també a variables de dimensió major.

Distribucions de probabilitat conjuntes

Diem que una funcióf : R2 → R és unafunció de densitat conjuntade les variablesaleatòriesX i Y si es compleixen les condicions següents:

1. f (x,y)≥ 0, ∀(x,y)∈ R2.

2.∫ ∞−∞

∫ ∞−∞ f (x,y)dxdy= 1.

3. P((X,Y) ∈ A) =∫ ∫

A f (x,y)dxdy.

3.9La funció de densitat

conjunta d’una variablealeatòria bidimensional

és una superfície enl’espai, de volum unitari.

f (x,y)

128

Page 126: Llibre estadística

Variables aleatòries

3.10La probabilitat que lavariable aleatòriabidimensional ( , )pertanyi a la regió(esquerra) és calculacom el volum sota lasuperfície delimitada peraquesta regió (centre). Ala dreta es pot veureaquest volum ampliat.

X YA

A

f (x,y)

P((X,Y) ∈ A)

Distribucions marginals

Les funcions de densitat de les variables aleatòriesX i Y considerades individualments’anomenendistribucions marginalsi es defineixen a partir de la seva funció de densitatconjunta, de la manera següent:

fX(x) =

∫ ∞

−∞f (x,y)dy

fY(y) =

∫ ∞

−∞f (x,y)dx

Si X i Y són independents,fX,Y(x,y) = fX(x) fY(y).

3.11La funció de densitatmarginal fX avaluada enel punt es calcula comxl'àrea sota la corba de lafunció real de variablereal ( , ) (si és fix,f x y xaquesta és una funcióunidimensional), per a toty \in(- ,+\infty)$ Deforma simètrica es potcalcular la funció dedensitat marginal fY.

.,

x

fX(x) =∫ ∞

−∞f (x,y)dy

y

fY(y) =∫ ∞

−∞f (x,y)dx

Exemple 3.17Siguin X i Y dues variables que mesuren un determinat tipus d’error, enmm, en la determinació de les coordenades d’un punt, la distribució de probabilitat deles quals està descrita conjuntament per la funció de densitat següent:

f (x,y) =

25(2x+3y), 0≤ x≤ 1, 0≤ y≤ 1

0, 0> x> 1, 0> y> 1.

1. Comproveu que f defineix una densitat.

2. Quina és la probabilitat que0< X < 12

i 14<Y < 1

2?

3. Calculeu-ne les distribucions marginals.

129

Page 127: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Per tal de comprovar que la funció f defineix una densitat, cal veure que la seva integraldoble val 1. És a dir,

∫ ∞

−∞

∫ ∞

−∞f (x,y)dxdy=

∫ 1

0

∫ 1

0

25(2x+3y)dxdy=

∫ 1

0

25

(2x+

32

)dx=

25

(1+3

32

)= 1

Per la definició de la funció de densitat conjunta,

P

(0< X <

12

,14<Y <

12

)=∫ 1

2

0

∫ 12

14

25(2x+3y) dxdy

=25

∫ 12

0

(x2+

932

)dx=

25

1362

=13160

3.12Funció de densitat de

l’exemple 3.17 i càlcul dela probabilitat

P(0 < X < , < Y < )

f (x,y)

regió[0,0.5]× [0.25,0.5] P(0< X < 1

2 , 14 <Y < 1

2

)

Finalment, les distribucions marginals són

fX(x) =

∫ 1

0

25(2x+3y) dy=

25

(2x+

32

), 0< x< 1

0, altrament

fY(y) =

∫ 1

0

25(2x+3y) dx=

25(3y+1), 0< y< 1

0, altrament

Funcio de distribucio conjunta

La funció de distribució conjuntade les variablesX i Y es defineix com a

F(x,y) =P(X ≤ x,Y ≤ y) =∫ x

−∞

∫ y

−∞f (s,t)dt ds,

i les funcions de distribució marginals, com a

FX(x) = P(X ≤ x) = P(X ≤ x,Y ≤ ∞) = F(x,∞)

FY(y) =P(Y ≤ y) =P(X ≤ ∞,Y ≤ y) =F(∞,y).

130

Page 128: Llibre estadística

Variables aleatòries

3.13El valor de la funció dedistribució conjunta enel punt ( , ) és igual alvolum acumulat delimitatper la superfície

= ( , ) de la funcióde densitat i la regió

.

Fx y

z f x y

x y( () ), ,

f (x,y)

(x,y)

(x,y)

volum =F(x,y)

volum =F(x,y)

Propietats de la funcio de distribucio conjunta

(i) 0 ≤ F(x,y)≤ 1, per a tot(x,y)∈ R2.

(ii) F és monòtona creixent en cada variable.

(iii) limx→ ∞,y→ ∞

F(x,y) =1.

(iv) limx→−∞

F(x,y) =0, per a toty∈ R.

(v) limy→−∞

F(x,y) =0, per a totx∈ R.

(vi) limx→∞

F(x,y) =FY(y), per a toty∈ R.

(vii) limy→∞

F(x,y) =FX(x), per a totx∈ R.

(vii) F és contínua per la dreta en cada variable.

(ix) f (x,y) =∂ 2

∂x∂yF(x,y).

131

Page 129: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.14Funció de densitat

conjunta ( , )(esquerra) i funció de

distribució conjunta( , ) (dreta).

f x y

F x y f (x,y)

(a,b)(a,b)

F(x,y)

F(a,b)

1

3.11. Transformacions de variables

Donades unes determinades variables aleatòries, sovint ens interessa conèixer el com-portament de la seva suma, el seu producte o d’altres funcions matemàtiques construïdesa partir d’elles. Quan aquestes variables són regulars, en el sentit que tenen una funció dedensitat que compleix les propietats que s’han vist a la secció anterior, i la transformacióés diferenciable i bijectiva, es pot conèixer de manera molt senzilla la seva llei.

Sigui X = (X1,. . .Xn) un vector aleatori iΦ = (φ1,. . . ,φn) : Rn → Rn una funció dife-renciable i bijectiva; aleshores, la llei del vectorY = Φ(X) és

fY(y1,. . . ,yn) = fX(s1(y1,. . . ,yn),. . .sn(y1,. . . ,yn)) · |J(s1,. . . ,sn)|

on Φ−1 = (s1,. . . ,sn) i |J(s1,. . . ,sn)| és el jacobià.

Exemple 3.18Donades dues variables X i Y de les quals es coneix la funció de densitatconjunta f(X,Y), es vol conèixer la distribució que segueixen les variablesU=X+Y i V=X−Y. Per fer-ho, considerem la funcióΦ(X,Y) = (X+Y,X−Y)≡ (U ,V). Aleshores,Φ−1(U ,V) = (U+V

2, U−V

2). El jacobià del canvi invers és

|JΦ−1|= det

12

12

12

−12

= 1

2 .

De manera que f(U ,V)(u,v) = f(X,Y)(u+v

2, u−v

2) · 1

2. Finalment, només cal trobar les distribu-

cions marginals de U i de V per tal de determinar les densitats de X+Y i de X−Y.

Variables aleatories estadısticament independents

Es diu que dues variables aleatòriesX i Y, amb funció de densitat conjuntaf (x,y) ifuncions de densitat marginalsfX(x) i fY(y), respectivament, sónestadísticament inde-pendentsquan es compleix

132

Page 130: Llibre estadística

Variables aleatòries

f (x,y)= fX(x) fY(y),

per a tot(x,y) del domini de definició def .

Observació 3.16Es pot donar una definició equivalent a partir de la funció de distribu-ció segons la qual Xi Y són independents si

F(x,y) =FX(x)FY(y).

és a dir, si

P(X ≤ x,Y ≤ y) =P(X ≤ x) ·P(Y ≤ y).

Exemple 3.19Siguin X i Y dues variables que mesuren un determinat tipus d’error, enmm, en la determinació de les coordenades d’un punt, la distribució de probabilitat deles quals està descrita conjuntament per la funció de densitat següent:

f (x,y) =

43(x+xy), 0≤ x≤ 1, 0≤ y≤ 1

0, 0> x> 1, 0> y> 1.

Són independents les variables X i Y?

Calculem les funcions de densitat marginals:

fX(x) =∫ 1

0

43(x+xy) dy=

43· 3x

2= 2x, 0< x< 1

fY(y) =∫ 1

0

43(x+xy) dx=

43· (1+y)

2=

2(1+y)3

, 0< y< 1

Com que f(x) · f (y) = 43(x+ xy) = f (x,y), per a tot(x,y)∈ R2 les variables són inde-

pendents.

Caracterıstiques d’una variable aleatoria bidimensional

Donada una variable aleatòria bidimensional(X,Y), podem definir una sèrie de caracte-rístiques que en resumeixen la distribució conjunta.

Si g(X,Y) és una variable aleatòria unidimensional, la sevaesperançaés

E[g(X,Y)] =∫ ∞

−∞

∫ ∞

−∞g(x,y) · f(X,Y)(x,y)dx dy.

S’anomena moment centrat respecte de l’origen d’ordrer enX i d’ordresenY, omomentno central, la quantitat

αr,s = E(Xr ·Ys).

S’anomena moment centrat respecte de les mitjanes d’ordrer en X i d’ordre s enY, omoment central, la quantitat

µr,s = E[(X−µX)r · (Y−µY)

s].

133

Page 131: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Covariancia de variables

És especialment interessant el moment

µ1,1 = E[(X−µX) · (Y−µY)],

anomenatcovariància, que designem també com aσXY,µXY o com aCov(X,Y).

Per les propietats de l’esperança, tenim que

Cov(X,Y) =∫ ∞

−∞

∫ ∞

−∞(x−µX) · (y−µY) · f(X,Y)(x,y)dx dy.

Propietats de la covariancia

(i) Cov(X,Y) =Cov(Y,X).

(ii) Cov(X,X) =VAR(X).

(iii) Cov(X,Y) = E(X ·Y)−E(X) ·E(Y).(iv) Cov(a·X+b,c·Y+d) = a·c·Cov(X,Y).

(v) Si X i Y són dues variables aleatòries independents,Cov(X,Y) = 0.

(vi) VAR(X+Y) =VAR(X)+VAR(Y)+2Cov(X,Y).

(vii) Si X i Y són variables aleatòries independents,VAR(X+Y) =VAR(X)+VAR(Y).

Demostració

(i) Cov(X,Y) =

∫ ∞

−∞

∫ ∞

−∞(x−µX) · (y−µY) · f(X,Y)(x,y)dx dy

=

∫ ∞

−∞

∫ ∞

−∞(y−µY) · (x−µX) · f(X,Y)(x,y)dx dy

= Cov(Y,X)

(ii) Cov(X,X) = E[(X−E(X)) · (X−E(X))] = E[(X−E(X))2] =VAR(X).

(iii) Cov(X,Y) = E((X−E(X))(Y−E(Y))) = E(XY−XE(Y)−E(X)Y+E(X)E(Y))

= E(X ·Y)−E(X) ·E(Y).

(iv) Cov(a·X+b,c·Y+d) = E[(a·X+b−E(a·X+b)) · (c·Y+d−E(c·Y+d))]

= E[a· (X−E(X)) ·c· (Y−E(Y))] = a·c·Cov(X,Y).

(v) Vegem, primer, que l’esperança del producte és el producte d’esperances, és a dir,E(XY) = E(X)E(Y). Considerem la funcióΦ(X,Y) = (XY,Y) ≡ (U ,V). Alesho-res,Φ−1(U ,V) = (U

V,V). El jacobià de l’invers del canvi és| 1

V|. Bo i atenent les

característiques d’aquesta transformació i la independència deX i Y, tenim que

f(U ,V)(u,v) = f(X,Y)

(uv

,v)· 1

v= fX

(uv

)· fY(v)

1v

134

Page 132: Llibre estadística

Variables aleatòries

(iii) La densitat marginal deU és

fU(u) =∫

R

fX

(uv

)· fY(v)

1v

dv

I la seva esperança és

E(U) =∫

R

R

fX

(uv

)· fY(v)

uv

dudv

Fent el canvi de variable(a,b) =(u

v,v)

que té per jacobiàb, obtenim que

E(U) =∫

R

R

fX(a) · fY(b) ·a·b dadb=∫

R

fX(a) ·a da·∫

R

fY(b) ·b db=E(X) ·E(Y)

Aleshores,Cov(X,Y) = E(XY)−E(X)E(Y) = E(X)E(Y)−E(X)E(Y) = 0.

Les demostracions de les altres propietats es deixen com a exercici per al lector.

Interpretacio de la covariancia

La covariància indica la presència o no d’una relació lineal entre les variables. Aixòvol dir que, si dues variables presenten una relació no lineal, per exemple quadràtica, lacovariància podria ser nul·la.

- Si la covariància és positiva o negativa, es diu que les dues variables estan correlacio-nades positivament o negativament, respectivament.

- Si la covariància és nul·la, es diu que les dues variables no estan correlacionades.

Calculant la covariància, podem dir si dues variables estan correlacionades o no, però permesurar el grau de correlació és necessari un paràmetre adimensional que no depenguide les unitats que s’utilitzin.

El coeficient de correlacióes defineix com la covariància de les dues variables normalit-zades en el sentit següent:

ρXY = E

[(X−µX

σX

)(Y−µY

σY

)].

Observació 3.17El coeficient de correlació es pot escriure també com a

ρXY =σXY

σXσY

, |ρXY| ≤ 1.

Problemes resolts (variables aleatories discretes)

Problema 3.1 Quin és el recorregut o conjunt de valors que poden prendre les variablesaleatòries següents:

(a) X = “nombre de cares obtingudes en llançar cinc monedes a l’aire”

135

Page 133: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) X = “nombre de vegades que s’ha de llançar un dau fins a obtenir-ne un resultat parell”(c) X = “nombre de persones amb ulleres d’un grup de30persones”

Solucio

(a) Per al primer apartat, veiem que llançant cinc monedes a l’aire pot ser que enssurti una cara, dues, tres, quatre, cinc o cap, de manera que el recorregut ésX(Ω) = 0,1,2,3,4,5.

(b) Observem que, a priori, no podem assegurar que ens surti cap resultat parell ambun nombre finit de tirades, és a dir, es podria donar el cas quemai no sortís parell.Per això, el recorregut és el conjunt dels nombres naturalsN.

(c) Finalment, la tercera variable aleatòria té per recorregut els enters de 0 a 30. Pot serque no hi hagi cap persona amb ulleres, que n’hi hagi dues, tres, etc.

Problema 3.2 La funció de probabilitat d’una variable aleatòria X és

f (x) =

2p, x = 1

p, x = 2

4p, x = 3

0, altrament

on p és una constant.

(a) Determineu p.

(b) Calculeu P(0≤ X < 3) i P(X > 1).

Solucio

(a) Per tal de determinarp, cal recordar que una variable aleatòria discreta ha de satisferque

∑k∈X(Ω)

P(X = k) = 1.

En el nostre cas, això significa que

P(X = 1)+P(X = 2)+P(X = 3) = f (1)+ f (2)+ f (3) = 2p+ p+4p= 7p

== 1⇒ p=17.

(b) Un cop coneguda la distribució, podem calcular ara les probabilitats que es dema-nen. Tenim que

P(0≤ X < 3) = P(X = 1)+P(X = 2) =37

P(X > 1) = P(X = 2)+P(X = 3) =57

136

Page 134: Llibre estadística

Variables aleatòries

Problema 3.3 Considereu l’experiment aleatori de llançar un dau trucat de sis cares,on les probabilitats puntuals vénen donades per

P(X = 1) = p1 = 0.10

P(X = 2) = p2 = 0.20

P(X = 3) = p3 = 0.30

P(X = 4) = p4 = 0.10

P(X = 5) = p5 = 0.25

P(X = 6) = p6 = 0.05

Calculeu P(X ≤ 1.5) , P(X ≥ 4), P(X > 5), P(3 < X ≤ 6), P(2 ≤ X < 4), P(X = 5),P(X ≤ 6).

Solucio

Tenint en compte les dades del problema, tenim que

P(X ≤ 1.5) = P(X = 1) = p1 = 0.1

P(X ≥ 4) = p4+ p5+ p6 = 0.4

P(X > 5) = p6 = 0.05

P(3< X ≤ 6) = p4+ p5+ p6 = 0.4

P(2≤ X < 4) = p2+ p3 = 0.5

P(X = 5) = p5 = 0.25

P(X ≤ 6) = 1

3.15Funció de probabilitat dela variable aleatòriadiscreta del problema 3.3.

1 2 3 4 5 6

0.05

0.10

0.15

0.20

0.25

0.30

xi

p(X=

x i)

Problema 3.4 Considereu l’experiment de llançar un dau de deu cares. Suposeu que eldau no està trucat, és a dir, que els resultats són equiprobables. Si denotem per X elresultat de la tirada i per P la probabilitat, calculeu:

137

Page 135: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) La probabilitat que ens surti un 3, la probabilitat que enssurti un 6 i la probabilitat,en general, que ens surti un número i, és a dir, P(X = 3),P(X = 6),P(X = i).

(b) La probabilitat que ens surti un número inferior o igual a 2, la probabilitat queens surti un número inferior o igual a 5 i la probabilitat que ens surti un númeroinferior o igual a i, és a dir, P(X ≤ 2),P(X ≤ 5),P(X ≤ i).

Solucio

(a) Atès que els resultats són equiprobables, tenim queP(X = i) = pi =110

per a

i = 1,2. . .10. Aleshores,

p3 = p6 = pi =110

, i = 1,2,. . . ,10.

(b) P(X ≤ 2) = p1+ p2 =210

P(X ≤ 5) = p1+ p2+ p3+ p4+ p5 =12

P(X ≤ i) =i

∑n=1

pn =i

∑n=1

110

=i

10

Problema 3.5 Considereu l’experiment de llançar un dau de sis cares fins que surt un1. Denotem per X el nombre de vegades que hem hagut de llançar el dau. És a dir, X= 6vol dir que hem hagut de llançar el dau sis vegades i, per tant, ens han sortit primer cincnombres diferents d’1i, a la sisena, ens ha sortit un1. Calculeu:

(a) La probabilitat d’haver de tirar una vegada i la probabilitat d’haver de tirar cincvegades.

(b) La probabilitat d’haver de tirar i vegades.

3.16Funció de probabilitat de

la variable aleatòriadiscreta del problema 3.5.

0 10 20 30 40

0.00

0.05

0.10

0.15

xi

p(X=

x i)

138

Page 136: Llibre estadística

Variables aleatòries

Solucio

(a) La probabilitatP(X = 1) equival a dir que surti un 1 a la primera tirada. Com queel dau no està trucat, assumim que cada resultat és equiprobable, de manera queP(X = 1) = 1

6.

Per calcularP(X = 5), observem que l’esdeveniment significa que han sortit quatrenombres diferents de 1 i un 1. Com que la probabilitat que surti un nombre diferentde 1 és5

6, obtenim que

P(X = 5) =56· 56· 56· 56· 16=

(56

)4

· 16≈ 0.080376.

(b) Per l’apartat anterior, deduïm que

P(X = i) =

(56

)i−1

· 16

, i = 1,2,3,. . . ,

és a dir, la probabilitat que surtini −1 nombres diferents de 1 seguits i un 1 en lai-èsima tirada.

Les variables aleatòries que segueixen una distribució d’aquest estil s’anomenenva-riables geomètriques.

Problema 3.6 Considereu ara el joc de la ruleta. Suposem que hi ha deu caselles verme-lles, deu caselles negres i la casella blanca. Fem cinc apostes en total, i sempre apostema les vermelles, és a dir, en deu casos guanyarem i en11 perdrem. Ens interessa sa-ber quantes vegades en aquestes cinc apostes ha sortit vermell; per tant, denotem X elnombre de vegades que ha sortit vermell.

(a) Calculeu la probabilitat que en les cinc apostes només hagi sortit una vegada ver-mell, és a dir, P(X = 1).

(b) Calculeu la probabilitat que en les cinc apostes només haguem perdut una vegada,és a dir, que n’hagin sortit quatre de vermelles.

3.17Diagrama d'arbreassociat al problema 3.6.

10/21

11/21

11/21

10/21

11/21

11/21

11/21

10/21

10/21

10/21

11/21 11/21

11/21

11/2111/2111/21

11/21 11/21 11/21

$

$

$

$

$

$ $ $ $

$ $ $$$$

$

$ $

$

139

Page 137: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(c) Calculeu les probabilitats dels casos que queden:

P(X = 0),P(X = 2),P(X = 3),P(X = 5).

(d) Deduïu la fórmula general per a P(X = i).

Solucio

(a) Observem que el joc és una experiència dicotòmica, en el sentit que podem guanyaro perdre. La probabilitat de guanyar és que surti vermell:p = 10

21, i la de perdre,

q= 1121

. La probabilitat de guanyar una sola vegada és la suma de les probabilitats deguanyar la primera i perdre les altres, guanyar la segona i perdre les altres, guanyarla tercera i perdre les altres, i així fins a la cinquena. És a dir,

P(X = 1) =1021

·(

1121

)4

+1121

· 1021

·(

1121

)3

+ · · ·+(

1121

)4

· 1021

= 5·(

1121

)4

· 1021

≈ 0.179243

(b) Per al càlculP(X = 4), podem aprofitar l’apartat anterior, en el sentit que aquestaprobabilitat equival a la de fer només un error. Per tant, si canviem la probabilitatd’encert per la d’error, la manera de procedir és la mateixa. Així doncs, n’obtenim

P(X = 4) = 5·(

1121

)·(

1021

)4

≈ 0.134668

(c, d) Per a resoldre la resta de casos, en deduïm primer la fórmula general. A l’apartat(a) hem comentat que la variable modelitza una experiència dicotòmica. De ma-nera queP(X = i) es pot calcular a partir de trobar primer les diferents formes

3.18Funció de probabilitat de

la variable aleatòriadiscreta del problema 3.6.

0 1 2 3 4 5

0.05

0.10

0.15

0.20

0.25

0.30

xi

p(X=

x i)

140

Page 138: Llibre estadística

Variables aleatòries

(a) d’escollir elsi encerts sobre les 5 tirades, i multiplicar-les per la probabilitat quetenen d’esdevenir (que en totes serà la mateixa). És a dir,

P(X = i) =

(5i

)·(

1021

)i

·(

1121

)5−i

, i = 1,2,3,4,5.

Aleshores,

P(X = 0) ≈ 0.039434P(X = 2) ≈ 0.325898P(X = 3) ≈ 0.296271P(X = 5) ≈ 0.024485

Les variables aleatòries que segueixen una distribució d’aquest estil s’anomenenvaria-bles binomials.

Problema 3.7 En un examen tipus test de deu preguntes, cada pregunta té cinc respos-tes possibles i s’ha de marcar una resposta obligatòriament. Cada resposta encertadaval 1 punt i cada resposta incorrecta resta0.5 punts. Deu alumnes es posen d’acord arespondre a l’atzar totes les preguntes. Quina és la probabilitat que almenys un d’ellsaprovi?

Solucio

SiguiA= “almenys un alumne aprova”. Observem que el complementari deA és l’esde-venimentAc = “cap alumne no aprova”. Per les propietats de la probabilitat, tenim queP(A) = 1−P(Ac), de manera que el problema es pot resoldre calculantP(Ac).

Per trobar la probabilitat que cap no aprovi, ens cal conèixer la probabilitat de no aprovar.Com que respondre és obligatori, un alumne suspèn si i només si falla quatre pregunteso més. Denotant perX la variable aleatòria que compta el nombre d’errades en el test,

P(suspendre) = 1−P(aprovar) = 1− [P(X = 0)+P(X = 1)+P(X = 2)+P(X = 3)]

= 1−3

∑n=0

(10n

)·(

45

)n

·(

15

)10−n

= 0.999135

Finalment,

P(A) = 1−P(Ac) = 1− (0.999135)10 = 0.008614.

Problema 3.8 Una variable aleatòria pren els valors−3,−2,−1,0,1,2,3, i la funció dedistribució de probabilitats és

f (x) = k · (2.5)x

per a aquests valors.

141

Page 139: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Quin és el valor de k?

(b) Trobeu E(X) i VAR(X).

(c) Calculeu P(0≤ X ≤ 2).

Solucio

(a) Sabent que el recorregut de la variable és

X(Ω) = −3,−2,−1,0,1,2,3

el valor dek ha de ser tal que

P(X ∈ X(Ω)) = ∑i∈X(Ω)

P(X = i)

= P(X =−3)+P(X =−2)+P(X =−1)+P(X = 0)+

+P(X = 1)+P(X = 2)+P(X = 3)

= k ·2.5−3+k ·2.5−2+k ·2.5−1+k ·2.50+

+k ·2.51+k ·2.52+k ·2.53 = 1

Per tant,k=1

2.5−3+2.5−2+2.5−1+2.50+2.51+2.52+2.53≈ 0.038463

(b) E(X) =3

∑n=−3

n·P(X = n) =3

∑n=−3

n·0.038463·2.5n = 2.344819

Per a la variància, recordem que, pel resultat de Steiner, tenim que

VAR(X) = E(X2)− [E(X)]2.

Aleshores,

VAR(X) =3

∑n=−3

(n2 ·P(X = n))−2.3448192 = 1.03058

(c) P(0≤ X ≤ 2) = P(X = 0)+P(X = 1)+P(X = 2) = 0.375014.

Problema 3.9 Una variable aleatòria X pren el valor1 amb probabilitat p i el valor0amb probabilitat q= 1− p. Vegeu que

(a) E(X) = p

(b) VAR(X) = pq

Nota: Aquesta variable es pot utilitzar, per exemple, com a indicadora d’undeterminat esdeveniment. Es pot pensar que la variable prendrà valor1 si elresultat de l’experiència ésèxit i 0 si ésfracàs. La distribució de probabilitatd’aquesta variable es diu distribució de Bernoulli.

142

Page 140: Llibre estadística

Variables aleatòries

Solucio

(a) E(X) = P(X = 1) ·1+P(X = 0) ·0= P(X = 1) = p.

(b) VAR(X) = E(X2)− [E(X)]2 = P(X = 1) ·12+P(X = 0) ·02− p2 = p− p2

= p(1− p) = pq

Problema 3.10 Sigui X una variable aleatòria discreta amb funció de probabilitat

P[X = k] = αk, k= 1,2,3,4,5.

(a) Determineu el valor deα perquè P sigui efectivament una funció de probabilitat.

(b) Determineu l’esperança i la variància de la variable X.

Solucio

(a) Perquèf sigui una funció de probabilitat, cal queP(X ∈1,2,3,4,5)= 1. En efecte,

P(X ∈ 1,2,3,4,5) = P(X = 1)+P(X = 2)+P(X = 3)+P(X = 4)+P(X = 5)

= 15α= 1

En conseqüència,α=115

.

3.19Funció de distribució de lavariable aleatòria discretadel problema 3.10.

1 2 3 4 5

0.10

0.15

0.20

0.25

0.30

xi

p(X=

x i)

(b) Aplicant les definicions deE(X) i VAR(X) obtenim:

E(X) =5

∑k=1

kP(X = k) =5

∑k=1

k · k15

=113

VAR(X) =5

∑k=1

(k−E(X))2 P(X = k) =

5

∑k=1

(k− 11

3

)2 k15

=149

143

Page 141: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 3.11 Es fa un examen de tipus test de deu preguntes, en què les respostespoden ser cert o fals. Sigui X la variable aleatòria discreta que compta el nombre depreguntes encertades. Determineu la funció de probabilitat de X. És a dir, per cadavalor k que pot prendre la variable, determineu P(X = k).

Solucio

Observeu que aquesta distribució segueix un model binomial (vegeu el problema 3.6),amb la probabilitat d’èxitp= 1

2–d’encertar la pregunta. Aleshores,

P(X = k) =

(10k

)(12

)k(12

)10−k

=

(10k

)(12

)10

, k= 0,1,. . . ,10.

3.20Funció de distribució de lavariable aleatòria discreta

del problema 3.11.

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

0.25

xi

p(X=

x i)

Problema 3.12 Sigui X una variable aleatòria discreta amb funció de probabilitat

P(X = k) = p(1− p)k−1, k= 1,2,. . . , 0< p< 1.

(a) Comproveu que realment és una funció de probabilitat.

(b) Calculeu l’esperança de la variable aleatòria.

Ajuda: La suma d’una progressió geomètrica és∞∑i=0

ai = 11−a

; per sumar∞∑i=1

iai−1,

fixeu-vos en l’expressió que queda en derivar∞∑i=0

ai respecte de a.

Solucio

(a) Per veure que és funció de probabilitat, comprovem queP(X ∈ N) = 1. En efecte,

144

Page 142: Llibre estadística

Variables aleatòries

P(X ∈ N) =∞

∑k=1

p(1− p)k−1

= p∞

∑k=1

(1− p)k−1

= p∞

∑j=0

(1− p) j (fent el canvi,j = k−1)

= p· 11− (1− p)

= 1

(b) Per la definició d’esperança, tenim que

E(X) =∞

∑k=1

kp(1− p)k−1 = p∞

∑k=1

k(1− p)k−1.

Per tant, només ens cal calcular

∑k=1

k(1− p)k−1.

Com que les sèries geomètriques –convergents– es poden derivar terme a terme,tenim que

∑i=0

ai =1

1−a

Notant(1− p) := a, es té

dda

∑i=0

ai =∞

∑i=1

iai−1 =dda

11−a

=1

(1−a)2

En conclusió,E(X) = p1p2

=1p

.

Problema 3.13 Sigui X una variable aleatòria discreta, E(X) la seva esperança iVAR(X) la variància.

(a) Vegeu que VAR(X) = E(X2)− (E(X))2.(b) Determineu el valor de a que minimitza l’expressió E((X−a)2).(c) Considerem la variable aleatòria Y= aX+b. Vegeu que

E(Y) = aE(X)+BVAR(Y) = a2VAR(Y).

(d) Considerem ara una altra variable aleatòria discreta Z. Vegeu que

E(X+Z) = E(X)+E(Z).

145

Page 143: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

(a) Com queX és una variable aleatòria discreta, tenim que

VAR(X) =N

∑i=1

(xi −E(X))2P(X = xi) =N

∑i=1

(x2i −2xiE(X)+(E(X))2)P(X = xi)

=N

∑i=1

x2i P(X = xi)

︸ ︷︷ ︸E(X2)

−2E(X)N

∑i=1

xiP(X = xi)

︸ ︷︷ ︸E(X)

+(E(X))2N

∑i=1

P(X = xi)

Com queX és variable aleatòria,∑Ni=1 P(X = xi) = 1, de manera que s’obté

VAR(X) = E(X2)−2(E(X))2+(E(X))2 = E(X2)− (E(X))2

(b) Per a minimitzar l’expressióE((X − a)2), imposem que se satisfaci la condiciónecessària de mínim, és a dir, que la derivada respecte dea sigui 0. És a dir,

dda

E((X−a)2) =dda

N

∑i=1

(xi −a)2 P(X = Xi)︸ ︷︷ ︸pi

=−2N

∑i=1

(xi −a)pi = 0

Per tant,

N

∑i=1

(xi −a)pi = 0 ⇔N

∑i=1

xi pi

︸ ︷︷ ︸E(X)

−aN

∑i=1

pi

︸︷︷︸1

= 0 ⇔ a= E(X)

(c) En aquest cas, tenim que

E(Y) = E(aX+b) =N

∑i=1

(axi +b)pi =N

∑i=1

axi pi +N

∑i=1

bpi

= aN

∑i=1

xi pi +b= aE(X)+b

VAR(Y) = E(Y2)− (E(Y))2 =N

∑i=1

(axi +b)2pi − (aE(X)+b)2

Desenvolupant els productes notables,

VAR(Y) = a2N

∑i=1

x2i pi

︸ ︷︷ ︸E(X2)

+2abN

∑i=1

xi pi

︸ ︷︷ ︸E(X)

+b2N

∑i=1

pi

︸︷︷︸1

−a2(E(X))2−2abE(X)−b2

= a2(E(X2)− (E(X))2) = a2VAR(X)

146

Page 144: Llibre estadística

Variables aleatòries

(d) Donada la nova variable discretaZ, siguinzj els valors que pot prendre iqj = P(Z =zj), per a j = 1. . .M. Aleshores,

E(X+Z) =M

∑j=1

N

∑i=1

(xi +zj)piqj =M

∑j=1

qj

N

∑i=1

(xi +zj)pi =M

∑j=1

qj

(N

∑i=1

xi pi +N

∑i=1

zj pi

)

Com que tantX com Z són variables aleatòries, es compleix que∑Ni=1 pi = 1 i

∑Mj=1 qj = 1. Aleshores, de l’expressió anterior, trobem que

E(X+Z) =M

∑j=1

qj(E(X)+zj) = E(x)M

∑j=1

qj +M

∑j=1

zjqj = E(X)+E(Z)

Problema 3.14 Sigui X una variable aleatòria que ens compta el nombre de xuts a por-teria d’un equip abans de fer el primer gol. Suposem que la probabilitat de marcar ungol quan es xuta és p. Calculeu la distribució de X, és a dir, P(X = xk) per a tots elsvalors xk que pot prendre la variable. Comproveu que

E(X) =1− p

pi VAR(X) =

1− pp2

.

Indicació: Deriveu dos cops l’expressió∑∞i=0 ai respecte de a.

Solucio

Observem que la variableX segueix un model geomètric (vegeu el problema 3.5) ambprobabilitat d’encertp. Aleshores, la seva distribució és

P(X = k) = (1− p)kp, k= 0,1,2,. . .

I la seva esperança és

E(X) =∞

∑k=0

k(1− p)kp= p(1− p)∞

∑k=1

k(1− p)k−1 = p(1− p)1

(1− (1− p))2=

1− pp

on hem utilitzat la fórmula de sumes geomètriques del problema 3.12.

Pel que fa a la variància, observem primer que

d2

da2

∑i=0

ai =∞

∑i=2

i(i −1)ai−2 =2

(1−a)3

En segon lloc, veiem que

E(X2) = E(X2−X+X) =∞

∑k=0

(k2−k+k)(1− p)kp

= p(1− p)2

[ ∞

∑k=2

k(k−1)(1− p)k−2+∞

∑k=2

k(1− p)

]=

2p(1− p)2

p3+

1− pp

147

Page 145: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Finalment,

VAR(X) = E(X2)− (E(X))2

=2(1− p)2

p2+

1− pp

− (1− p)2

p2

=2(1−2p+ p2)+ p− p2−1+2p− p2

p2

=1− p

p2

3.21Funció de probabilitat de la

variable aleatòria discretadel problema 3.14.

0 10 20 30 40

0.00

0.02

0.04

0.06

0.08

0.10

xi

p(X=

x i)

Problema 3.15 En un concurs de triples, cal comptar els triples que fa cada partici-pant. Suposem que un participant ha fet n llançaments. Sigui Y la variable aleatòriaque ens compta el nombre de triples que ha encertat. Suposem, a més, que la proba-bilitat d’encertar un triple és p. Calculeu la distribució de Y, és a dir, P(Y = yk), icomproveu que E(Y) = np i VAR(Y) = np(1− p).

Solucio

Atès que el recorregut deY és0,1. . .n, per calcular-ne la funció de distribució caltrobar les probabilitatsP(Y = k) per ak= 0,1. . .n. Encertar o no un triple és una expe-riència dicotòmica, de manera que la varibaleY compta el nombre d’encerts després den repeticions de l’experiència. Per tant,Y segueix un model binomial (vegeu el problema3.6). La seva distribució és

P(Y = k) =

(nk

)pk(1− p)n−k, k= 0,1,. . . ,n.

148

Page 146: Llibre estadística

Variables aleatòries

Per al càlcul de l’esperança i de la variància, suposem primerque tenim un sol tir. Ales-hores, la variable és de tipus Bernoulli,Bi, la seva esperança ésp i la variància,p(1− p).Quan tenimn llançaments, com que són independents (la probabilitat d’encertar no estàcondicionada a haver encertat o fallat el llançament anterior i, per això, sempre ésp),la variableY es pot entendre com la suma den variables aleatòries que segueixen unadistribució de Bernoulli. De manera que, com que l’esperança és un operador lineal,

E(Y) = E(B1+ . . .+Bn) = E(B1)+ . . .+E(Bn) = np

i, com que les variables són independents,

VAR(Y) =VAR(B1+ · · ·+Bn) =VAR(B1)+ · · ·+VAR(Bn) = np(1− p).

Problemes resolts (variables aleatories contınues)

Problema 3.16 Sigui X una variable aleatòria amb funció de densitat

f (x) =

x, 0≤ x< 12−x, 1≤ x< 20, altrament

(a) Calculeu-ne la funció de distribució.

(b) Calculeu-ne l’esperança E(X).

Solucio

Sigui f (x) la funció de densitat.

(a) En calculem la funció de distribució. Six< 0, f (x) = 0, aleshores

F(x) =∫ x

−∞f (t)dt = 0.

Si 0≤ x< 1, aleshores

F(x) =∫ x

−∞f (t)dt =

∫ 0

−∞f (t)dt+

∫ x

0f (t)dt =

∫ x

0tdt =

[t2

2

]x

0

=x2

2.

Si 1 ≤ x< 2, aleshores

F(x) = F(1)+∫ x

1f (t)dt =

12+∫ x

1(2− t)dt =

12+

[2t − t2

2

]x

1

=−x2

2+2x−1.

Finalment, six> 2, aleshores

F(x) = F(2)+∫ x

2f (t)dt = F(2) = 1.

149

Page 147: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.22Funció de densitat delproblema 3.16. Es pot

comprovar que, enefecte, l'àrea sota la

corba és igual a 1.

xx

x

xx

f (x)

A= 12x2

1/21/21/2

A= 12 +

12(x−1)(2−x)

2−x

A= 1

En resum, la funció de distribució és

F(x) =

0, x< 0x2

2, 0≤ x< 1

− x2

2+2x−1, 1≤ x< 2

1, x> 2

(b) Aplicant la fórmula de l’esperança, tenim que

E(X) =

∫ +∞

−∞x f(x)dx=

∫ 1

0x f(x)dx+

∫ 2

1x f(x)dx=

∫ 1

0x·xdx+

∫ 2

1x(2−x)dx= 1.

Problema 3.17 La funció de densitat d’una variable aleatòria X és

f (x) =

ax2+b, si x∈ (0,2)0, altrament

Determineu a i b sabent que P(

12≤ X ≤ 1

)= 0.1357.

Solucio

En primer lloc, recordem que, per serf (x) una funció de densitat, ha de complir que

R

f (x)dx=∫ 2

0f (x)dx=

∫ 2

0

(ax2+b

)dx= 1.

Aleshores,

∫ 2

0

(ax2+b

)dx= 1 ⇐⇒

[ax3

3+bx

]2

0

= 1 ⇐⇒ a· 23

3+2b= 1

En segon lloc, i tenint en compte la informació de l’enunciat, tenim que

P

(12≤ X ≤ 1

)=

∫ 1

0.5

(ax2+b

)dx= a· 7

24+b· 1

2= 0.1357

150

Page 148: Llibre estadística

Variables aleatòries

3.23La probabilitat que lavariable es trobi entreXels punts x1 i x2 és l'àreadelimitada per la funcióde densitat f ( )x entreaquests punts(problema 3.17.

x1 x2 2

f (x) = ax2+b

Finalment, només resta resoldre el sistema d’equacions

a· 23

3+2b = 1

a· 724+b· 2

3= 0.1357

per obtenira= 0.330921 ib= 0.058772.

Problema 3.18 La variable aleatòria X té, com a funció de densitat,

f (x) =

ce−3x, si x> 00, altrament

Trobeu c i la funció de distribució de X.

Solucio

Per trobarc, fem com a l’exercici anterior:∫

R

f (x)dx =∫ ∞

0ce−3xdx

= limb→+∞

∫ b

0ce−3xdx

= limb→+∞

[−13

ce−3x

]b

0

= limb→+∞

(−13

ce−3b+13

c

)=

13

c= 1

151

Page 149: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.24Representació gràfica dela funció de densitat f ( )x ide la funció de distribució

F x( ) del problema 3.18.Observeu com ( )F x

tendeix al valor 1.

1

f (x)

F(x)

Això implica quec= 3.

La funció de distribucióF(x) es defineix comF(x) = P(X ≤ x). Per tant,

F(x) =∫ x

−∞f (s)ds=

∫ x

03e−3sds= 1−e−3x, x> 0.

Problema 3.19 El percentatge d’additiu en un tipus de benzina és una variable aelatò-ria X, amb una funció de densitat f(x) = 20x3(1−x), per a0≤ x≤ 10, i 0 a la resta devalors.

(a) Trobeu el percentatge mitjà d’additiu.(b) Si el benefici ve donat per B= 18+3X, trobeu E(B).

Solucio

(a) Trobar el percentatge mitjà equival a buscar el valoresperat, és a dir, a calcular-nel’esperança. De manera que

E(X) =∫ +∞

−∞x f(x)dx=

∫ 1

0x ·20x3(1−x)dx=

23.

(b) Per les propietats de linealitat de l’esperança –recordem que és un operador linealen el conjunt de variables aleatòries, és a dir,

E(λX) = λE(X),

E(X+Y) = E(X)+E(Y),

152

Page 150: Llibre estadística

Variables aleatòries

3.25Funció de densitat de lavariable aleatòria contínuadel problema 3.19 iubicació de la sevaesperança ( ).E X

E(x)

f (x)

(b) aleshores

E(B) = E(18+3X) = E(18)+E(3X) = 18+3E(X) = 20.

Problema 3.20 Considerem una variable aleatòria X, que té per funció de densitat:

f (x) =

k, si a≤ x≤ b

0, altrament

(a) Determineu k, de manera que f sigui realment una funció de densitat, i calculeu lafunció de distribució de X.

(b) Suposeu que a= 2 i b = 6. Calculeu P(X ≤ 1), P(X ≤ 3), P(X = 4), P(3≤ X < 5)i P(X ≥ 3).

Solucio

(a) Tal com hem vist en exercicis anteriors, la condició que la funcióf (x) sigui unadensitat és

R

f (x)dx=∫ b

akdx= 1.

En aquest cas, això és equivalent a

∫ b

akdx= [kx]ba = k(b−a) = 1

Cosa que implica que

k=1

b−a.

153

Page 151: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) La funció de distribució de la variableX queda com

F(x) =

∫ x

−∞f (s)ds=

∫ x

a

1b−a

ds=x−ab−a

, si x∈ [a,b],

F(x) =

∫ x

−∞f (s)ds= 0, six< a,

F(x) =

∫ x

−∞f (s)ds=

∫ b

af (x)dx= 1, six> b.

(b) Prenent ara els valorsa= 2 i b= 6, obtenim

F(x) =

0, six< 2x−2

4, si x∈ [2,6]

1, six< 6

Les probabilitats que es demanen són

P(X ≤ 1) = F(1) = 0

P(X ≤ 3) = F(3) = 0.25

P(X = 4) = 0

P(3≤ X < 5) = F(5)−F(3) = 0.5

P(X ≥ 3) = 1−P(X ≤ 3) = 1−F(3) = 0.75

Problema 3.21 Sigui X una variable aleatòria, amb funció de densitat

f (x) =

ae−ax, x> 0;

0, altrament

Calculeu P(|X −µ| ≥ kσ) per k≥ 1 i compareu el resultat anterior amb la cota ques’obté usant la desigualtat de Txebitxev.

Solucio

En primer lloc, calculemµ i σ2 per integració per parts, i obtenim:

E(X) =1a

i VAR(X) =1a2

.

En segon lloc, i com que la densitat és 0 per a valors negatius:

P(|X−µ| ≥ kσ) = 1−P

(∣∣∣∣X− 1a

∣∣∣∣≤ k1a

)= 1−P

(X− 1

a≤ k

1a

)

= 1−P

(X ≤ k+1

a

)= 1−FX

(k+1

a

)= e−(k+1)

154

Page 152: Llibre estadística

Variables aleatòries

Finalment, comparem el resultat amb el que proporciona el teorema de Txebitxev:

1−P(|X−µ| ≤ kσ)≥1a2

k2

a2

=1k2

Per exemple, per ak= 2 i k= 3, les diferències són

k P(|X−µ| ≥ kσ) P(|X−µ| ≥ kσ)(Txebitxev)

2 0.049787 0.25000

3 0.018316 0.11111

Problema 3.22 Suposeu que el radi d’un cercle és una variable aleatòria que té perfunció de densitat:

fR(r) =

1

(π/4)1/3 e− r

(π/4)1/3 , r > 0

0, altrament

(a) Calculeu la probabilitat que el radi sigui inferior a0.5.(b) Trobeu la funció de densitat de l’àrea del cercle.

Solucio

3.26Funció de densitat de lavariable del problema 3.22en què l'àrea ombrejadarepresenta la probabilitatque el radi prengui unvalor igual o inferior a 0.5.

0.5

f (r)

(a) SiRés la variable aleatòria que mesura el radi d’un cercle, aleshores

P(R< 0.5) = F(0.5) =∫ 0.5

0

1(π/4)1/3

e−r

(π/4)1/3 dr =[−e−

r

(π/4)1/3

]0.5

0= 0.418373

155

Page 153: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) L’àrea d’un cercle ve donada perA= πR2. Calculem la densitat deA a partir de laseva distribució:

P(A≤ a) = P(πR2 ≤ a) = P(

R2 ≤ aπ

)= P

(−√

≤ R≤√

)

= FR

(√aπ

)−FR

(−√

)= FR

(√aπ

)

Finalment, derivantFA (a), obtenim

fA (a) = fR

(√aπ

)1

2√

Problema 3.23 La mitjana dels sous d’una empresa és de1200euros, amb una desvi-ació tipus de100euros. Quin percentatge de treballadors té un sou d’entre900 i 1500euros? En quin interval de sous trobarem, com a mínim, un75% dels treballadors?

Solucio

Per resoldre aquest problema, ens cal recordar la desigualtat de Txebitxev:

P(µ−σk< X < µ+σk)≥ 1− 1k2

L’interval proposat en aquest cas s’ajusta al teorema, ambk= 3

P(1200−100·3< X < 1200+100·3)≥ 1− 132

=89≈ 0.8889

Per tant, podem assegurar que, com a mínim, un 88.89% dels treballadors tenen un soud’entre 900 i 1500 euros.

Per a la segona part, seguim el procés invers. Llavors,

P(1200−100k< X < 1200+100k)≥ 1− 1k2

= 0.75 ⇒ k= 2

Entre 1000 i 1400 euros trobarem, com a mínim, el 75% dels sous dels treballadors.

Problema 3.24 Si X és una variable aleatòria contínua amb E(X) = 3 i E(X2) = 13,determineu una fita inferior per a la probabilitat P(−2< X < 8).

Solucio

Observem que

P(|X−E(X)| ≥ 5) = P(|X−3| ≥ 5) = P(X ≤−2)+P(X ≥ 8) = 1−P(−2< X < 8)

156

Page 154: Llibre estadística

Variables aleatòries

Per la desigualtat de Txebitxev,

P(|X−E(X)| ≥ 5)≤ VAR(X)

25=

E(X2)− (E(X))2

25=

425

Per tant,

1−P(−2< X < 8)≤ 425

⇒ P(−2< X < 8)≤ 2125

Problema 3.25 Suposem que un mesurament té una mitjanaµ i una variànciaσ2 = 25.Sigui Xn la mitjana de n mesuraments independents. Quants mesuraments hem de fer sivolem que

P(|Xn−µ|< 1)≥ 0.95?

Solucio

Expressem la probabilitat de manera que puguem utilitzar la desigualtat de Txebitxev. Ésa dir,

1−P(|Xn−µ| ≥ 1) = P(|Xn−µ|< 1)≥ 0.95⇒ 0.05≥ P(|Xn−µ| ≥ 1)

Com que la variància de la mitjana mostral ésσ2

n, aplicant la desigualtat de Txebitxev i

igualant les fites obtenim

P(|Xn−µ| ≥ 1)≥ 25/n12

= 0.05⇒ n=25

0.05= 500

Problemes resolts (variables aleatories bidimensionals)

Problema 3.26 Considerem una variable aleatòria bidimensional amb funció de densi-tat conjunta:

f (x,y) =

2kx+2ky, 0< x< 1, 0< y< 1−x

0, altrament

Es demana:

(a) Calculeu el valor de k perquè f sigui una funció de densitat.(b) Calculeu-ne la funció de distribució conjunta.(c) Calculeu les funcions de densitat i de distribució marginals de X i de Y.(d) Calculeu les funcions de densitat i de distribució condicionades.(e) Calculeu les esperances de X i de Y.(f) Calculeu les variàncies de X i de Y.(g) Calculeu-ne la covariància.(h) Estudieu si les variables són independents o incorrelacionades.

157

Page 155: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(i) Es considera el quadrat Q de vèrtexs(0,0),(a,0),(0,a) i (a,a), en què a≥ 0. Cal-culeu la probabilitat P(X ∈ Q) i determineu a, de manera que aquesta probabilitatsigui1/2.

Solucio

3.27Per calcular ( , ), és a

dir, la funció dedistribució en el punt

( , ), cal calcular elvolum sota la superfície

= ( , ), delimitat perla regió ombrejada

(problema 3.26).

F x y

x y

z f x y

(x,y)

1

1

y= 1−x

(a) Perquè sigui funció de densitat, cal que∫

R

R

f (x,y) dxdy= 1. És a dir,

∫ x=1

x=0

∫ y=1−x

y=0(2kx+2ky) dydx= 1⇔

∫ x=1

x=0

(2kx(1−x)+k(1−x)2

)dx

= 1⇔ 23k= 1⇔ k= 3

2

(b) La funció de distribució es defineix com

F(x,y) =P(X ≤ x,Y ≤ y) =∫ s=x

s=−∞

∫ t=y

t=−∞f (s,t) dtds.

La funció de distribució la calculem de forma diferent, en funció de les regionsdefinides a la figura 3.28. Les diferents regions corresponen als conjunts del plasegüents:

A = (x,y)∈ R2 | x≤ 0 o béy≤ 0B = (x,y)∈ R2 | 0< x< 1, 0< y< 1−xC = (x,y)∈ R2 | 0< x< 1, 1−x< y< 1D = (x,y)∈ R2 | 0< x< 1, y≥ 1E = (x,y)∈ R2 | x≥ 1, 0< y< 1F = (x,y)∈ R2 | x≥ 1 i y≥ 1

158

Page 156: Llibre estadística

Variables aleatòries

3.28L'àrea ombrejadarepresenta la regiósobre la qual es defineixla variable aleatòriabidimensional. Per alcàlcul de la funció dedistribució d'un puntgenèric ( , ),necessitem dividir el plaen les diferents regionsque s'hi poden observar(problema 3.26).

x y

A

B

C

D

E

F

1

1

y= 1−x

(b) Si (x,y)∈ A, aleshoresF(x,y) =0.

Si (x,y)∈ B, aleshores

F(x,y) =∫ s=x

s=0

∫ t=y

t=0f (s,t)dtds=

32

yx2+32

y2x.

Si (x,y)∈C, aleshores

F(x,y) =

∫ s=1−y

s=0

∫ t=y

t=0f (s,t)dtds+

∫ s=x

s=1−y

∫ t=1−s

t=0f (s,t)dtds

= −12

y3+32

y+32

x−1− 12

x3.

Si (x,y)∈ D, aleshores

F(x,y) =∫ s=x

s=0

∫ t=1−s

t=0f (s,t)dtds=

32

x− 12

x3.

Si (x,y)∈ E, aleshores

F(x,y) =∫ s=1−y

s=0

∫ t=y

t=0f (s,t)dtds+

∫ s=1

s=1−y

∫ t=1−s

t=0f (s,t)dtds=

32

y− 12

y3.

Aquesta integral també es pot plantejar de forma anàloga a la regióD:

F(x,y) =∫ t=y

t=0

∫ s=1−t

s=0f (s,t)dsdt=

32

y− 12

y3.

159

Page 157: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.29Funció de densitatconjunta ( , ) del

problema 3.26 i càlcul dela funció de distribució

conjunta per a diferentsregions.

f x yf (x,y)

(x,y) ∈ B (x,y) ∈C

(x,y) ∈ D(x,y) ∈ E

(x,y) ∈ F

(b) Si (x,y)∈ F , aleshores

F(x,y) =∫ s=1

s=0

∫ t=1−s

t=0f (s,t)dtds= 1.

(c) Amb relació a la variableX, la funció de densitat marginal és

fX(x) =

0, x≤ 0∫ y=1−x

y=0f (x,y)dy=−3

2x2+

32

, 0< x< 1

0, x≥ 1

i la seva funció de distribució marginal,

FX(x) =

0, x≤ 0∫ s=x

s=0fX(s)ds=−1

2x3+

32

x, 0< x< 1

1, x≥ 1

Amb relació a la variableY, la funció de densitat marginal és

fY(y) =

0, y≤ 0∫ x=1−y

x=0f (x,y)dx=−3

2y2+

32

, 0< y< 1

0, y≥ 1

160

Page 158: Llibre estadística

Variables aleatòries

(c) i la seva funció de distribució marginal,

FY(y)=

0, y≤ 0∫ t=y

t=0fY(t)d f =−1

2y3+

32

y, 0< y< 1

1, y≥ 1

(d) La funció de densitat condicionadafX|Y=y(x) es defineix com

fX|Y=y(x) =f (x,y)fY(y)

=3x+3y− 3

2y2+ 3

2

=6(x+y)−3y2+3

, 0< y< 1, 0< x< 1−y

i la funció de densitat condicionadafY|X=x(y), com

fY|X=x(y) =f (x,y)fX(x)

=3x+3y− 3

2x2+ 3

2

=6(x+y)−3x2+3

, 0< x< 1, 0< y< 1−x

Les corresponents funcions de distribució condicionades són

FX|Y=y(x) =

0, 0< y< 1, x< 0∫ s=x

s=0fX|Y=y(s)ds=−x(x+2y)

y2−1, 0< y< 1, 0< x< 1−y

1, 0< y< 1, x≥ 1−y

FY|X=x(y) =

0, 0< x< 1, y< 0∫ t=y

t=0fY|X=x(t)dt =−y(y+2x)

x2−1, 0< x< 1, 0< y< 1−x

1, 0< x< 1, y≥ 1−y

(e) E(X) =

∫ x=1

x=0x fX(x)dx=

38

E(Y) =∫ y=1

y=0y fY(y)dy=

38

(f) Per tal de calcular les variàncies de les variablesX i Y, hi apliquem el resultat deSteiner:

VAR(X) = E(X2)− [E(X)]2.

Així doncs, primerament calculemE(X2) i E(Y2):

E(X2) =

∫ x=1

x=0x2 fX(x)dx=

15

E(Y2) =

∫ y=1

y=0y2 fY(y)dy=

15

161

Page 159: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Per tant,

VAR(X) = E(X2)− [E(X)]2 =15−(

38

)2

=19320

≈ 0.059375

VAR(Y) = E(Y2)− [E(Y)]2 =15−(

38

)2

=19320

≈ 0.059375

(g) Cov(X,Y) =∫ x=1

x=0

∫ y=1−x

y=0(x−E(X))(y−E(Y)) f (x,y)dydx=− 13

320≈−0.040625

(h) Com queCov(X,Y) 6= 0, les variables aleatòriesX i Y no són ni independents niincorrelacionades.

(i) La probabilitatP(X ∈ Q) és equivalent al càlcul deF(a,a). Aleshores, en funciódel valor dea, tenim que

- Si 0< a<12

(regióB), aleshoresP(X ∈ Q) = F(a,a) = 3a3.

- Si12< a< 1 (regióC, aleshoresP(X ∈ Q) = F(a,a) =−a3+3a−1.

- Si a≥ 1 (regióF , aleshoresP(X ∈ Q) = F(a,a) = 1.

Si som a la regióB, per buscar el valor dea de manera queP(X ∈ Q) = 12, resolem

l’equació

3a3 =12

, que no té cap solució en el rang

(0,

12

).

3.30Busquem el valor del

paràmetre que fa queaF a a( , ) sigui ½ (problema

3.26(i)).

a

a

y= 1−x

1

1

162

Page 160: Llibre estadística

Variables aleatòries

(b) Si som a la regióC, l’equació que hem de resoldre és

−a3+3a−1=12

,

que té com a solució plausiblea= 0.55787.

Problema 3.27 Donada la variable aleatòria bidimensional contínua(X,Y) amb funcióde densitat conjunta

f (x) =

k(2x+3y2), 0< x< 1, 0< y< 1

0, altrament

Calculeu:

(a) La constant k.

(b) Les funcions de distribució conjunta, marginals i condicionades.

(c) P(X ≤ 0.1;Y ≤ 0.2).(d) El valor de a tal que P(0.6< X ≤ a) = 0.1.

(e) P(X ≤ 0.4|Y = 0.6)

Solucio

3.31L'àrea ombrejadarepresenta la regiósobre la qual es defineixla variable aleatòriabidimensional. Per alcàlcul de la funció dedistribució d'un puntgenèric ( , ),necessitem dividir el plaen les diferents regionsque s'hi poden observar(problema 3.27).

x y

A

B

C

D

E

1

1

(a) La constantk la trobem imposant quef sigui funció de densitat:

∫ 1

0

∫ 1

0k(2x+3y2) dxdy= 2k= 1⇔ k=

12.

163

Page 161: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) La funció de distribució la calculem de forma diferent, enfunció de les regionsdefinides a la figura 3.31. Les diferents regions corresponen als conjunts del plasegüents:

A = (x,y)∈ R2 | x≤ 0 o béy≤ 0

B = (x,y)∈ R2 | 0< x< 1, 0< y< 1

C = (x,y)∈ R2 | 0< x< 1, y≥ 1

D = (x,y)∈ R2 | x≥ 1, 0< y< 1

E = (x,y)∈ R2 | x≥ 1, y≥ 1

3.32Funció de densitatconjunta ( , ) del

problema 3.27, càlculde la funció de

distribució conjunta pera diferents regions ifunció de distribució

conjunta ( , ).

f x y

F x y

f (x,y)

(x,y) ∈ B(x,y) ∈C

(x,y) ∈ D(x,y) ∈ E

F(x,y) =∫ s=x

s=0

∫ t=y

t=0f (s,t)dtds F(x,y) =

∫ s=x

s=0

∫ t=1

t=0f (s,t)dtds

F(x,y) =∫ s=1

s=0

∫ t=y

t=0f (s,t)dtds F(x,y) = 1

F(x,y)

1

(b) Si (x,y)∈ A, aleshoresF(x,y) =0.

Si (x,y)∈ B, aleshores

F(x,y) =∫ s=x

s=0

∫ t=y

t=0f (s,t)dtds=

12

y3x+12

yx2.

Si (x,y)∈C, aleshores

F(x,y) =∫ s=x

s=0

∫ t=1

t=0f (s,t)dtds=

12

x+12

x2.

164

Page 162: Llibre estadística

Variables aleatòries

(b) Si (x,y)∈ D, aleshores

F(x,y) =∫ s=1

s=0

∫ t=y

t=0f (s,t)dtds=

12

y3+12

y.

Si (x,y)∈ E, aleshores

F(x,y) =∫ s=1

s=0

∫ t=1

t=0f (s,t)dtds= 1.

Per al càlcul de les funcions de distribució marginals, calculem primer les funcionsde densitat marginals:

fX(x) =

0, x≤ 0∫ y=1

y=0f (x,y)dy=

12+x, 0< x< 1

0, x≥ 1

fY(y) =

0, y≤ 0∫ x=1

x=0f (x,y)dy=

12+

32

y2, 0< y< 1

0, y≥ 1

Aleshores,

FX(x) =

0, x≤ 0∫ s=x

s=0fX(s)ds=

12

x+12

x2, 0< x< 1

1, x≥ 1

FY(y) =

0, y≤ 0∫ t=y

t=0fY(t)dt =

12

y3+12

y, 0< y< 1

1, y≥ 1

La funció de densitat condicionadafX|Y=y(x) es defineix com

fX|Y=y(x) =f (x,y)fY(y)

=x+ 3

2y2

12+ 3

2y2

=2x+3y2

1+3y2, 0< x< 1, 0< y< 1

i la funció de densitat condicionadafY|X=x(y), com

fY|X=x(y) =f (x,y)fX(x)

=x+ 3

2y2

12+x

=2x+3y2

1+2x, 0< x< 1, 0< y< 1

165

Page 163: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Les corresponents funcions de distribució condicionades són

FX|Y=y(x) =

0, 0< y< 1, x< 0∫ s=x

s=0fX|Y=y(s)ds=

x(x+3y2)

1+3y2, 0< y< 1, 0< x< 1

1, 0< y< 1, x≥ 1

FY|X=x(y) =

0, 0< x< 1, y< 0∫ t=y

t=0fY|X=x(t)dt =

y(y2+2x)1+2x

, 0< x< 1, 0< y< 1

1, 0< x< 1, y≥ 1

(c) Atès que el punt(0.1,0.2) ∈ B, aleshores

P(X ≤ 0.1;Y ≤ 0.2) = F(0.1,0.2) =12

y3x+12

yx2

∣∣∣∣x=0.1, y=0.2

=7

5000= 0.0014.

(d) Sabem queP(0.6< X ≤ a) = FX(a)−FX(0.6). Aleshores,

FX(a)−FX(0.6)=

(12

a+12

a2

)−(

12·0.6+ 1

2·0.62

)=

12

a+12

a2−0.48= 0.1 ⇒

a=−12± 1

10

√141

Si ens quedem amb la solució positiva, tenim que

a=−12+

110

√141≈ 0.68740.

(e) P(X ≤ 0.4|Y = 0.6) = FX|Y=0.6(0.4) =x(x+3y2)

1+3y2

∣∣∣∣x=0.4, y=0.6

=37130

≈ 0.28462.

Problema 3.28 Es consideren dues variables aleatòries X i Y , amb funció de probabi-litat i de densitat, respectivament,

P(X = k) =

(nk

)pk(1− p)n−k, k= 0,1,2,. . . ,n

0, altrament

fY(x) =

λe−λx, x≥ 0

0, altrament

Es demana:

(a) Comproveu que tant P com f defineixen una probabilitat.(b) Calculeu-ne les esperances i les variàncies.(c) Calculeu els mínims valors de a i b tals que P(X ≥ a)≥ 1/2 i P(Y ≥ b)≥ 1/2.

166

Page 164: Llibre estadística

Variables aleatòries

Solucio

(a) D’una banda, per les propietats del binomi de Newton,

n

∑k=0

(nk

)pk(1− p)n−k = (p+1− p)n = 1.

D’altra banda,∫ ∞

0 λe−λx = 1.

(b) Pel problema 3.15,E(X) = np i VAR(X) = np(1− p).

(c) Per trobar el que es demana, cal calcular-ne les medianes. Per a la binomial, esconsidera que, com que per an gransB(n, p)≈ N(np,np(1− p)) (vegeu el capítolsegüent per a més detalls), aleshoresa= ⌊np⌋. Per a la variableY,

∫ Me

0λe−λx =

[−e−λx

]Me

0= 0.5⇔ Me =

ln(2)λ

.

En conclusió,b=ln(2)λ

.

Problema 3.29 Siguin X i Y dues variables aleatòries, on Y= aX+b i a i b són cons-tants. Vegeu que el coeficient de correlació ésρXY = sgn(a), on sgn(a) és el signe de a.

Solucio

ρXY =Cov(X,Y)√

VAR(X)VAR(Y)=

Cov(X,aX+b)√VAR(X)VAR(aX+b)

=aCov(X,X)√

a2VAR(X)VAR(X)=

aVAR(X)

|a|VAR(X)= sgn(a)

Problema 3.30 La producció d’una fàbrica es pot destinar a dos mercats. Els margesbruts de guany vénen donats per les variables X1 i X2, on sabem que VAR(X1) = 32.56i VAR(X2) = 21.97 i queρX1X2

= −4.31. Considerem, com a funció de risc de guany, lafunció

R=VAR(αX1+(1−α)X2)

onα indica la partició de vendes. Calculeu el valor deα que minimitza el risc.

Solucio

En primer lloc, desenvolupem l’expressió de la funció de risc de guany:

R = VAR(αX1+(1−α)X2) =VAR(αX1)+VAR((1−α)X2)+2Cov(αX1,(1−α)X2)

= α2VAR(X1)+(1−α)2VAR(X2)+2α(1−α)Cov(X1,X2)

167

Page 165: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

3.33Funció de densitat de la

variable aleatòria contínuadel problema 3.30

i el seu mínim amín

αmin 1

R= f (α)

Per a minimitzar el risc, s’imposa la condició de mínim:

dRdα

=d

(α2VAR(X1)+(1−α)2VAR(X2)+2α(1−α)Cov(X1,X2)

)= 0

Operant, obtenim

dRdα

= 2αVAR(X1)−2(1−α)VAR(X2)+2(1−2α)Cov(X1,X2) = 0⇔ α≈ 0.416152

Problema 3.31 Escollim un nombre X a l’atzar a l’interval[0,1]. Fixat X, triem unnombre Y a l’interval[X,1]. Determineu:

(a) La llei conjunta(X,Y) i la llei de Y.(b) El valor mitjà de XY.

Solucio

(a) Com que els punts els escollim a l’atzar,X segueix una distribució uniforme en[0,1] i, un cop fixatX, Y –condicionada a aquestaX– també segueix una distribucióuniforme en[X,1]. És a dir,

fX(x) =

1, 0< x< 1 ;0, altrament

fY|X=x(y) =

1

1−x, x< y< 1

0, altrament

168

Page 166: Llibre estadística

Variables aleatòries

(b) La llei conjunta(X,Y) es calcula per mitjà de la condicionada:

f(X,Y)(x,y) = fY|X=x(y) fX(x) =1

1−x, 0< x< y< 1

Finalment, fY(y) =

∫ x=y

x=0f(X,Y)(x,y) dx=

∫ x=y

x=0

11−x

dx

= − ln(1−y)+ ln(1) =− ln(1−y), y∈ (0,1).

(b) E(XY) =∫ x=1

x=0

∫ y=1

y=xxy f(X,Y)(x,y) dydx=

∫ x=1

x=0

∫ y=1

y=xxy

11−x

dxdy=512

.

Problema 3.32 Siguin X= ∑nk=1 kZk i Y = ∑n

k=1 Zk dues variables aleatòries, on Zk sónvariables aleatòries independents de mitjanaµ i de variànciaσ2.

(a) Calculeu E(X) i VAR(X).

(b) Calculeu la covariància i la correlació entre X i Y .

Solucio

(a) E(X) = E

(n

∑k=1

kZk

)=

n

∑k=1

E(kZk) =n

∑k=1

kE(Zk) =n

∑k=1

kµ= µn(n+1)

2

VAR(X) = VAR

(n

∑k=1

kZk

)=

n

∑k=1

VAR(kZk) =n

∑k=1

k2VAR(Zk) =n

∑k=1

k2σ2

= σ2 n(n+1)(2n+1)6

(b) Cov(X,Y) = Cov

(n

∑k=1

kZk,n

∑k=1

Zk

)=

n

∑k=1

Cov(kZk,Zk) =n

∑k=1

kVAR(Zk) = σ2 n(n+1)

2

ρXY =σ2 n(n+1)

2√VAR(X)VAR(Y)

=σ2 n(n+1)

2√

nσ2

√σ2

n

∑k=1

k2

=

√6

2n+1√

(n+1)(2n+1)

Problema 3.33 Si la variable X segueix una llei normal amb una mitjana0 i una vari-ànciaσ2 (podeu trobar la funció de densitat al capítol següent), doneu la densitat i ladistribució de Y= |X|.

Solucio

Si y < 0, Fy(y) = 0. Pery ≥ 0, tenim queP(Y ≤ y) = P(|X| ≤ y) = P(−y ≤ X ≤ y) =FX(y)−FX(−y).

169

Page 167: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Finalment, la densitat

fY(y)= fX(y)+ fX(−y) =2√

2πσ2e

−y2

2σ2

Problema 3.34 Siguin X1 i X2 variables aleatòries independents que segueixen la ma-teixa llei:

fXi(x) =

1 0< x< 10 altrament

Trobeu la llei de la variable Z= X+Y.

Solucio

3.34Funció de densitat de la

variable = + delproblema 3.34.

Observeu que, en ser lagràfica de la funció

simètrica respecte delvalor 1, aquest valor és

alhora l'esperança i lamediana.

Z X Y

1 2

f (z)

Per trobar la llei deZ, en determinem primer la distribució. És clar que

FZ(z) = 0 siz< 0 i FZ(z) = 1, siz> 1.

Com que són independents, la seva densitat conjunta és

f(X,Y)(x,y) =1, x∈ (0,1), y∈ (0,1).

Per az∈ (0,1),

FZ(z) = P(X+Y ≤ z) =∫

x+y≤z1 dxdy=

z2

2

Per az∈ (1,2),

FZ(z) = P(X+Y ≤ z) =∫

x+y≤zf(X,Y) dxdy= 1− (2−z)2

2.

170

Page 168: Llibre estadística

Variables aleatòries

Finalment,

fZ(z) =

z, 0≤ z≤ 1

2−z, 1< z≤ 2

0, altrament

171

Page 169: Llibre estadística

Hola

Page 170: Llibre estadística

Models probabilísticsen l’enginyeria

“La vie n’est bonne qu’à deux choses:découvrir les mathématiques et enseigner les mathématiques.”

Siméon-Denis Poisson, 1781-1840.

L’objectiu d’aquest capítol és determinar distribucions que puguin servir de model a dife-rents fenòmens aleatoris. Moltes variables aleatòries associades a experiments estadísticstenen propietats similars i es poden descriure essencialment amb la mateixa distribucióde probabilitat. Això ens porta a l’elaboració d’una sèrie de distribucions tipus.

4.1. Models de distribucions discretes

Distribucio uniforme discreta

Si una variable aleatòriaX prenn valorsx1,. . . ,xn amb la mateixa probabilitat, diem quesegueix unadistribució uniforme discretade paràmetren, on n= 1,2,. . .. Per exemple,a l’experiment aleatori de tirar un dau perfecte de sis cares, se segueix una distribucióuniforme discreta de paràmetren= 6.

La funció de probabilitat d’una variable uniforme discreta és

fX(xi) = P(X = xi) =1n

, i = 1,. . . ,n

i les seves característiques principals són

E(X) =1n

n

∑i=1

xi,

VAR(X) =1n

n

∑i=1

x2i −(

1n

n

∑i=1

xi

)2

.

173

Page 171: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Observació 4.1Un cas particular es produeix quan x1 = 1,x2 = 2,. . . ,xn = n. Aleshores,la funció de probabilitat es pot escriure de la manera següent:

P(X = k) =1n

, k= 1,. . . ,n.

Les seves característiques principals són

E(X) =n

∑i=1

in=

1n

n

∑i=1

i =1n

n(n+1)2

=n+1

2,

VAR(X) =1n

n

∑i=1

i2−(

1n

n

∑i=1

i

)2

=1n

n(n+1)(2n+1)6

−(

n+12

)2

=n2−1

12

Distribucio de Bernoulli

Considerem un experiment aleatori qualsevol i a cada realització de la prova estudiem sies compleix un esdevenimentA o no. Per exemple, en tirar un dau, considerem l’esdeve-nimentA=“treure un 6”. Suposem també que l’experiment aleatori consistent a observarsi es compleixA es pot repetir de manera que el resultat en una prova siguiindepen-dentdel que s’hagi l’obtingut en proves precedents. A més, suposem que coneixem laprobabilitatp que té l’esdevenimentA de complir-se i sabem que aquesta es manté cons-tant en les realitzacions successives. Un experiment aleatori d’aquest tipus s’anomenaexperiment de Bernoulli.

La variable aleatòriaX, que compta el nombre d’èxits a fer l’experiment una vegada,es diu que segueix unadistribució de Bernoullide paràmetrep, on p és la probabilitatd’èxit (0 ≤ p ≤ 1) i q = 1− p és la probabilitat de fracàs. Ho escriurem de la manerasegüentX → b(p).

La seva funció de probabilitat s’expressa

fX(k) = P(X = k) = pk · (1− p)1−k, k= 0,1.

Les seves característiques són

E(X) = p,

VAR(X) = pq.

Distribucio binomial

Es realitzenn experiments independents de Bernoulli (usualment,n repeticions indepen-dents del mateix experiment), on la probabilitat d’èxit és semprep. Es diu aleshores ques’han realitzatn tiradesde Bernoulli de paràmetrep. La variableX, nombre d’èxits ob-tinguts en lesn tirades, segueix unadistribució binomialde paràmetresn i p. Es denotaperX → B(n, p).

La seva funció de probabilitat es pot expressar de la manera següent:

fX(k) = P(X = k) =

(nk

)pk(1− p)n−k, k= 0,1,. . . ,n.

174

Page 172: Llibre estadística

Models probabilístics en l’enginyeria

Les seves característiques són

E(X) = np,

VAR(X) = npq.

La demostració d’aquestes propietats la podeu trobar al problema 3.15.

Observació 4.2Una variable binomial,B(n, p), es pot obtenir sumant n variables deBernoulli de paràmetre p i independents, que representarien el resultat de cada tirada.

Observació 4.3La distribució binomial ésreproductiva, és a dir, donades X1,. . . ,Xm, mvariables binomials independents amb el mateix paràmetre p, Xj →B(nj , p), la variableX = X1+ · · ·+Xm és també binomial. Més concretament:

X → B(n1+ · · ·+nm, p).

4.1Funció de probabilitatd'una distribució binomialde paràmetres = 20 i

= 0.3 (a dalt al'esquerra), = 0.5

) i= 0.7 .

np

p

p(a dalt a la dreta

(a baix)

0 5 10 15 20

0.00

0.05

0.10

0.15

xi

P(X

=x i)

0 5 10 15 20

0.00

0.05

0.10

0.15

xi

P(X

=x i)

0 5 10 15 20

0.00

0.05

0.10

0.15

xi

P(X

=x i)

Distribucio de Poisson

Considerem un experiment, que consisteix a observar l’aparició d’un esdeveniment pun-tual,A, en un interval continu de temps o d’espai.

Per exemple, comptar el nombre de vehicles que passen per un lloc determinat durant uninterval de temps, anotar el nombre de plantes d’una espècie determinada que hi ha en unmetre quadrat de bosc, etc. Aquest tipus d’experiment s’anomenaexperiment de Poisson.

175

Page 173: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Caracterıstiques d’un experiment de Poisson

Les característiques generals d’un experiment de Poisson són:

- Els successos s’esdevenen aleatòriament i de manera independent en un interval con-tinu d’espai o de temps.

- La probabilitat que dos esdeveniments ocorrin simultàniament pot considerar-se ne-gligible o nul·la.

- Es produeix un comportament uniforme en el sentit que, a llargtermini, el nombremitjà de vegadesλ que s’esdevé el succésA és constant per unitat d’observació.

Considerem la variable aleatòriaX, que compta el nombre d’observacions de l’esdeve-nimentA que s’ha fet en realitzar un experiment de Poisson.

La funció de probabilitat associada a aquesta variable aleatòriaX, que depèn només dela seva mitjanaλ, rep el nom dedistribució de Poissonde paràmetreλ i se simbolitzaambX → P(λ).

La seva funció de probabilitat és

fX(k) = P(X = k) = e−λ · λk

k!, k= 0,1. . .

Les seves característiques són

E(X) = λ,

VAR(X) = λ.

Demostració

E(X) =∞

∑k=0

e−λ ·k · λk

k!= e−λ

∑k=1

e−λ ·λ · λk−1

(k−1)!= e−λλ

∑k=0

λk

(k)!= λ

Per a la variància, observem que

E(X2) =∞

∑k=0

e−λ ·k2 · λk

k!=

=∞

∑k=0

e−λ ·k(k−1) · λk

k!+

∑k=0

e−λ ·k · λk

k!= e−λ

∑k=0

λ2 λk−2

(k−2)!+λ= λ2+λ

d’on, per tant,VAR(X) = E(X2)− (E(X))2 = λ2+λ−λ2 = λ.

Proposició 4.3 La distribució binomialB(n, p), quan n→ ∞ i p → 0, tendeix a ladistribució de Poisson:

limn→∞

B(n, p) = P(λ),

on suposem que el producte np es manté constant i igual aλ.

176

Page 174: Llibre estadística

Models probabilístics en l’enginyeria

4.2Funció de probabilitatd'una distribució dePoisson de paràmetres

=1 (a dalt a l'esquerra),

= 3 (a dalt a la dreta) i

= 5 (a baix).

λ

λ

λ

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

xi

P(X

=x i)

0 2 4 6 8 10 12 14

0.00

0.05

0.10

0.15

0.20

xi

P(X

=x i)

0 2 4 6 8 10 12 14

0.00

0.05

0.10

0.15

xi

P(X

=x i)

Demostració. SiguiX → B(n, p). La seva funció de probabilitat és

fX(k) =

(nk

)pk(1− p)n−k

Aleshores, prenent el límit simultani dep→ 0 i n→ ∞, de manera quenp= λ constant,tenim que

limn→∞,p→0

B(n, p) = limn→∞,p→0

(nk

)pk(1− p)n−k =

= limn→∞,p→0

n· (n−1) · · ·(n−k+1)!k!

pk(1− p)n(1− p)−k

Observem que

limn→∞,p→0

(1− p)n = elim

n→∞,p→0[n((1−p)−1)]

= elim

n→∞,p→∞−λ

= e−λ

De la mateixa manera,

limn→∞,p→0

n· (n−1) · · ·(n−k+1)!k!

px = limn→∞,p→0

np· (np− p) · · ·(np− p(k−1))!k!

177

Page 175: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

= limp→0

λ · (λ− p) · · ·(λ− p(k−1))!k!

= limp→0

λk+O(p)k!

=λk

k!

Finalment,

limp→0

(1− p)−k = 1

I, com que el límit que volíem calcular és el producte d’aquests tres límits,

limn→∞,p→0

B(n, p) = e−λ · λk

k!,

demostrem el que volíem veure.

Observació 4.4En la distribució binomial, si n és gran i la probabilitat p que té l’es-deveniment d’ocórrer és petita, de manera que q= 1− p és pròxim a 1, es diu quel’esdeveniment ésestranyo rar.

A la pràctica, un esdeveniment es pot considerar estrany si el nombre de repeticions ésn≥ 50, i el producte np és inferior a 5.

En aquests casos, la distribució binomial s’aproxima per la distribució de Poisson ambλ= np, encara que, depenent de la tolerància que ens permetin, es poden obtenir bonesaproximacions a partir de n≥ 30 i p ≈ 0,1.

Distribucio geometrica

Es realitzen successius experiments independents de Bernoulli amb la mateixa probabi-litat d’èxit p.

La variableX, que compta el nombre de fracassos abans del primer èxit, segueix unadistribució geomètricade paràmetrep (0< p≤ 1), amb funció de probabilitat

fX(k) = P(X = k) = (1− p)k · p, k= 0,1,. . .

Denotem aquesta distribució perX → G (p).

Les seves característiques són

E(X) =1− p

p,

VAR(X) =1− p

p2.

Si considerem la variableY, que compta el nombre de repeticions de l’experiment finsal primer èxit, diem que segueix unadistribució geomètrica modificadade paràmetrep(0< p≤ 1), amb funció de probabilitat

fY(k) = P(Y = k) = (1− p)k−1· p, k= 1,2,. . .

178

Page 176: Llibre estadística

Models probabilístics en l’enginyeria

4.3Funció de probabilitatd'una distribuciógeomètrica deparàmetres = 0.3(a dalt a l'esquerra),= 0.5 (a dalt a la dreta) i= 0.7 (a baix).

p

pp

0 5 10 15

0.00

0.05

0.10

0.15

0.20

0.25

0.30

xi

P(X

=x i)

0 5 10 15

0.0

0.1

0.2

0.3

0.4

0.5

xi

P(X

=x i)

0 5 10 15

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

xi

P(X

=x i)

Denotem aquesta distribució perY → G ⋆(p).

Les seves característiques són

E(Y) =1p

,

VAR(Y) =1− p

p2.

Observació 4.5Noteu que, si X→ G (p) i Y → G ⋆(p), aleshores

Y = X+1.

La demostració d’aquestes propietats la podeu trobar al problema 3.14.

Observació 4.6La distribució geomètrica satisfà una propietat important, anomenadafalta de memòriao oblit: si X és una variable aleatòria amb distribució geomètrica,aleshores

P(X ≥ m+n | X ≥ m) = P(X ≥ n), n,m= 0,1,. . .

Aquesta propietat caracteritza la distribució geomètrica entre les distribucions discretesque prenen valors enters no negatius.

179

Page 177: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Distribucio binomial negativa

Es realitzen successius experiments independents de Bernoulli amb la mateixa probabi-litat d’èxit p.

La variableX, que compta el nombre de fracassos abans delr-èsim èxit, segueix unadistribució binomial negativade paràmetresr i p (r = 1,2,. . . , i 0< p≤ 1), amb funcióde probabilitat

fX(k) = P(X = k) =

(k+ r −1

k

)(1− p)kpr , k= 0,1. . .

La forma abreujada d’aquesta distribució ésX → BN (r, p).

Les seves característiques són

E(X) =r(1− p)

p,

VAR(X) =r(1− p)

p2.

Si considerem ara la variableY, que compta el nombre de repeticions fins a aconseguirel r-èsim èxit, aquesta variable segueix unadistribució binomial negativa modificadadeparàmetresr i p (r = 1,2,. . . , i 0< p≤ 1), amb funció de probabilitat

fY(k) = P(Y = k) =

(k−1r −1

)(1− p)k−r pr , k= r,r +1,. . .

La forma abreujada d’aquesta distribució ésY → BN⋆(r, p).

Les seves característiques són

E(X) =rp

,

VAR(Y) =r(1− p)

p2.

Observació 4.7La distribució binomial negativa deu el nom al fet que la seva funcióde probabilitat és equivalent a la d’una binomial, però prenent el nombre combinatoriennegatiu:

fX(k) = P(X = k) =

(−rk

)(1− p)kpr , k= 0,1. . .

on(−r

k

)=

(−r) · (−r −1) · · ·(−r − (k−1))k!

180

Page 178: Llibre estadística

Models probabilístics en l’enginyeria

4.4Funció de probabilitatd'una distribució binomialnegativade paràmetres = 5 i

= 0.3 (a dalt al’esquerra), = 0.5 (adalt a la dreta) i = 0.7(a baix).

rp

pp

0 10 20 30 40

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

xi

P(X

=x i)

0 10 20 30 40

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

xi

P(X

=x i)

0 10 20 30 40

0.00

0.05

0.10

0.15

0.20

0.25

xi

P(X

=x i)

Distribucio hipergeometrica

Considerem l’exemple següent:

Exemple 4.1 Tenim una baralla de cartes (N= 48), de les quals només ens interessa elpal de copes (D= 12cartes del mateix tipus). Suposem que, d’aquesta baralla, en traiemn= 8 cartes, sense reemplaçament, i ens preguntem quina és la probabilitat que hi hagik= 2 copes (exactament) en aquesta extracció.

La resposta a aquest problema és

P(X = k) = P(X = 2) =

(Dk

)·(

N−Dn−k

)(

Nn

) =

(122

)·(

366

)(

488

) ,

on hem aplicat la regla de Laplace per al càlcul de la probabilitat: “casos favorablesentre casos possibles”.

Si, enlloc de fer servir com a dada D, ens indiquen la proporció existent, p, entre elnombre total de copes i el nombre de cartes de la baralla,

p=DN

=1248

=14

⇒ D = N · p, N−D = N · (1− p)︸ ︷︷ ︸q

181

Page 179: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Aleshores, la fórmula queda

P(X = k) =

(N·p

k

)·(

N·qn−k

)(

Nn

) .

Diem, en general, que una variable aleatòria X segueix unadistribució hipergeomètricade paràmetres N (grandària total), n (grandària de la mostra) i p (proporció d’èxits),cosa que es representa com a X→ H G (N,n, p), si la seva funció de probabilitat és

fX(k) = P(X = k) =

(N·p

k

)·(

N·qn−k

)(

Nn

) ,

on max0,n−Nq ≤ k≤ minn,Np.

Les seves característiques són

E(X) = np,

VAR(X) = npqN−nN−1

.

Observació 4.8Quan la grandària de la població N és molt gran, la llei hipergeomè-trica tendeix a la binomial, és a dir,

limN→∞

H G (N,n, p) = B(n, p)

4.5Funció de probabilitat

d'una distribucióhipergeomètrica

de paràmetres = 48,= 8 i = 1/3 (a dalt al’esquerra), = 1/4 (a

dalt a la dreta) i = 1/6(a baix).

Nn p

pp

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

x

f(x)

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

x

f(x)

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

x

f(x)

182

Page 180: Llibre estadística

Models probabilístics en l’enginyeria

4.2. Models de distribucions contınues

Distribucio uniforme contınua

Una variable aleatòriaX segueix unadistribució uniforme contínuade paràmetresa i b(a,b∈ R, a< b) si la seva funció de densitat és

fX(x) =

1b−a

, a< x< b

0, altrament

Ho expressarem abreujadament de la manera següent:X → U (a,b).

Les seves característiques principals són

E(X) =b+a

2,

VAR(X) =(b−a)2

12.

4.6Funció de densitat d’unadistribució uniformecontínua de paràmetres

= 1 i = 1 (a dalt al’esquerra), = 0 i = 1(a dalt a la dreta) i = 0 i

= 3 (a baix).

a ba b

ab

_

x

f(x)

x

f(x)

x

f(x)

En efecte,

E(X) =∫ b

ax

1b−a

dx=b+a

2

183

Page 181: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

E(X2) =∫ b

ax2 1

b−adx=

b3−a3

3(b−a)

VAR(X) = E(X2)− [E(X)]2 =b3−a3

3(b−a)−(

b+a2

)=

(b−a)2

12.

Propietats

(i) Si X segueix una distribucióU (a,b), la variableY = cX+d, ambc 6= 0, segueixtambé una distribució uniforme a l’interval(ca+d,cb+d) si c> 0, o a l’interval(cb+d,ca+d) si c< 0.

(ii) Si X és una variable aleatòria contínua, ambFX estrictament creixent en el camp devariació deX, aleshoresY = FX(X) té una distribucióU (0,1).

Demostració. Demostrarem la segona propietat. La primera es deixa com a exercici peral lector.

És clar que el recorregut deY és [0,1]. Per tant,FY(y) =0 pery< 0 i FY(y) =1 pery≥ 1.Per a 0< y< 1, tenim

FY(y) =P[Y ≤ y] =P[FX(X)≤ y] =P[X ≤ F−1X (y)] =FX(F

−1X (y)) = y

on a la segona igualtat hem utilitzat la bijectivitat i el manteniment de la desigualtat quees deriven del fet queFX sigui estrictament creixent.

Com quef = ddy

FY, obtenim

f (y) =

1, 0< y< 1

0, altrament

Distribucio normal

És l’exemple més important de distribució de probabilitat associada a una variable ale-atòria contínua. La seva importància és que molts fenòmens segueixen aquesta distribu-ció.

Es diu que una variable aleatòria té una distribució normal si la seva funció de densitatés

f (x) =1

σ√

2πe−

(x−µ)2

2σ2 , −∞ < x< ∞.

La funció depèn de dos paràmetresµ i σ, i s’expressa comX → N(µ,σ).

Propietats de la distribució normal

(i) fX(x) és simètrica respecte de la rectax= µ.(ii) L’eix x és una asímptota a la corba.

(iii) fX(x) té un màxim de valor 1σ√

2πper ax= µ.

184

Page 182: Llibre estadística

Models probabilístics en l’enginyeria

(iv) Té dos punts d’inflexió, ax= µ−σ i a x= µ+σ.(v) La moda i la mediana valenµ.

4.7Funció de densitat d’unadistribució normal deparàmetres = 0 i = 1(a dalt a l’esquerra),

= 0.7 (a dalt a la dreta)

i = 1.3 (a baix).

m s

s

s

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

x

f(x)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

x

f(x)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

x

f(x)

Demostració

(i) Cal veure quef (µ+x) = f (µ−x).

f (µ+x) =1

σ√

2πe−

(x)2

2σ2 =1

σ√

2πe−

(−x)2

2σ2 = f (µ−x)

(ii) limx→±∞

f (x) = limx→±∞

1

σ√

2πe−

(x−µ)2

2σ2 = 0 ja que, donadak> 0, limx→∞

e−kx = 0

(iii) Imposem la condició necessària d’extrem, és a dir, que la derivada s’anul·li:

ddx

f (x) =ddx

1

σ√

2πe−

(x−µ)2

2σ2 =1

σ√

2πe−

(x−µ)2

2σ2

(−2(x−µ)

2σ2

)

= 0⇔ 2(x−µ) = 0⇔ x= µ

Per veure que és màxim, basta comprovar que la segona derivada enx= µ és nega-tiva:

d2

dx2f (x) =

1

σ√

2πe−

(x−µ)2

2σ2

(4(x−µ)2

4σ4− 2

2σ2

)⇒ d2

dx2f (µ) =

−1

σ3√

2π< 0

185

Page 183: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Finalment, el seu valor és

f (µ) =1

σ√

2π.

(iv) En efecte, els punts en què s’anul·la la segona derivada són les arrels de

(x−µ)2

σ4− 1σ2

.

Aquestes sónx= µ−σ i x= µ+σ.

(v) Per la propietat (iii), la moda ésµ, i per la propietat (i), també és la mediana.

Característiques de la distribució normal

Proposició 4.4 Si una variable aleatòria X és N(µ,σ), aleshores la seva esperançamatemàtica és

E(X) = µ

i la seva variància és

VAR(X) = σ2.

Demostració. Per a la demostració d’aquestes dues característiques, cal tenir presentsels resultats següents:

-

∫ ∞

−∞e−

12

x2

dx=√

2π.

-

∫ ∞

−∞xe−

12

x2

dx= 0.

-

∫ ∞

−∞x2e−

12

x2

dx=√

2π.

El segon és una integral directa i el tercer, una integral per parts, que es resol fàcilment.El primer comporta, però, una certa dificultat tècnica. Per a provar-lo, observem que,

denotant perA=∫ ∞−∞ e−

12

x2

dx, tenim

A2 =

(∫ ∞

−∞e−

12

x2

dx

)(∫ ∞

−∞e−

12

y2

dy

)=∫ ∞

−∞

∫ ∞

−∞e−

12(x2+y2) dx dy

Canviant a coordenades polars, la integral resulta

A2 =

∫ ∞

0

∫ 2π

0e−

12

r2

r dr dθ = 2π ·[e−

12

r2]∞

0= 2π⇒ A=

√2π

Podem calcular ara l’esperança i la variància de la distribucióX = N(µ,σ). En tots doscasos, considerem el canvi de variablex= yσ+µ:

186

Page 184: Llibre estadística

Models probabilístics en l’enginyeria

E(X) =

∫ ∞

−∞

x

σ√

2πe−

(x−µ)2

2σ2 dx=∫ ∞

−∞

yσ+µ√2π

e−y2

2 dy

=µ√2π

∫ ∞

−∞e−

y2

2 dy+σ√2π

∫ ∞

−∞ye−

y2

2 dy= µ+0= µ

Per a la variància, calculem primerE(X2):

E(X2) =∫ ∞

−∞

x2

σ√

2πe−

(x−µ)2

2σ2 dx=∫ ∞

−∞

y2σ2+2yσµ+µ2

√2π

e−y2

2 dy

=σ2

√2π

∫ ∞

−∞y2e−

y2

2 dy+2σµ√

∫ ∞

−∞ye−

y2

2 dy+µ2

√2π

∫ ∞

−∞e−

y2

2 dy= σ2+µ2

Finalment,VAR(X) = E(X2)− (E(X))2 = σ2+µ2−µ2 = σ2

4.8Funció de densitat d’unadistribució normal deparàmetres = 1 i = 0(a dalt a l’esquerra),

= 1 (a dalt a la dreta) i

= 1 (a baix).

s m

m

m -

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

Funció de distribució de la llei normal

La funció de distribució de la llei normal és

FX(x) = P(X ≤ x) =1

σ√

∫ x

−∞e−

(t−µ)2

2σ2 dt,

que no té una expressió explícita.

187

Page 185: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Llei normal tipificada

Si la mitjanaµ val 0 i σ val 1, la llei normal corresponent es denominallei normaltipificada.

La seva funció de densitat és

fX(x) =1√2π

e−x2

2 , x∈ R.

Els valors de l’àrea sota la corba normal tipificada, és a dir, els valors de

∫ x

−∞f (t)dt,

∫ x

0f (t)dt

estan tabulats per als diferents valors dex.

Si hem de calcular la llei normal per a un valorµ diferent de 0, iσ diferent de 1, fent elcanvi de variable

Z =X−µX

σX

s’obté la llei normal tipificada.

Per tant, per fer els càlculs utilitzant les taules, passarem a la llei normal tipificada idesprés tornarem a la llei d’origen.

És a dir,

P(x1 ≤ X ≤ x2) = P(z1 ≤ Z ≤ z2),

onzi =xi −µX

σX

.

Més propietats de la distribució normal

Es pot comprovar que, en tota distribució normal, a l’interval:

- [µ−σ,µ+σ] es troba el 68.27% de la distribució.- [µ−2σ,µ+2σ] es troba el 95.45% de la distribució.- [µ−3σ,µ+3σ] es troba el 99.73% de la distribució.

Per tant, el fet de saber que les dades segueixen una distribució normal ens permet donaruns intervals més precisos que els que dóna la desigualtat de Txebitxev.

- Quank= 1, el 0.00%, davant del 68.27%.- Quank= 2, el 75.00%, davant del 95.45%.- Quank= 3, el 88.89%, davant del 99.73%.

188

Page 186: Llibre estadística

Models probabilístics en l’enginyeria

Exemple 4.2 (Resistència del formigó i llei normal)Una planta de fabricació de for-migó té una producció que segueix una llei normal de mitjana187 kg

cm2 i desviació tipus9 kg

cm2 .

(a) Calculeu la probabilitat que la resistència del formigó estigui compresa entre178 i190 kg

cm2 .

(b) Calculeu la resistència mínima del formigó que es pot garantir amb un risc d’errordel 5% (resistència característica).[Les normes actuals del formigó defineixen laresistència característica d’aquest material com el valor per al qual valors mésbaixos de resistència tenen freqüències d’aparició inferiors al5%, és a dir, el valorque representa un grau de confiança del95%.]

(c) Calculeu entre quins valors simètrics respecte a la mitjana estarà compresa la re-sistència del formigó en el80%dels casos.

Per resoldre l’apartat(a), cal tipificar la variable X que determina la resistència delformigó i consultar les taules de probabilitat de la N(0,1),

Z =X−187

9→ N(0,1)

Aleshores,

P(178< X < 190) = P

(178−187

9< Z <

190−1879

)≡ P

(−1< Z <

13

)≈ 0.4719

La qüestió(b) demana trobar el valor z de la variable tipificada tal que P(Z< z) = 0.05.Bo i consultant les taules de la N(0,1), es troba que aquest valor és z=−1.65. Tornanta la variable inicial, obtenim que la resistència característica és172.15.

L’apartat (c) es resol també a partir de la variable tipificada Z. Cal buscar el valor z talque P(−z< Z < z) = 0.8. Aquest valor és z= 1.285. Per tant, la resistència del formigóestarà compresa, en un 80% dels casos, entre175.435 i 198.565.

4.9El càlcul de la probabilitat

(178 < < 190) ésequivalent al càlcul de laprobabilitat

( 1 < < 1/3), on araés una variable

aleatòria que segueixuna distribució normaltipificada (exemple 4.2).

P X

P Z

Z

-

P(178< X < 190) P

(−1< Z <

13

)

189

Page 187: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

4.10Equivalència per al càlcul

de ( 1 < < 1/3) entermes de la funció de

distribució (exemple 4.2).

P Z-

P

(−1< Z <

13

)= F

(13

)−F(−1)P

(Z <

13

)= F

(13

)P(Z <−1) = F(−1)

Us de la taula de la llei normal tipificada i interpolacio lineal

La taula que hi ha al final del llibre dóna els valors de la funció de distribució de la lleinormal tipificada, per a valors positius i amb una resolució de dos decimals. Per exemple,consultant la taula, podeu calcular directament el valorFZ(1.23) = 0.8907. AnomenemΦ(z) el valor donat per la taula de la funció de distribució en el puntz.

Per a d’altres situacions, utilitzeu les equivalències següents:

- Si z> 0, aleshoresP(Z ≥ z) = 1−P(Z ≤ z) = 1−Φ(z).- Si z< 0, aleshoresP(Z ≤ z) = 1−P(Z ≤−z) = 1−Φ(−z).- Si z< 0, aleshoresP(Z ≥ z) = P(Z ≤−z) = Φ(−z).

4.11Càlcul de (Z )

per a 0.P z

z >

>_

zz

P(Z ≥ z) 1 P(Z ≤ z)

4.12Càlcul de (Z )

per a 0.P z

z <

>_

z −z−z

P(Z ≤ z) P(Z ≥−z) 1 P(Z ≤−z)

Si el valorz del qual volem calcularΦ(z) conté més de dues xifres decimals, hem d’in-terpolar linealment. Considereu l’exemple següent:

190

Page 188: Llibre estadística

Models probabilístics en l’enginyeria

4.13Càlcul de (Z )per a 0.

P zz <

>_

z −z

P(Z ≥ z) P(Z ≤−z)

Exemple 4.3 Si volem calcular FZ(1.332) per a z= 1.332, considerem a= 1.33 i b =1.34. Aleshores, tenim que

FZ(z) = Φ(a)+Φ(b)−Φ(a)

b−a· (z−a),

que dóna com a resultat FZ(z) = 0.90854.

També ens pot passar que busquem el valor dez tal queFZ(z) tingui un valor que nosurti explícitament a la taula. En aquest cas, també, hem d’aplicar interpolació lineal.Considereu l’exemple següent:

Exemple 4.4 Si volem calcular el valor de z tal que FZ(z) = 0.8877, busquem els valorsa i b tals que

Φ(a)< 0.8877< Φ(b).

En aquest cas,

a = 1.21

b = 1.22

Aleshores,

z= a+b−a

Φ(b)−Φ(a)· (FZ(z)−Φ(a)),

que dóna com a resultat

z= 1.214210526.

Aproximacio de la llei binomial per la llei normal

Les probabilitats dels esdeveniments que segueixen una llei binomialB(n, p) quann ésgran es fan molt difícils de calcular, si no es disposa d’un ordinador.

191

Page 189: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Vegem una manera de calcular aproximadament aquesta probabilitat diferent de l’apro-ximació per la llei de Poisson, que requeriap petita, a més den gran. Com sabem,l’esperança matemàtica i la variància de la llei binomial són

E(X) = np,

VAR(X) = np(1− p).

4.14Anomenem ( ) el valor

donat per la taula de lafunció de distribució en el

punt .

F z

z

zz

FZ(z) = P(X ≤ z) FZ(z) = Φ(z)

4.15Si el valor del qualvolem calcular ( )

conté més de dues xifresdecimals, hem

d’interpolar linealment.

z

zF

zz aa bb

Fz(z)Φ(a) Φ(b)Fz(z)

recta= Φ(a)+Φ(b)−Φ(a)

b−a·x

Proposició 4.5 Si X és una variable aleatòria binomial de mitjanaµ = np i variànciaσ2 = np(1− p), la variable

Z =X−np√np(1− p)

segueix una llei normal tipificada N(0,1) quan n→ ∞.

La demostració d’aquest resultat es deixa per a més endavant, quan es desenvoluparà unteorema més general: el teorema central del límit.

Observació 4.9A la pràctica, l’aproximació és bona quan n> 30. Com més gran siguin i més pròxim sigui p a0.5 (més simètrica és la binomial), millor és l’aproximació.Però, fins i tot per a valors de p pròxims a0.5 i valors de n petits, la llei normal tam-bé ens ofereix una bona aproximació gràcies a la simetria de la distribució de la lleibinomial per a p= 0.5.

192

Page 190: Llibre estadística

Models probabilístics en l’enginyeria

Calcul efectiu

Per calcular una probabilitatP(a≤X ≤ b) d’una llei binomial mitjançant una llei normal,es fa una correcció per passar dels valors discrets que pren la binomial als valors continusque pren la normal, i se substitueixen els valorsa i b per

a → a−0.5

b → b+0.5

(correcció de mig punt). És a dir,

P(a≤ X ≤ b) =b

∑k=a

(nk

)pk(1− p)n−k

=

∫ b+0.5

a−0.5

1√2πnp(1− p)

e−

(x−np)2

2np(1−p)dx

=

∫ b

a

1√2π

e−z2

2 dz

= FZ(a)−FZ(b),

onFZ és la funció de distribució de la normal tipificada, i ˜a i b són els valors tipificats dea−0.5 i b+0.5, respectivament.

Observació 4.10Si es disposa d’una eina de càlcul simbòlic, com ara Maple, aquestaprobabilitat es pot calcularexactamentfent:

> sum(binomial(n,k)*p^k*(1-p)^(n-k),k=ceil(a)..floor(b));

Distribucio logarıtmiconormal

Una variable aleatòriaX té una distribuciólogaritmiconormalde paràmetresµ i σ (µ,σ∈R, −∞ < µ< ∞, σ > 0) si la variableY = lnX segueix una distribucióN(µ,σ).

Ho denotem amb la notació abreujadaX → logN(µ,σ).

La funció de densitat d’una distribució logaritmiconormal és

fX(x) =

1

x√

2πσ·e−

(lnx−µ)2

2σ2 x> 0

0, altrament.

Les seves característiques principals són

E(X) = eµ+σ2

2 ,

VAR(X) = e2µ ·(e2σ2 −eσ

2).

193

Page 191: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

4.16Funció de densitat d’una

distribuciólogarítmiconormal de

paràmetres = 5 i = 1(a dalt a l’esquerra),

= 0.5 (a dalt a la dreta)

i = 1.5 (a baix).

m s

s

s

0 500 1000 1500

0.00

00.

001

0.00

20.

003

0.00

40.

005

0.00

6

x

f(x)

0 500 1000 1500

0.00

00.

001

0.00

20.

003

0.00

40.

005

0.00

6

x

f(x)

0 500 1000 1500

0.00

00.

001

0.00

20.

003

0.00

40.

005

0.00

6

x

f(x)

4.17Funció de densitat d’una

distribuciólogarítmiconormal de

paràmetres = 1 i = 5(a dalt a l’esquerra),

= 4 (a dalt a la dreta) i

= 6 (a baix).

s m

m

m

0 500 1000 1500

0.00

00.

002

0.00

40.

006

0.00

80.

010

0.01

2

x

f(x)

0 500 1000 1500

0.00

00.

002

0.00

40.

006

0.00

80.

010

0.01

2

x

f(x)

0 500 1000 1500

0.00

00.

002

0.00

40.

006

0.00

80.

010

0.01

2

x

f(x)

194

Page 192: Llibre estadística

Models probabilístics en l’enginyeria

Observació 4.11La funció de densitat d’una distribuciólogN(µ,σ) es dedueix a partirde la funció de densitat de la N(µ,σ). Prenent y> 0, tenim

FY(y) =P(Y ≤ y) =P(eX ≤ y) =P(X ≤ lny) =FX(lny)

Per tant, fY(y) = fX(lny) · 1y=

1

y√

2πσ·e− (lny−µ)2

2σ2 .

Distribucio exponencial negativa

Una variable aleatòriaX segueix una distribucióexponencial negativade paràmetrea(a∈ R, a> 0) si la seva funció de densitat és

fX(x) =

a·e−ax, x> 0

0, x≤ 0.

Ho representem amb la notació abreujadaX → E (a).

Les seves característiques principals són

E(X) =1a

, VAR(X) =1a2.

4.18Funció de densitat d’unadistribució exponencialde paràmetres = 1 (adalt a l’esquerra), = 0.5

i = 2.

aa

a(a baix) (a dalt a ladreta)

0 2 4 6 8 10 12

0.0

0.5

1.0

1.5

2.0

x

f(x)

0 2 4 6 8 10 12

0.0

0.5

1.0

1.5

2.0

x

f(x)

0 2 4 6 8 10 12

0.0

0.5

1.0

1.5

2.0

x

f(x)

195

Page 193: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Observació 4.12La distribució exponencial satisfà la propietat de l’oblit o de lafaltade memòria; és a dir, si X és una variable aleatòria amb distribucióE (a),

P(X > s+ t | X > s) = P(X > t), s,t ∈ R, s,t > 0.

Aquesta propietat caracteritza les variables exponencials entre les contínues positives.

Distribucio khi quadrat (χ2χ2χ2)

Introducció

SiguiX una variable aleatòriaN(µ,σ) associada a un experiment i siguin, a més,

x1,. . . ,xn,

n observacions independents resultants d’aquest experiment.

Podem considerar lesxi com a observacions den variables aleatòries independents, quedenotarem perXi, totesN(µ,σ).

En estadística, moltes vegades es planteja un tipus de problema, que es pot descriure in-terpretant aquestes observacions com un punt en l’espain-dimensionalRn, (x1,. . . ,xn) ∈Rn i considerant la constantµ com el puntµ= (µ,. . . ,µ) ∈ Rn.

La distància entre aquests punts es pot avaluar mitjançant la funció

d =√

(x1−µ)2+ · · ·+(xn−µ)2.

Com que el punt(x1,. . . ,xn) està triat a l’atzar,d és una variable aleatòria i ens podemplantejar la qüestió següent en termes probabilístics:

Si t0 ∈ R+, quina és la probabilitat que el punt(x1,. . . ,xn) disti del puntµ = (µ,. . . ,µ)menys det0?

És a dir, ens interessa mesurar probabilitats com araP(d < t0) o P(d ≥ t0), i altres desimilars.

Com que, a l’efecte de tenir una mesura de les probabilitats anteriors, és equivalentutilitzar

d =√

(x1−µ)2+ · · ·+(xn−µ)2

o

d2 = (x1−µ)2+ · · ·+(xn−µ)2

o

kd2 = k[(x1−µ)2+ · · ·+(xn−µ)2], k> 0,

196

Page 194: Llibre estadística

Models probabilístics en l’enginyeria

podem prendrek= 1σ2 i considerar la variable aleatòria

d2

σ2=

(x1−µσ

)2

+ · · ·+(

xn−µσ

)2

,

que és una suma de quadrats de variables aleatòries independents idènticament distribuï-des d’acord amb unaN(µ,σ).

Aquesta última expressió té l’avantatge d’utilitzar un tipus de variable de distribucióconeguda i estudiada, la distribució normal, i justifica la definició següent.

Variable aleatòria khi quadrat (χ2χ2χ2)

DonadesX1,. . . ,Xn variables aleatòries independents i totes seguint una lleiN(0,1), ano-menemvariable aleatòria khi quadrat, i la representem perχ2

n , la variable aleatòria

χ2n = X2

1 + · · ·+X2n .

Lesn variables aleatòries que hi intervenen, les anomenemgraus de llibertat.

Tant la funció de distribucióKn(x) com la funció de densitatkn(x) han de ser 0 per avalors negatius dex, x< 0, ja queχ2

n ≥ 0.

En el cas quex ≥ 0, utilitzant la funció de densitat conjunta, que, pel fet de ser lesvariablesXi independents, és el producte de les funcions de densitat respectives, obtenimla igualtat

Kn(x) = P(χ2n ≤ x)

=1√(2π)n

∫· · ·∫

x21+···+x2

n≤xe−

12 (x

21+···+x2

n)dx1 · · ·dxn.

Funció de densitat de la distribucióχ2nχ2nχ2n

La funció de densitatdeχ2n , kn(x), és

kn(x) =1

2n2 Γ( n

2)x

n2−1e−

x2 ,

on Γ és la funció gamma d’Euler, definida com a

Γ(p) =∫ ∞

0xp−1e−xdx.

Les característiques de la distribucióχ2n són

E(χ2n) = n,

VAR(χ2n) =

√2n.

197

Page 195: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

4.19Funció de densitat d’una

distribució c2 de n = 2graus de llibertat (a dalt a

l’esquerra), = 6 grausnde llibertat (a dalt a la

dreta) i = 10 graus denllibertat (a baix).

0 5 10 15

0.0

0.1

0.2

0.3

0.4

0.5

x

f(x)

0 5 10 15 20 25

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

x

f(x)

5 10 15 20 25 30

0.00

0.02

0.04

0.06

0.08

0.10

x

f(x)

Distribucio t de Student

Introducció

Si X és una variable aleatòriaN(µ,σ) i consideremn observacions independents

x1,. . . ,xn,

podem considerar la variable aleatòria mitjana de les observacions

X =1n(x1+ · · ·+xn),

que segueix una distribucióN

(µ,σ√n

)o, el que és equivalent,

X−µσ√n

ésN(0,1).

En molts problemes d’estudi de les característiques d’una població a partir dels resultatsobtinguts en un subconjunt d’individus, el valor deσ és desconegut i és substituït peruna aproximaciós. El problema que se’ns presenta és:

Quan considerem la variable aleatòriaX−µ

s√n

, aquesta variable també és normal o no?

198

Page 196: Llibre estadística

Models probabilístics en l’enginyeria

La resposta és que no és normal, encara que veurem que, per a valors grans den, la dis-tribució s’aproxima aN(0,1). Així doncs, es fa necessari estudiar la funció de distribuciói la funció de densitat d’aquesta variable, en especial quann és petit. Per tal de fer-ho,observem que

X−µs√n

=√

nX−µ

s=√

n

X−µσ√n

sσ√n

=√

n

X−µσ√n√

ns2

σ2

i, per tant, queX−µ

s√n

es pot escriure com a quocient entre una variable aleatòria

X−µσ√n

→ N(0,1)

i l’arrel dens2

σ2, que es demostra que segueix una distribucióχ2

n ambn graus de llibertat.

Variable aleatòria t de Student

SiguinY i Z variables aleatòries tals queY → N(0,1) i Z → χ2n , ambn graus de lliber-

tat. Definim la variable aleatòriat de Student amb n graus de llibertatcom aquella queresulta del quocient de l’expressió

t =√

nY√Z.

La funció de densitat d’unat de Student ambn graus de llibertat,sn(x), és

sn(x) =1√nπ

Γ(

n+12

)

Γ(n

2

) 1(

1+x2

n

) n+12

,

on Γ és la funció gamma d’Euler.

L’esperança matemàtica i la desviació tipus det són, respectivament,

E(t) = 0,

VAR(t) = σ2t =

nn−2

,

on VAR(t) existeix només sin> 2.

199

Page 197: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

4.20Funció de densitat d’una

distribució de Studentde = 2 graus de llibertat

(a dalt a l’esquerra),= 6 graus de llibertat (adalt a la dreta) i = 10

graus de llibertat (a baix).

tn

nn

−5 0 5

0.0

0.1

0.2

0.3

0.4

x

f(x)

−5 0 5

0.0

0.1

0.2

0.3

0.4

x

f(x)

−5 0 5

0.0

0.1

0.2

0.3

0.4

x

f(x)

Distribucio F de Fisher

La distribucióF de Fisher –també coneguda com aF de Snedecor oF de Fisher-Snedecor– es construeix de la manera següent: siU1 i U2 són dues variables independentsque segueixen distribucionsχ2, ambd1 i d2 graus de llibertat, respectivament, aleshoresla variable

F =

U1

d1

U2

d2

→ Fm,n

té una distribucióF de Fisher ambd1 graus de llibertat al numerador id2 graus dellibertat al denominador.

La funció de densitat d’una variableF → Fd1,d2ve donada per

fF (x) =1

B

(d1

2,d2

2

)(

d1xd1x+d2

) d12(

1− d1xd1x+d2

) d22 1

x, x≥ 0, d1,d2 ∈ N,

onB és la funció beta definida perB(x,y) =Γ(x)Γ(y)Γ(x+y)

.

200

Page 198: Llibre estadística

Models probabilístics en l’enginyeria

Les seves característiques principals són

E(F ) =d2

d2−2, d2 > 2,

VAR(F ) =2d2

2(d1+d2−2)d1(d2−2)2(d2−4)

, d2 > 4.

Proposició 4.6 SiF → Fd1,d2, aleshores

Y =1F

→ Fd2,d1.

4.21Funció de densitat d’unadistribució de Fisher deFd1 = 2 i d2 = 5 graus dellibertat (a dalt al’esquerra), d1 = 5 id2 = 10 graus de llibertat(a dalt a la dreta) id1 = 30 i d2 = 20 graus dellibertat (a baix).

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

x

f(x)

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

x

f(x)

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

x

f(x)

Observació 4.13La distribució F apareix al capítol 5 en comparar variàncies de po-blacions normals. D’alguna manera, aquesta distribució es pot considerar una genera-lització de la distribució t de Student, ja que es compleix la relació:

t2n = F1,n

Problemes resolts

Problema 4.1 La probabilitat que un nounat sigui nen és de0.515. En una maternitat,un matí han nascut10 infants. Trobeu la probabilitat que exactament hi hagin nascut3nens.

201

Page 199: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Solucio

Sigui X la variable que compta el nombre de nens nascuts. És clar queX →B(10,0.515).Per tant,P(X = 3) = 0.103465.

Problema 4.2 El nombre de trucades que es reben en una empresa es distribueixensegons una distribució de Poisson amb una mitjana de2 trucades per minut. Trobeu laprobabilitat que, en un període de10minuts, es rebin12 trucades.

Solucio

La mitjana de 2 trucades per minut és equivalent a 20 trucades per 10 minuts. Aleshores,sobre els 10 minuts, les trucades que rep l’empresa,X, segueixen una distribució dePoisson amb mitjana de 20, de manera que

P(X = 12) = e−20201212!

= 0.017625.

Problema 4.3 Trobeu el nombre mitjà de vegades que cal llançar una moneda a l’aireper obtenir la primera cara.

Solucio

Sigui Y la variable aleatòria que compta el nombre de monedes que cal llançar fins aobtenir la primera cara. SiguiX la variable aleatòria que compta el nombre de monedesque cal llançarabansd’obtenir la primera cara. És evident queY = X+1. Suposant quela moneda no està trucada,X → G (1/2). Aleshores,

E(Y) = E(X+1) = E(X)+1,

on

E(X) =1− p

p=

1− 12

12

= 1.

Per tant,

E(Y) = 1+1= 2.

Problema 4.4 Per un determinat tram d’una autopista passen, de mitjana, 6 vehiclesper minut. Si un gos comença a travessar la carretera immediatament després que hipassi un vehicle, i tarda 10 segons a fer-ho, quina és la probabilitat que passi un vehicledurant aquest temps?

Solucio

Observem que la mitjana de 6 cotxes per minut equival a 1 cotxe cada 10 segons. Si-gui X la variable aleatòria que compta el nombre de cotxes que hi passen cada 10 segons.

202

Page 200: Llibre estadística

Models probabilístics en l’enginyeria

Podem assumir queX es comporta seguint una distribució de Poisson, ja que en principiel fet que passi un nombre determinat de cotxes en un cert interval de temps no condicionaque en passin uns altres en un altre interval de temps posterior. Aleshores,

P(X ≥ 1) = 1−P(X = 0) = 1−e−1 = 0.632121.

Problema 4.5 En una residència d’estudiants, hi viuen 300 estudiants. A les 7 del matí,la probabilitat que una persona vulgui dutxar-se és de0.6. Quantes dutxes hi hauriad’haver a la cambra de bany perquè un estudiant en trobi una de lliure més del 90% deles vegades que vulgui dutxar-se al matí?

Solucio

Sigui X la variable aleatòria que compta el nombre d’estudiants que volen dutxar-se almatí. Observem queX → B(300,0.6). Per tant, el nombre esperat d’alumnes que es voldutxar a les 7 ésE(X) = 180. Si volem que almenys el 90% trobi dutxa disponible, calque hi hagi 191 dutxes, ja que

P(X ≤ 191) = 0.91292≥ 0.9

Problema 4.6 Digueu el model al qual s’ajusten les distribucions de probabilitat dona-des per les variables aleatòries següents i indiqueu els paramàtres que el determinen.

(a) X és el “nombre de cares obtingudes en llançar una moneda perfecta”.(b) Se sap que dels 5000 telèfons instal·lats en un període determinat, 4000 són de color.

X és el nombre de persones que tenen telèfon blanc d’entre 10 de diferents trucadesa l’atzar.

(c) X és el “nombre de persones que fan servir ulleres” en un grup de 500 personesescollides a l’atzar d’entre els habitants de Barcelona, on el 40% en porta.

Solucio

(a) X → b(

12

).

(b) X → B(10,1/5).

(c) X → B(500,0.4).

Problema 4.7 A Sevilla, la probabilitat que hi hagi una tempesta qualsevol dia de pri-mavera és de0.05. Suposant independència, quina és la probabilitat que la primeratempesta es produeixi el 5 d’abril? (Suposeu que la primavera comença el 21 de març.)

Solucio

Sigui X la variable aleatòria que indica el nombre de dies que han passat des de l’inicide la primavera fins al dia anterior al primer dia de pluja. Tenim queX → G (0.05). Laprobabilitat que es demana ésP(X = 15) = 0.023165.

203

Page 201: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 4.8 Un llibre d’estadística té 200 pàgines on poden existir errors tipogràficsa les equacions. Si hi ha cinc errors emplaçats de forma aleatòria en 5 pàgines diferentsentre les 200, quina és la probabilitat que una mostra de 50 pàgines contingui almenysun error?

Solucio

Sigui X la variable aleatòria que, donada una mostra de 50 pàgines, compta el nombre

d’errors.X segueix una distribucióH G

(200,50,

5200

). Aleshores,

P(X ≥ 1) = 1−P(X = 0) = 1−(

50

)(19550

)(

20050

) = 0.766687.

Problema 4.9 Es plantegen sis missions espacials independents a Mart. La probabilitatestimada d’èxit de cada missió és0.95. Quina és la probabilitat que almenys cinc de lesmissions tinguin èxit?

Solucio

SiguiX la variable aleatòria que compta el nombre de missions amb èxit. Atesa la inde-pendència,X → B(6,0.95).

P(X ≥ 5) = P(X = 5)+P(X = 6) = 0.967226

Problema 4.10 Sigui X una variable aleatòria amb distribució de Bernoulli amb parà-metre p. Per a quin valor de p es maximitza VAR(X)?

Solucio

VAR(X) = P(X = 1)(1−E(X))2 +P(X = 0)(0−E(X))2 = p(1− p)2 + (1− p)p2 =p(1− p), d’on, imposant la condició necessària de màxim, és a dir, que la derivadarespecte dep sigui 0, obtenimpmax =

12.

Problema 4.11 Si el 2% dels circuits fabricats en una certa són defectuosos, quines sónles probabilitats que en un lot de 100, agafats aleatòriament per revisar-los,

(a) com a molt 15 siguin defectuosos?(b) exactament 15 siguin defectuosos?

Solucio

(a) X → B(100,0.02). Ens demanenP(X ≤ 15) = FX(15), que es pot calcular exacta-ment per mitjà de la fórmula

15

∑k=0

(100k

)0.02k0.98100−k,

204

Page 202: Llibre estadística

Models probabilístics en l’enginyeria

per exemple, amb Maple:

> sum(binomial(100,k)*0.02^k*0.98^(100-k),k=0..15);

que dóna com a resultatP(X ≤ 15) = 0.9999999998.

Trobarem, però, una aproximació prou bona d’una forma més ràpida en virtut delteorema central del límit –resultat que serà exposat en temes posteriors del llibre.Així:

P(X ≤ 15) = P

(X−µσ

≤ 15−µσ

)

= P

X−41.97989︸ ︷︷ ︸

Z

≤ 15−41.97989

≈ P(Z ≤ 5.55586)≈ 1,

on hem suposat queZ → N(0,1).

(b) P(X = 15) =

(10015

)0.02150.98100−15 ≈ 1.490622·10−9.

Problema 4.12 El Servei Català de Trànsit té en funcionament un sistema de punts depenalització per a cada infracció que pot conduir a la pèrdua del carnet. Suposem ques’estima que un conductor és denunciat de mitjana una de cada deu vegades que cometuna infracció. Suposem que la quarta denúncia comporta la pèrdua del carnet. Determi-neu:

(a) La funció de probabilitat del nombre d’infraccions comeses fins a la retirada delcarnet.

(b) El nombre esperat d’infraccions necessàries per a la pèrdua del carnet.(c) La variància del nombre d’infraccions.

Solucio

(a) Tenim una experiència dicotòmica: ser multat o no. Busquem el nombre d’infrac-cions comeses fins a ser multat 4 cops. SiguiX la variable que compta el nombred’infraccions comeses fins a les 4 multes. La variableY segueix una llei binomialnegativa modificada de paràmetresr = 4 i p= 0.1:

P(Y = k) =

(k−1r −1

)(1− p)k−r pr , k= 4,5,. . .

(b) El nombre esperat d’infraccions necessàries per la pèrdua del carnet és l’esperançade la variableY:

E(Y) =rp=

40.1

= 40.

205

Page 203: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Alternativament, es pot determinar el valor esperat veient que, per a ser multat uncop, s’esperen 10 infraccions i, per tant, per a ser-ho 4, 40.

(c) VAR(X) =rp2

=4

0.12= 400.

Problema 4.13 Un jugador de bàsquet manté al llarg de la temporada una estadísticad’encerts a tirs des de la línia de6.25m del 47%. Determineu:

(a) La distribució de probabilitat del nombre de tirs de tres punts fins que es produeixla primera errada.

(b) La probabilitat que la primera errada es produeixi al cinquè intent.(c) El nombre mitjà de llançaments que farà fins que cometi la primera errada. Calcu-

leu la variància.

Solucio

(a) SiguiY la variable que compta el nombre de tirs fins al primer error. La variableY segueix una llei geomètrica modificada ambp= 0.53,Y → G ⋆(0.53) (en aquestcas, l’èxit correspon a una errada en el llançament), és a dir,P(Y = k) = pk−1(1−p), k= 1,2,. . . Aleshores,

FY(k) =k

∑i=1

(0.47)k−1(0.53).

(b) P(Y = 5) = 0.025862.

(c) El nombre mitjà ésE(Y), que val

E(Y) =1p= 2.1277,

mentre que la variància és

VAR(Y) =1p2

= 4.5269.

Problema 4.14 Un fabricant de circuits diu a la seva publicitat que les proves d’un la-boratori independent proven que, quan una mostra de 100 circuits és escollida a l’atzar,se sotmet a una càrrega de treball equivalent a 10000 hores, el nombre mitjà de circuitsque fallen és 3. Determineu la probabilitat que fallin 6 circuits i la probabilitat que noen falli cap. Calculeu-ne la variància.

Solucio

Sigui X la variable aleatòria que compta el nombre de circuits que han fallat. Com queel nombre mitjà de circuits que fallen és 3, tenim queX → B(100,3/100). Aleshores,

206

Page 204: Llibre estadística

Models probabilístics en l’enginyeria

P(X = 6) ≈ 0.049609,

P(X = 0) ≈ 0.047553.

La variància és

VAR(X) = npq= 100· 3100

· 97100

= 2.91.

Problema 4.15

(a) Sigui X una distribució binomial negativa de paràmetres r i p. Vegeu que

P(X = k) = P(Y = r −1)P(Z = 1)

on Y → B(k+ r −1,p) i Z → b(p).

(b) Sigui X una binomial de paràmetres n i p. Vegeu que

P(X ≥ 1) =n−1

∑k=0

P(Y = k)

on Y → G (p).

(c) Vegeu queBN (1,p) = G (p).

Solucio

(a) Observem que, com queP(X = k) significa “la probabilitat que femk errors abansder encerts”, és equivalent a calcular la “probabilitat que d’entrek+(r −1) intentsfem r −1 encerts” –P(Y = r −1)– i després “fem un encert” –P(Z = 1).

Una demostració més rigurosa la podem obtenir a partir de les expressions de lesfuncions de probabilitat:

P(Y = r −1)P(Z = 1) =

(k+ r −1

r −1

)pr−1(1− p)k · p=

(k+ r −1

r −1

)pr(1− p)k

= P(X = k).

(b) Recordem queP(Y = k) = (1− p)kp, de manera queY compta el nombre de vegadesk que fallem abans d’encertar per primer cop. Així, la probabilitat que una binomialprengui valor igual o superior a 1 és la probabilitat que encertem alguna vegada–almenys– abans delsn llançaments, i precisament aquesta és la probabilitat quecalcula∑n−1

k=0 P(Y = k).

(c) SiX → BN (1,p) i Y → G (p), aleshores

P(X = k) =

(kk

)(1− p)kp= (1− p)kp= P(Y = k), k= 0,1,2,. . .

207

Page 205: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 4.16 El nombre d’accidents de treball X que es produeixen en una fàbricaper setmana segueix una distribució de Poisson. Si sabem que el percentatge de setmanesen què es produeix un accident és la meitat del corresponent a les setmanes en què nose’n produeix cap, calculeu:

(a) El nombre esperat d’accidents setmanals.(b) La probabilitat que en una setmana hi hagi dos accidents i a la següent, dos més.(c) La probabilitat que en quatre setmanes hi hagi, com a molt, 8 accidents.(d) La Direcció General de Treball decideix declararsetmanes laborals blanquesaque-

lles en què, com a molt, es produeix un accident. Si es considera un període de 5setmanes, determineu la probabilitat que hi hagi, com a mínim, duessetmanes blan-ques.

Indicació: Si Xi → P(λ) i són independents, aleshores

Y = X1+ . . .+Xn → P(nλ)

Solucio

(a) Sabem queX →P(λ) però desconeixemλ, que és l’esperança deX. Tenim que laprobabilitatp que es produeixi un accident en una setmana és la meitat que la queno se’n produeixi cap, de manera que

P(X = 0) = e−λ,

P(X = 1) =e−λλ

1!.

Aleshores, siP(X = 1) = 12P(X = 0), tenim que

e−λλ1!

=12

e−λ ⇒ λ=12.

Per tant, el nombre esperat d’accidents per setmana ésE(X) = λ= 12.

(b) SiguiXi el nombre d’accidents a la setmanai−èsima. Com que els accidents d’unasetmana no influeixen en la següent,Xi són independents. Aleshores,

P(X1 = 2 i X2 = 2) = P(X1 = 2) ·P(X2 = 2) = 5.74811·10−3.

(c) SiguiY = X1+X2+X3+X4 ⇒ Y → P(4· 12) = P(2). Aleshores,

P(Y ≤ 8) =8

∑k=0

e−22k

k!= 0.99980.

(d) Sigui A = “hi ha almenys dues setmanes blanques”. Sigui Z la variable aleatòriaque compta el nombre de setmanes blanques en un període de 5 setmanes. Comque la probabilitat que una setmana sigui blanca és

p= P(X ≤ 1) = P(X = 0)+P(X = 1) =32

e−1/2, Z → B(5, 3

2e−1/2

).

208

Page 206: Llibre estadística

Models probabilístics en l’enginyeria

Aleshores

P(A) = 1−P(Ac) = 1−P(Z = 0)−P(Z = 1) = 0.999693.

Problema 4.17 Per representar les freqüències dels accidents de treball, s’han observatels accidents que han ocorregut a 647 homes en 5 mesos, i se n’ha obtingut la distribuciósegüent:

Nombre d’accidents 0 1 2 3 4 ≥ 5

Freqüència observada 447 132 42 21 3 2

Estudieu si aquesta distribució s’ajusta a una distribució de Poisson.

Solucio

Calculem una aproximació de l’esperança

E(X)≈ 447647

·0+ 132647

·1+ 42647

·2+ 21647

·3+ 3647

·4 2647

·5= 0.465224

Si la variable s’ajusta a una distribució de Poisson, el paràmetre d’aquesta ha de serλ= E(X)≈ 0.465224. Aleshores, tindríem les probabilitatsteòriques:

P(Xt = 0) = 0.627994

P(Xt = 1) = 0.292158

P(Xt = 2) = 0.067959

P(Xt = 3) = 0.010538

P(Xt = 4) = 0.001225

P(Xt ≥ 5) = 0.000126

D’altra banda, les obtingudes empíricament són

P(X = 0) = 0.690880

P(X = 1) = 0.204018

P(X = 2) = 0.064914

P(X = 3) = 0.032457

P(X = 4) = 0.004637

P(X ≥ 5) = 0.003091

De manera que, si bé són semblants, no podem concloure amb tota certesa que la variables’ajusti a un model de Poisson.

Problema 4.18 La variable aleatòria X té una distribució discreta amb funció de pro-babilitat:

209

Page 207: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

f (x) =

kx2

, x = 1, 2. . .

0, altrament

Determineu el valor de k.

Solucio

∑x=1

kx2

= k∞

∑x=1

1x2

= k · π2

6= 1 ⇒ k=

1π2

6

=6π2

.

Observació 4.14La suma de la sèrie∞∑x=1

1x2 coincideix amb la funció zeta de Riemann

avaluada en 2, és a dir,

ζ(2) =∞

∑x=1

1x2.

Amb el Maple, es pot comprovar aquest resultat escrivint:

> Zeta(2);

Problema 4.19 Sigui X una variable aleatòria amb funció de probabilitat f(x). Ano-menemmodael valor (o valors) de x pel qual f(x) és màxima. Determineu la moda dela distribució de Poisson de paràmetreλ.

Solucio

Si X → P(λ), tenim queP(X = k) =e−λλk

k!, k= 0,1,. . .

Per trobar la moda, hem de calcular el màxim (o màxims) def (x), tenint present quef (x) és una funció discreta i, per tant, no podem calcular derivades. Per això, plantegeml’estudi del quocient

P(X = k+1)P(X = k)

=

e−λλk+1

k+1!e−λλk

k!

k+1

La modamha de verificar que

P(X = m+1)P(X = m)

< 1 iP(X = m)

P(X = m−1)≥ 1

És a dir,

λ

m+1< 1 i

λ

m≥ 1

210

Page 208: Llibre estadística

Models probabilístics en l’enginyeria

Per tant, la moda ha de satisfer dues condicions:

λ−1< m

m≥ λ

Així doncs, la moda ésλ siλ és enter, o la part entera delambdaen el cas queλ no siguienter. Aquests dos casos es poden resumir en un de sol:

m= ⌊λ⌋,

per a qualsevolλ.

Problema 4.20 Un lot de 50 llibres s’examina prenent-ne 10 a l’atzar i comprovantque estiguin ben impresos. Si, com a màxim, hi ha un llibre defectuós, s’accepta el lot;altrament, es rebutja. Suposem que en un lot hi ha12 llibres defectuosos. Trobeu laprobabilitat d’acceptar-lo.

Solucio

Sigui X la variable que, donada una mostra de 10, compta els llibres defectuosos. LavariableX segueix una distribució hipergeomètrica de paràmetresN= 50,n= 10 i p= 12

50,

és a dir,

X → H G

(50,10,

625

).

La probabilitat d’acceptar el lot ésP(X ≤ 1), és a dir, la probabibilitat que, com a màxim,obtinguem un llibre defectuós en la mostra de 10. Aleshores,

P(X ≤ 1) = P(X = 0)+P(X = 1) =

(120

)(50−1210−0

)(

5010

) +

(121

)(50−1210−1

)(

5010

) = 0.236449.

Problema 4.21 Sigui X una variable aleatòria que a cada natural n≥ 1 li assigna elresidu de n mòdul k (és a dir, el residu de la divisió entera entre n i k). Es defineix laprobabilitat següent sobre els nombres naturals: P(X = n) = 2−n). Es demana:

(a) Comproveu que P defineix una probabilitat en els naturals i determineu el recorregutde X.

(b) La llei de probabilitat de X.(c) Per a k= 3, especifiqueu la funció de probabilitat de X.

Solucio

(a) Primer de tot, hem de comprovar que la suma de la probabilitat de tots els nombresnaturals:

∑n=1

2−n =∞

∑n=0

2−n−1=1

1−1/2−1= 1.

211

Page 209: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

El recorregut de la variableX és el conjunt dels possibles residus en dividir totnombre natural perk, és a dirX(Ω) = 0,1,. . . ,k−1.

(b) Preguntem-nos per un instant quin és l’esdevenimentX = 0. Aquest esdevenimentés el format pels nombres naturals amb residu 0 en dividir-los perk, és a dir, totsels nombres naturals múltiples dek. Per tant,

(X = 0)≡ k,2k,3k,. . .= ∪∞i=1ik.

Aleshores,

P(X = 0) = P(∪∞i=1ik) =

∑i=1

2−ik =1

2k−1.

De la mateixa manera, l’esdevenimentX = 1 és

(X = 1)≡ 1,k+1,2k+1,3k+1,. . .= ∪∞i=0ik+1.

En conseqüència,

P(X = 1) = P(∪∞i=0ik+1) =

∑i=0

2−(ik+1) =12

2k

2k−1

En el cas general, per a 0≤ r ≤ k−1,

(X = r)≡ r,k+ r,2k+ r,. . .= ∪∞i=0ik+ r.

Per tant,

P(X = r) = P(∪∞i=0ik+ r) =

∑i=0

2−(ik+r) =12r

2k

2k−1.

(c) Per ak= 3, tenim

P(X = 0) =1

23−1=

17

,

P(X = 1) =12

23

23−1=

47

,

P(X = 2) =122

23

23−1=

27.

Problema 4.22 Determineu la distribució de

Y = X2−3X+10

on X és la variable aleatòria que compta el nombre de punts obtinguts en llençar undau de8 cares perfecte.

212

Page 210: Llibre estadística

Models probabilístics en l’enginyeria

Solucio

En primer lloc, veiem queX segueix una llei uniforme discreta a[1,2,3. . .8], és a dir,

P(X = k) =18

, k= 1,2,. . . ,8.

En segon lloc, calculem el recorregut deY:

X 1 2 3 4 5 6 7 8

Y 8 8 10 14 20 28 38 50

és a dir,

Y(Ω) = 8,10,14,20,28,38,50

Finalment, la probabilitat dels valorsyi queda determinada per la regla de Laplace, és a

dir,casos favorablescasos possibles

, ja que la distribució inicialX era equiprobable, és a dir,

P(Y = 8) = P(X = 1)+P(X = 2) =28

P(Y = 10) = P(X = 3) =18

P(Y = 14) = P(X = 4) =18

P(Y = 20) = P(X = 5) =18

P(Y = 28) = P(X = 6) =18

P(Y = 38) = P(X = 7) =18

P(Y = 50) = P(X = 8) =18

Problema 4.23 Un policia rep una trucada d’alerta i ha d’entrar en una casa. Té unclauer amb10 claus mestres diferents, cadascuna de les quals obre totes les portes d’undels10 barris de la ciutat. Per desgràcia, ha oblidat quina és la clau del barri on estroba. Per trobar-ne la correcta, planteja els mètodes següents:

- A: Prova cada una de les claus, sense repetir-les.- B: Prova una clau, la barreja amb les altres i en prova una altra.

Siguin XA i XB les variables aleatòries que designen el nombre de claus assajades en elsprocediments A i B.

213

Page 211: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Determineu les distribucions de XA i XB.(b) Calculeu la probabilitat d’assajar més de 8 claus en cadascun dels mètodes.

Solucio

(a) En el primer mètode, és clar que el recorregut és1,2. . .10. La probabilitatP(XA = k) és equivalent a dir que la clau bona ocupi la posiciók-èsima. Per tant,

P(XA = k) =110

i FXA(k) =

k10

.

En el segon mètode, el recorregut són elsN, ja que el policia, com que pot repetirclaus, no té per què trobar la correcta en un nombre finit d’intents. Observem, doncs,queXB compta el nombre d’errors (claus no correctes) fins al primer encert (claucorrecta), amb la probabilitat d’encert1

10. Per tant,XB → G ⋆(0.1).

(b) P(XA > 8) = 1−P(XA ≤ 8) = 1−0.8= 0.2

P(XB > 8) = 1−P(XB ≤ 8) = 1−8

∑k=1

0.9k−1 ·0.1= 0.43047.

Problema 4.24 La variable X és uniforme a (−1,3) i Y és exponencial amb paràmetreλ. Trobeuλ tal que VAR(X) =VAR(Y).

Solucio

Considerem les variàncies d’ambdues distribucions:

VAR(X) =(b−a)2

12=

42

12=

43

VAR(Y) =1λ2

Aleshores,

43=

1λ2

⇔ λ=±12

√3

Per tant, el valor deλ que busquem és

√3

2, ja que el valor deλ no pot ser negatiu.

Problema 4.25 La variable X és geomètrica amb paràmetre p i Y és exponencial ambparàmetreλ. Trobeuλ tal que P(X > 1) = P(Y > 1).

Solucio

Recordem queP(X = k) = (1− p)k−1p. Aleshores,

P(X > 1) = 1−P(X ≤ 1) = 1−P(X = 1) = 1− p.

214

Page 212: Llibre estadística

Models probabilístics en l’enginyeria

De la mateixa manera,

P(Y > 1) = 1−∫ 1

0λe−λx = 1−1+e−λ = e−λ.

Aleshores,

1− p= e−λ ⇔ λ=− ln(1− p).

Problema 4.26 Una màquina normalment produeix un5%de peces defectuoses. La pro-ducció d’un dia s’inspecciona al100%sempre que en la inspecció de 12 peces, agafadesa l’atzar de la producció, es trobin tres peces o més de defectuoses. Quina és la probabi-litat que la producció d’un dia s’inspeccioni al100%?

Solucio

Sigui X la variable aleatòria que compta el nombre de peces defectuoses, del conjunt de12 peces agafades a l’atzar. Tenim queX segueix una distribució binomial de paràmetresn= 12 i p= 0.05, és a dir,

X → B(12,0.05).

Aleshores, ens demanenP(X ≥ 3), que calcularem de la manera següent:

P(X ≥ 3) = 1−P(X ≤ 2) = 1−P(X = 0)−P(X = 1)−P(X = 2)

= 0.01956826193.

Problema 4.27 Els accidents de treball que es produeixen en una fàbrica segueixen unprocés de Poisson tal que, en una setmana, la probabilitat que ocorrin 5 accidents és16

15de la que n’ocorrin 2. Calculeu:

(a) El paràmetre de la distribució de Poisson.(b) El mínim nombre natural k tal que P(X ≤ k)≥ 0.4.(c) La probabilitat que no hi hagi cap accident en quatre setmanes.

Solucio

Sigui X la variable aleatòria que compta el nombre d’accidents que hi ha a l’empresaen una setmana. Aquesta variable segueix una distribució de Poisson de paràmetreλ(desconegut), és a dir,

X → P(λ).

(a) Segons l’enunciat del problema

P(X = 5) =1615

P(X = 2),

215

Page 213: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

és a dir,

e−λλ5

5!=

1615

e−λλ2

2!⇔ λ3 =

1615

· 5!2!

= 64 ⇔ λ= 4

(b) Si anem calculantP(X ≤ k), per a diferents valors dek, obtenim:

P(X ≤ 0) = 0.01831563889

P(X ≤ 1) = 0.09157819445

P(X ≤ 2) = 0.2381033056

P(X ≤ 3) = 0.4334701205

Per tant,k= 3.

(c) Si considerem ara un període de 4 setmanes, definim una nova variable aleatòria

Y = X+X+X+X → P(4·4) = P(16).

El que ens demanen ésP(Y = 0), és a dir,

P(Y = 0) = e−16 · 160

0!= e−16 ≈ 1.125351747·10−7

Problema 4.28 Se seleccionen a l’atzar n estudiants (sense reemplaçament) d’una clas-se que conté N estudiants, dels quals M són homes. Sigui X la variable aleatòria quecompta el nombre d’homes.

(a) Suposeu, només per a aquest apartat, que n= 10, N = 25 i M = 18. Descriviu elrecorregut de la variable, és a dir, X(Ω).

(b) Quin valor de n maximitza la variància de X?

Solucio

(a) La variable aleatòriaX segueix una distribució hipergeomètrica de paràmetresN, ni p= M

N, és a dir,

X → H G

(N,n,

MN

).

El recorregut de la variable és

X(Ω) = 3,4,. . . ,10.

Recordeu que, segons els apunts,

X(Ω) = max0,n−Nq,. . . ,minn,Np, on p= MN

i q= 1− p.

216

Page 214: Llibre estadística

Models probabilístics en l’enginyeria

(b) La variància és

VAR(X) = n· MN

· N−MN

· N−nN−1

.

Per a trobar un màxim en funció del paràmetren, derivem respecte d’aquesta variablei igualem a zero:

ddn

VAR(X) =M(N−M)(N−n)−nM(N−M)

N2(N−1)= 0,

que té com a solució

n=N2.

Problema 4.29 Trobeu l’àrea de la corba normal tipificada situada:

(a) a la dreta d’1.76;(b) a l’esquerra d’1.05;(c) entre−1.18 i 1.39;(d) a la dreta de−0.13;(e) a l’esquerra de−1.14;

fent servir les taules de la normal tipificada.

Solucio

La taula només dóna els valors deF(z) = P(Z ≤ z) per az≥ 0. Aleshores, definint perΦ(z) el valor que ens dóna la taula, tenim que

(a) P(Z ≥ 1.76) = 1−P(Z < 1.76) = 1−Φ(1.76) = 1−0.9608= 0.0392.

(b) P(Z ≤ 1.05) = Φ(1.05) = 0.8531.

(c) Les probabilitats que fan referència a valors negatius, en cas de disposar d’una taulade valors només positius, es busquen per simetria. Per exemple,Φ(−1) = 1−Φ(1).

La probabilitat que es demana és:

P(−1.18≤ Z ≤ 1.39) = Φ(1.39)−Φ(−1.18)

= Φ(1.39)− (1−Φ(1.18)) = 0.9177−0.119= 0.7987.

(d) P(Z ≥−0.13) = P(Z ≤ 0.13) = Φ(0.13) = 0.5517.

(e) P(Z ≤−1.14) = 1−P(Z ≤ 1.14) = 1−Φ(1.14) = 1−0.8729= 0.1271.

Problema 4.30 Trobeu el valor de z si l’àrea de la corba normal tipificada que està

(a) entre0 i z és0.0392;

217

Page 215: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) a la dreta de z és0.9292;(c) a l’esquerra de z és0.6480;(d) entre−z i z és0.5934.

Solucio

(a) Busquemz tal queP(0≤ Z ≤ z) = 0.0392. Aleshores,

P(0≤ Z ≤ z) = Φ(z)−Φ(0) = 0.0392,

és a dir,Φ(z) = Φ(0)+0.0392= 0.5392. Podem veure que a la taula no hi ha capvalorz tal queΦ(z) = 0.5392, però podem veure que

Φ(0.09) = 0.5359

Φ(0.10) = 0.5398

Aleshores, per interpolació lineal, tenim que

Φ(0.10)−Φ(0.09)0.10−0.09

=0.5392−Φ(0.09)

z−0.09⇒ z= 0.09846153846

(b) És evident que busquem un valor dezque és negatiu. Anomenem-loz=−α. Ales-hores,

P(Z ≥−α) = P(Z ≤ α) = Φ(α) = 0.9292.

En aquest cas, siα= 1.47, tenim queΦ(1.47) = 0.9292. Per tant,z=−α=−1.47.

(c) Busquem, com abans, un valor dez tal queΦ(z) = 0.6480. En aquest cas, la taulaens dóna directament el valorz= 0.38.

F(z) = 0.6480⇒ z= 0.38

(d) Com que la funció de densitat de la distribució normal tipificada és simètrica res-pecte de l’origen de coordenades, el valorzque busquem és tal que

P(0≤ Z ≤ z) =0.5934

2,

o, el que és el mateix,

P(Z ≤ z) = Φ(z) =0.5934

2+0.5= 0.7967.

Mirant a les taules, podem veure quez= 0.83.

Problema 4.31 L’alçada dels individus en edat militar d’un determinat país segueixuna distribució normal amb mitjanaµ= 170cm i variànciaσ2 = 100cm.

218

Page 216: Llibre estadística

Models probabilístics en l’enginyeria

(a) Calculeu la proporció d’individus que mesuren menys de 150 cm o més de 200 cm.(b) Si no s’admeten per al servei militar tots aquells individus que tenen una talla que

dista més de 30 cm de la talla mitjana, calculeu la proporció d’individus que esrebutja.

(c) Si, per raons de pressupost, es decideix no admetre un20%dels individus en edatmilitar, quins límits d’alçada (centrats en la mitjana) s’han d’escollir?

Solucio

Sigui X la variable aleatòria contínua que mesura l’alçada dels individus en edat militar.Aleshores, tenim queX → N(170,10).

(a) Ens demanenP((X < 150)∪ (X > 200)). Sabem, però, que

P((X < 150)∪ (X > 200)) = 1−P(150< X < 200). Aleshores,

P(150< X < 200) = P

(150−170

10<

X−17010

<200−170

10

)

= P(−2< Z < 3) = FZ(3)−FZ(−2)

= FZ(3)− (1−FZ(2)) = FZ(3)+FZ(2)−1

= 0.9987+0.9772−1= 0.9759

I, finalment,

P((X < 150)∪ (X > 200)) = 1−P(150< X < 200) = 0.0241

(b) El que volem calcular ara és

P(|X−170|> 30) = 1−P(|X−170| ≤ 30) = 1−P(140≤ X ≤ 200)

= 1−P(−3≤ Z ≤ 3) = 1− (FZ(3)−FZ(−3))

= 1− (FZ(3)− (1−FZ(3)))

= 2−2FZ(3) = 2−2·0.9987= 0.0026.

(c) Busquem ara el valora tal que

P(|X−170|> a) = 0.2.

Aleshores,

P(|X−170|> a) = 1−P(|X−170| ≤ a) = 1−P(−a≤ X−170≤ a)

= 1−P(− a

10≤ Z ≤ a

10

)= 1−

(FZ

( a10

)−FZ

(− a

10

))

219

Page 217: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

= 1−(

FZ

( a10

)− (1−FZ

( a10

)))

= 2−2FZ

( a10

)= 0.2.

Això implica que

(b) FZ

( a10

)=

2−0.22

= 0.9

A les taules tenim que

FZ(1.28) = 0.8997

FZ(1.29) = 0.9015

Interpolant, tenim queFZ

(769600

)= 0.9; per tant,

a10

=769600

⇒ a=76960

≈ 12.81667.

Problema 4.32 Un professor d’estadística requereix als seus estudiants una nota de500 punts per aprovar l’assignatura.

(a) Si les notes globals es distribueixen segons una N(485,900), quin percentatged’alumnes aprova?

(b) Si el professor està obligat a aprovar el 60% dels estudiants, quants punts com amolt pot demanar per aprovar?

Solucio

(a) SiguiX → N(485,900) la variable aleatòria de les notes globals. Aleshores,

P(X > 500) = P

(X−485

30>

500−48530

)

= P(Z > 0.5) = 1−Φ(0.5) = 1−0.6915= 0.3085.

(b) Siguix la puntuació mínima per aprovar. Aleshores,

P(X > x) = P

Z >

x−48530︸ ︷︷ ︸

z

= P(Z ≤−z) = Φ(−z) = 0.6.

No hi ha cap valor a la taula de la normal que deixi a l’esquerra una àrea exactamentigual a 0.6. Cal, doncs, tipificar. Si tenim en compte que

220

Page 218: Llibre estadística

Models probabilístics en l’enginyeria

(a)Φ(0.25) = 0.5987

Φ(0.26) = 0.6026

Aleshores,

Φ(0.26)−Φ(0.25)0.26−0.25

=0.6−Φ(0.25)−z−0.25

⇒−z= 0.2533333333

Finalment, destipificant, obtenim

x−48530

=−0.2533333333⇒ x= 477.4

Problema 4.33 El coeficient d’intel·ligència X és una variable aleatòria que es distri-bueix segons una llei N(100,16). Calculeu:

(a) La probabilitat que un individu, escollit a l’atzar, tingui un coeficient inferior a 120.(b) La probabilitat que un individu, escollit a l’atzar, tingui un coeficient entre 90 i 122.

Solucio

(a) P(X < 120) = P

(X−100

16<

120−10016

)= P(Z < 1.25) = 0.8944

(b) P(90< X < 122) = P

(90−100

16< Z <

122−10016

)= P(−0.625< Z < 1.375)

= FZ(1.375)−FZ(−0.625) = FZ(1.375)− (1−FZ(0.625))

= FZ(1.375)+FZ(0.625)−1

El problema que ens trobem és que la taula no ens dóna el valor de nombres ambmés de dues xifres decimals. Cal, per tant, interpolar: Sabem per la taula que

Φ(1.37) = 0.9147,

Φ(1.38) = 0.9162,

Φ(0.62) = 0.7324,

Φ(0.63) = 0.7357.

Aleshores, si interpolem,

FZ(1.375) = Φ(1.37)+Φ(1.38)−Φ(1.37)

1.38−1.37· (1.375−1.37) = 0.91545,

FZ(0.625) = Φ(0.62)+Φ(0.63)−Φ(0.62)

0.63−0.62· (0.625−0.62) = 0.73405.

221

Page 219: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Finalment,

P(90< X < 122) = FZ(1.375)+FZ(0.625)−1= 0.6495.

Problema 4.34 Sigui Z una variable que segueix una distribució normal tipificada. Cal-culeu el valor de a tal que P(|Z|< a) = 0.2386.

Solucio

P(|Z|< a) = P(−a< Z < a) = FZ(a)−FZ(−a) = FZ(a)− (1−FZ(a))

= 2FZ(a)−1= 0.2386.

Aleshores,

FZ(a) =1+0.2386

2= 0.6193

Busquem el valor dea tal queFZ(a) = 0.6193, però la taula de la normal no el dónaexplícitament i cal interpolar. En efecte, sabem, per la taula, que

Φ(0.30) = 0.6179,

Φ(0.31) = 0.6217.

Aleshores,

a= 0.30+0.31−0.30

0.6217−0.6179· (0.6193−0.6179) = 0.3036842105

Problema 4.35 Una empresa té dues màquines. La primera màquina produeix el 40%dels productes i l’altra màquina, la resta dels productes. La probabilitat que un productesigui defectuós és de0.2 si és produït per la primera i de0.1 si ho és per la segona.

(a) S’agafa un lot de tres productes de la mateixa màquina i un és defectuós. Trobeu laprobabilitat que el lot hagi estat produït per la primera màquina.

(b) S’agafa un lot de 1000 productes de la primera màquina. Determineu la probabili-tat que menys de 180 siguin defectuosos.

(c) En el lot de 1000 productes, determineu k, de manera que la probabilitat de tenircom a molt k peces defectuoses sigui de0.1.

Solucio

(a) SiguiA = “lot produït a la primera màquina”, A′ = “lot produït a la segona màqui-na” i B = “un lot de tres productes en té un de defectuós”. Aleshores,

P(A|B) = P(A∩B)P(B)

=P(A)P(B|A)

P(B∩A)+P(B∩A′)=

P(A)P(B|A)P(A)P(B|A)+P(A′)P(B|A′)

222

Page 220: Llibre estadística

Models probabilístics en l’enginyeria

(b) AnomenemXA la variable aleatòria que compta el nombre de productes defectuo-sos d’un lot de 3 productes de la primera màquina, iXA′ els de la segona màquina.Ambdues variables segueixen models binomials:

XA → B(3,0.2)

XA′ → B(3,0.1)

Aleshores,

P(B|A) = P(XA = 1) = 0.384

P(B|A′) = P(XA′ = 1) = 0.243

Finalment,P(A|B) = 0.513026.

(b) SiguiX la variable que determina el nombre de productes defectuosos d’entre 1000produïts a la primera màquina.

P(X < 180) =179

∑i=0

P(X = i) =179

∑i=0

(1000

i

)(0.2)i(0.8)1000−i

Com que aquest càlcul és complicat, emprem elteorema central del límitpertal d’obtenir una bona aproximació de laP(X < 180). Segons aquest teorema,X−E(X)√

VAR(X)s’aproxima a unaN(0,1). Per tant,

P(X < 180) = P

(X−200√

160<

180−200√160

)≈ P(Z <−1.581138)≈ 0.0571,

onZ → N(0,1).

(c) En primer lloc, calculem la probabilitat deD = producte defectuós. D’acord amb lesnotacions de l’apartat (a),

P(D) = P(D∩A)+P(D∩A′) = P(D|A)P(A)+P(D|A′)P(A′) = 0.14

En segon lloc, siguiY la variable que compta el nombre de productes defectuososen un lot de 1000. És clar queY → B(1000,0.14).

Finalment, i en virtut del teorema central del límit

P(Y ≤ k) = P

(Y−140√

120.4≤ k−140√

120.4

)≈ P

Z ≤ k−140√

120.4︸ ︷︷ ︸−z

= 0.1.

Sabem queFz(−z) = 1−F(z). Aleshores, busquem, per interpolació lineal, el valordez tal queFZ(z) = 1−0.1= 0.9. De les taules de la normal, sabem que

223

Page 221: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b)Φ(1.28) = 0.8997,

Φ(1.29) = 0.90147,

Aleshores,

z= 1.28+1.29−1.28

0.90147−0.8997· (0.9−0.8997) = 1.281694915

i d’aquí,

k−140√120.4

=−1.281694915,

cosa que implica que

k= 125.9363547.

Com que la variable original és discreta, prenemk= 126.

Problema 4.36 Demostreu les propietats següents de la distribució normal:

(a) si X → N(µ,σ), aleshores

Y = aX+b → N(aµ+b,|a|σ)

(b) si X → N(µ,σ), aleshores

Y =X−µσ

→ N(0,1)

(c) si X → N(µ1,σ1) i Y → N(µ2,σ2) són dues variables aleatòries normals indepen-dents, aleshores

Z = X+Y → N(µ1+µ2,√σ2

1 +σ22)

Solucio

(a) Pera> 0

FY(y) =P(Y ≤ y) =P(aX+b≤ y) =P

(X ≤ y−b

a

)= FX

(y−b

a

)

De manera que, si derivemFY(y) i FX

(y−b

a

),

fy(y)=fX(

y−ba)

a=

e−(y−b−aµ)2

2a2σ2

√2πa2σ2

I, en conclusió,Y → N(aµ+b,aσ).

224

Page 222: Llibre estadística

Models probabilístics en l’enginyeria

Si ara considerema< 0,

FY(y) =P

(X >

y−ba

)= 1−FX

(y−b

a

)

De manera que, si tornem a derivar, obtenim

fy(y) =− fX

(y−b

a

)

a=

e−(y−b−aµ)2

2a2σ2

√2πa2σ2

Per tant,Y → N(aµ+b,|a|σ).

(b) En aquest cas, tenim que

FY(y) =P(Y ≤ y) =P

(X−µσ

≤ y

)= P(X < σy+µ) = FX(σy+µ)

Derivant totes dues bandes de la igualtat, obtenim

fY(y) = fX(σy+µ)σ=e

−(σy+µ−µ)22σ2

√2πσ2

σ =e

−y2

2

√2π

→ N(0,1)

(c) ConsideremX′ = X−µ1, Y′ =Y−µ2 i el canvi de variable

ϕ(X′,Y′) 7→ (X′+Y′,X′) = (U ,V).

La seva inversa ésϕ−1(U ,V) = (V,U −V). Aleshores,

f(U ,V)(u,v) = f(X′,Y′)(v,u−v) · |J(ϕ−1)|= fX′(v) fY′(u−v) =e

−v2

2σ21

√2πσ2

1

e−(u−v)2

2σ22

√2πσ2

2

=e− v2+(u−v)2

4σ21σ

22

√(2π)2σ2

1σ22

La densitat deU = X′+Y′ es calcula com,

fu =∫ ∞

−∞

e−

v2+(u−v)2

4σ21σ

22

√(2π)2σ2

1σ22

dv=∫ ∞

−∞

e−

(σ21+σ

22)

v−σ2

2

σ21 +σ

22

u

2

2σ21σ

22

−u2

2(σ21+σ

22)

√(2π)2σ2

1σ22

dv

=e− u2

2(σ21+σ

22)√

∫ ∞

−∞

e

(v−

σ22

σ21+σ

22

u

)2

2

σ21σ

22

σ21 +σ

22

√2πσ2

1σ22

dv

225

Page 223: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Bo i observant que la integral es pot entendre com la de la densitat d’una

N(

σ22

σ21+σ

22u,√

σ21σ

22

σ21+σ

22

), multiplicada per la constant 1√

(σ21+σ

22)

–, obtenim

fu =e− u2

2(σ21+σ

22)

√2π(σ2

1+σ22)

,

cosa que implica que

U → N(

0,√σ2

1 +σ22

)

Finalment, com que la densitat que ens interessa és la deZ = X+Y =U +µ1+µ2,per l’apartat (a) podem concloureZ → N(µ1+µ2,

√σ2

1 +σ22).

Problema 4.37 Comproveu que, donada X→ N(µ,σ), la variable Y= eX → ln(µ,σ)

Solucio

FY(y) = P(Y ≤ y) =P(eX ≤ y) =P(X ≤ ln(y)) =FX(ln(y))⇒ fY(y) = fX(ln(y))1y

=e−

(ln(y)−µ)22σ2

y√

2πσ2

Problema 4.38 Es defineix la funció gamma d’Euler per aβ > 0 com

Γ(β) =∫ ∞

0xβ−1e−x dx

(a) Demostreu queΓ(β+1) = βΓ(β).(b) Demostreu que, per a totα> 0, β > 0, la funció

γα,β(x) =

0, x≤ 0

1Γ(β)

αβxβ−1e−αx, x> 0

és una densitat.Una variable aleatòria que te aquesta densitat es diu que segueix una distribuciógamma(α,β)

(c) Calculeu-ne l’esperança i la variància.(d) Demostreu que una exponencial de paràmetreα i una distribució khi quadrat amb

n graus de llibertat tenen una distribució gamma. Quins són els seus paràmetres?

226

Page 224: Llibre estadística

Models probabilístics en l’enginyeria

Solucio

(a) Integrant per parts,

Γ(β+1) =∫ ∞

0xβe−x dx=

[−xβe−x

]∞

0+∫ ∞

0βxβ−1e−x dx

= 0+∫ ∞

0βxβ−1e−x dx= βΓ(β)

(b)∫ ∞

0γα,β(x) dx=

∫ ∞

0

1Γ(β)

αβxβ−1e−αx dx=αβ

Γ(β)

∫ ∞

0xβ−1e−αx dx

Fent el canviy= αx, obtenim

αβ

Γ(β)

∫ ∞

0

β−1

e−y dyα

=αβ

Γ(β)αβ

∫ ∞

0yβ−1e−y dy=

Γ(β)Γ(β)

= 1

(c) E(X) =∫ ∞

0xγα,β(x) dx=

αβ

Γ(β)

∫ ∞

0xβe−αx dx

=αβ

Γ(β)

∫ ∞

0

β

e−y dyα

=αβΓ(β+1)Γ(β)αβ+1

α

Fent el canviy= αx, com en el càlcul anterior i per la propietat de l’apartat (a), escomprova fàcilment que

E(X2) =β(β +1)α2

.

Per tant,

VAR(X) = E(X2)− (E(X))2 =β

α2

(d) SiguiX → E (α), amb fX(x) =

αe−αx, x> 0

0, altrament

Com que

Γ(1) =∫ ∞

0e−x dx= 1,

tenim que una variable aleatòriaγ(α,1) té per funció de distribució la mateixa queX.

Si Y → χ2n , aleshoresY → γ

12

, n2

227

Page 225: Llibre estadística

Hola

Page 226: Llibre estadística

Mostreig i estimació

“Statistics may be defined as a body of methods formaking wise decisions in the face of uncertainty.”

W. A. Wallis, 1912-1998.

L’explicació de fenòmens per mitjà de l’estadística parteix d’observacions, igual que lafísica o la química. La dificultat amb què es troba aquesta ciència és que, en general,es desconeix la llei estadística que modelitza o podria modelitzar amb fiabilitat allò quees pretén estudiar. Per exemple, l’observació de les alçàries d’una població no indica sies distribueixen seguint una llei normal, khi quadrat (χ2) o exponencial, i tampoc ambquins paràmetres. La teoria de mostreig i la d’estimació i contrast d’hipòtesi o inferènciaestadística tenen per objectiu formalitzar o descartar models a partir de les observacions,és a dir, trobar descripcions estadístiques de la realitat.

5.1. Mostra aleatoria simple

Siguiξ una experiència aleatòria qualsevol iΩ el conjunt de resultats possibles. Repetimn vegadesξ en igualtat de condicions, de manera que l’espai de resultats esdevéΩn.Aleshores, donadaX : Ω→R variable aleatòria real, definim unamostra aleatòria simplede midan de la variableX com

Y = (X1,. . . ,Xn) : Ωn → Rn

w = (w1,. . . ,wn) →Y(w1,. . . ,wn) = (X1(w),. . . ,Xn(w)) = (X(w1),. . . ,X(xn))

Observem que la mostra és una variable aleatòria. Cada realització de la mostra, és adir, cada observació d’aquesta, l’anomenemmostra vulgaris. Tot i aquesta distinció for-mal, en general s’utilitza el termemostraper referir-se tant al vector com als valors ques’obtenen d’aplicar-lo a un determinatw ∈ Ωn.

Per exemple, consideremX la variable aleatòria que a cada persona li assigna el seu pes.Aleshores, una mostra de grandària 10 de la variableX és una variable aleatòria que

229

Page 227: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

assigna el seu pes a 10 persones i que, per tant, donat unvector de 10 persones, dónaun vector de 10 pesos. Lamostra vulgarisés un d’aquests vectors de 10 pesos particularque s’obté en escollir 10 persones. És a dir, la mostra aleatòria és la funció, i lamostravulgaris la imatge d’un dels elements del domini de la mostra.

Podem considerar, per tant,X1,X2,. . . ,Xn comn variables aleatòries independents que esdistribueixen segons la mateixa lleiX. Es defineix la funció de densitat de la mostra com

f (x1,. . . ,xn) = f (x1) f (x2) · · · f (xn).

5.2. Llei forta dels grans nombres

Sigui X1,. . . ,Xn una mostra aleatòria simple d’una variable aleatòriaX. Denotem perE(Xi) = E(X) = µ i perVAR(Xi) =VAR(X) = σ2. Anomenemmitjana mostralla vari-able aleatòria

Xn =

n

∑i=1

Xi

n

Aleshores, es compleix que

limn→∞

Xn = µ

La definició de límit en aquest context es refereix a convergència de successions devaribles aleatòries de formaquasisegura. Diem que una successióYn de variables ale-atòries convergeix de forma quasisegura aY quan n tendeix a infinit si i només siP(w| limn→∞ Xn(w) = X(w)) = 1. Es nota per lim

n→∞Yn =Y q.s.

A la pràctica, aquesta convergència significa que la successió tendeix a distribuir-se comla variable límit.

5.3. Teorema central del lımit

Siguin X1,X2,. . . ,Xn variables aleatòries independents, les mitjanes i variàncies de lesquals sónµ1,µ2,. . . ,µn i σ2

1,σ22,. . . ,σ

2n, respectivament. Aleshores, denotant perµ i σ2

E(X1+X2+ · · ·+Xn) = µ1+µ2+ · · ·+µn = µ

VAR(X1+X2+ · · ·+Xn) = σ21 +σ

22 + · · ·+σ2

n = σ2

es compleix que

limn→∞

X1+X2+ · · ·+Xn−µσ

→ N(0,1)

Per al cas particular queX1,. . . ,Xn sigui una mostra d’una variableX, el teorema centraldel límit s’expressa com

230

Page 228: Llibre estadística

Mostreig i estimació

limn→∞

Xn−E(X)σ√n

→ N(0,1)

onXn és la mitjana mostral.

Observem que el teorema permet conèixer la distribució aproximada deXn, fet que és degran importància en la inferència estadística, com veurem en seccions posteriors.

Cal destacar que el concepte de límit és diferent del de la llei forta dels grans nombres. Sibé a la pràctica ambdues permeten aproximar successions de variables, el teorema centraldel límit proporciona una convergència més feble que la llei forta dels grans nombres: laconvergència en llei. Diem que una successió de variables aleatòriesYnn tendeix en lleiaY quann tendeix a infinit si i només siFYn

(y)→ FY(y) quann tendeix a infinit.

5.4. Problemes d’inferencia estadıstica

En molts problemes estadístics, la distribució de probabilitat que segueixen les dadesexperimentals és completament coneguda, llevat del valor d’un o més paràmetres. Perexemple, es podria saber que la vida mitjana d’un electrodomèstic segueix una llei expo-nencial amb paràmetreλ, sense conèixer-ne el valor exacte. A partir de les dades i altresinformacions rellevants de què es disposi, és possible determinar una aproximació delvalor desconegut del paràmetreλ, o un interval en el qual es pensi que probablement estrobi aquest valor. Aquest tipus de problemes d’estadística s’anomenenproblemes para-mètrics.

En altres problemes, la mateixa distribució de les dades és una incògnita: es tracta delsanomenatsproblemes no paramètrics. En la majoria de problemes reals, existeix unnombre infinit de distribucions possibles diferents que podrien haver generat les dades.Analitzant-les, s’intenta conèixer la distribució de la mostra per tal de realitzar inferèn-cies sobre determinades propietats d’aquella i determinar la versemblança relativa quecada distribució possible té de ser la correcta. Un exemple important de problema noparàmetric són els estudis econòmics sobre la distribució de renda dels individus a par-tir de les dades estadístiques de què es disposa (enquestes, declaració de la renda, etc.).L’economista planteja, en primer lloc, possibles funcions de densitat que podria seguirla renda, generalment lleis de tipus normal, log-normal o Weibull, i n’estudia després elsparàmetres.

5.5. Estadıstics i estimadors

Sigui X la variable aleatòria que controla una característica determinada d’una població(edat, pes, alçària, color dels ulls...). SiguiΩ l’espai mostral, és a dir, el conjunt de resul-tats que pot prendre una mostra aleatòria simple de midan: x1,x2,. . . ,xn. Un estadístic Tés una funció

T : Ω −→ Rk

(x1,. . . ,xn) −→ T(x1,. . . ,xn)

231

Page 229: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Per tant, els estadístics són variables aleatòries, i la sevadistribució depèn de la variableX. Per exemple, si disposem d’una mostrax= (x1,. . . ,xn), les funcionsT1(x) = x1+ · · ·+xn i T2 = maxx1,. . . ,xn són estadístics.

Suposem que la distribució de la variableX és coneguda, llevat del valor d’un paràmetreθ . Un estimadorde θ és un estadístic que serveix per determinar-ne el valor a partird’uns valorsx1,x2,. . . ,xn.

5.6. Propietats dels estimadors

Centratge o no esbiaixament

Una de les propietats més importants que se solen exigir als estadístics és que no pre-sentin biaix. Donat un estimadorT del paràmetreθ , diem que ésno esbiaixatsi, per atotan, onn és la grandària de la mostra, es compleix que

E(T) = θ .

Si, a més, l’estimador verifica que

limn→∞

E(T) = θ

diem que ésasimptòticament no esbiaixat.

Consistencia

Diem que un estimador és consistent si és asimptòticament no esbiaxiat i, a més, el límitde la seva variància quann tendeix a infinit és zero. És a dir,

limn→∞

E(T) = θ ,

limn→∞

VAR(T) = 0.

Exemple 5.1 Per exemple, donada una mostra X1,. . . ,Xn d’una variable X→ N(µ,σ),

l’estadístic Y= 1n

n

∑i=1

Xi és un estimador consistent deµ. En efecte, observem que

E(Y) =1n

n

∑i=1

E(Xi) =1n

n

∑i=1

µ= µ

VAR(Y) = VAR

(1n

n

∑i=1

Xi

)=

1n2

n

∑i=1

VAR(Xi) =σ2

n⇒ lim

n→∞VAR(Y) = 0.

Suficiencia

Suposem que, en un problema d’estimació, es disposa de dos estimadors,T1 i T2, peral paràmetreθ , tals queT1 pot operar amb els valors de les observacionsX1,X2,. . . ,Xn

232

Page 230: Llibre estadística

Mostreig i estimació

d’una mostra aleatòria, mentre queT2 només pot saber el valor d’un determinat estadísticA= g(X1,. . . ,Xn). És clar queT1 pot ser qualsevol funció de les observacions mentre queT2 només pot ser una funció deA. En general,T1 pot oferir una millor estimació deθ queT2. Tanmateix, en alguns problemes pot ser queT2 pugui estimar tant correctament comT1. En aquest tipus de problemes,A detalla, d’alguna manera, tota la informació rellevantcontinguda en la mostra per a estimarθ . Un estadísticA que compleix aquesta propietates diu que éssuficient per al paràmetreθ .

Teorema 5.3 (de factorització)Sigui X1,. . . ,Xn una mostra aleatòria d’una distribucióamb funció de densitat (funció de probabilitat, si és discreta) fθ (x) = f (x,θ), on el valordeθ és desconegut. Sigui L(θ) = L(X1,. . . ,Xn,θ) la seva funció de versemblança, és adir, L(X1,. . . ,Xn,θ) = ∏n

i=1 f (xi,θ).

Un estadístic T= g(X1,. . . ,Xn) és un estimador suficient per aθ si i només si la funcióL(X1,. . . ,Xn,θ) es pot factoritzar com

L(X1,. . . ,Xn,θ) = u(X1,. . . ,Xn)v(T,θ)

on les funcions u(X1,. . .Xn) i v(T,θ) són no negatives.

Exemple 5.2 Per mitjà del teorema de factorització, determineu un estadístic suficientper al paràmetreθ de la funció de densitat d’una variable aleatòria Rayleigh

f (x,θ) =2θ 2

xe−x2

θ2

Suposant que es disposa d’una mostra aleatòria de grandària n i definint T= ∑ni=1 X2

i , apartir de la mostra es calcula

f (x1,. . . ,xn) =n

∏i=1

f (xi,θ) =

(2θ 2

)n( n

∏i=1

xi

)e−

1θ2 t

Si es factoritza f(x1,. . . ,xn) = v(t,θ)u(x1,. . . ,xn), definint

u(x1,. . . ,xn) =n

∏i=1

xi i v(t,θ) =

(2θ 2

)n

e−1θ2 t ,

pel teorema de factorització queda demostrat que T és suficient per aθ .

Eficiencia

Donat un estimadorT deθ , definim la funció de risc com

RT(θ) = E [(T −θ)2]

Observem que, en cas queT sigui no esbiaixat, aleshores

RT(θ) =VAR(T).

DonatsT1 i T2 dos estimadors deθ no esbiaixats, diem queT1 ésmillor o més eficientqueT2, si i només si

233

Page 231: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

RT1(θ)≤ RT2

(θ)

Diem que un estimadorT no esbiaixat deθ és UMV (uniformement de la mínima vari-ància) si la seva variància (o funció de risc) és mínima, és a dir, si no existeix cap estima-dorT2 deθ no esbiaixat tal queVAR(T2)<VAR(T1). L’objectiu de la teoria d’estimacióclàssica és trobar estimadors UMV, ja que són els que poden proporcionar estimacionsmés fiables.

5.7. Informacio de Fisher en una variable aleatoria

Sigui X una variable aleatòria amb funció de densitat (funció de probabilitat si és dis-creta) f (x,θ), on el valor deθ és desconegut, i sigui

l(x,θ) = ln( f (x,θ)).

Definim la informació de Fisher de la variable aleatòriaX per al paràmetreθ com

I(θ) = Eθ

([∂

∂θl(x,θ)

]2)

La informació de Fisher és una manera de mesurar la quantitat d’informació que aportauna variable aleatòriaX sobre el paràmetre desconegutθ , del qual també depèn la sevafunció de densitat.

Propietats

(i) Eθ

(∂

∂θl(x,θ)

)= 0

(ii) I(θ) =−Eθ

(∂ 2

∂θ 2l(x,θ)

)

(iii) Donada una mostra aleatòriaX1,. . . ,Xn, In(θ) = nI(θ)

Demostració

(i) Recordem que, donada una transformacióg(X) de la variableX, es compleix que

E(g(X)) =∫

R

g(x) f (x,θ)dx

o bé

E(g(X)) =n

∑i=1

g(xi)P(X = xi)

234

Page 232: Llibre estadística

Mostreig i estimació

per a variables discretes. Aleshores,

(∂

∂θl(x,θ)

)=∫

R

(∂

∂θl(x,θ)

)f (x,θ)dx

=

R

1f (x,θ)

(∂

∂θf (x,θ)

)f (x,θ)dx

=

R

∂∂θ

f (x,θ)dx

=∂

∂θ

R

f (x,θ)dx︸ ︷︷ ︸

1

=∂

∂θ(1) = 0

La demostració és anàloga per al cas discret.

D’aquesta propietat, es desprèn queI(θ) =Vθ (l(x,θ)).

(ii) Eθ

(∂ 2

∂θ 2l(x,θ)

)= Eθ

(∂ 2

∂θ 2ln( f (x,θ))

)

= Eθ

(−1

f (x,θ)2

[∂

∂θf (x,θ)

]2

+1

f (x,θ)· ∂ 2

∂θ 2f (x,θ)

)

=−∫

R

1f (x,θ)2

[∂

∂θf (x,θ)

]2

f (x,θ)dx+∫

R

1f (x,θ)

· ∂ 2

∂θ 2f (x,θ) f (x,θ)dx

=−∫

R

1f (x,θ)

[∂

∂θf (x,θ)

]2

dx︸ ︷︷ ︸

I(θ )

+∂ 2

∂θ 2

R

f (x,θ)dx︸ ︷︷ ︸

1

=−I(θ)

Exemple 5.3 Donada una mostra aleatòria simple X1,. . . ,Xn d’una variable X→P(λ),la informació de Fisher per aλ continguda a la mostra es calcula trobant primer la con-tinguda en una observació i després, en virtut de la tercera propietat, multiplicant per n.

En primer lloc, determinem el logaritme de la funció de versemblança:

L(X,λ) = e−λλx

x!⇒ ln(L) =−λ+xln(λ)− ln(x!).

En segon lloc, la informació de Fisher per a una observació és

I(λ) =−E

(∂ 2 ln(L)

∂λ2

)=−E

(−xλ2

)=

1λ2

E(x) =1λ

Finalment, la informació continguda a la mostra és In(λ) = nI(λ) =nλ

.

235

Page 233: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Desigualtat de Cramér-Rao. SiguiT = r(X1,. . .Xn) un estimador no esbiaixat deg(θ),ong és una funció derivable. Aleshores,

VARθ (T)≥(g′(θ))2

I(θ)

Demostració. D’una banda, apliquem la desigualtat de Cauchy-Schwartz a les variables

T −g(θ) i l(x,θ) =∂

∂θln f (x,θ):

|Eθ [(T −g(θ))(l(x,θ))]| ≤√

Eθ [(T −g(θ)]2Eθ [l(x,θ)]2 ≤√

VARθ (T)I(θ)

D’altra banda, calculemEθ

[(T −g(θ))

(∂

∂θl(x,θ)

)]:

Eθ ((T −g(θ))

(∂

∂θl(x,θ))

)= Eθ

(T · ∂

∂θl

)−g(θ)Eθ

(∂

∂θl

)

=

R

T∂

∂θ(l(x,θ)) f (x,θ) dx−g(θ)

R

∂∂θ

(l(x,θ)) f (x,θ) dx

=

R

T1

f (x,θ)

(∂

∂θf (x,θ)

)f (x,θ) dx−g(θ)

R

1f (x,θ)

(∂

∂θf (x,θ)

)f (x,θ) dx

=∂

∂θ

R

T f(x,θ) dx−g(θ)∂

∂θ

R

f (x,θ) dx

=∂

∂θEθ (T) = g′(θ)

Finalment, combinant els dos resultats,

g′(θ)≤√

VARθ (T)I(θ) ⇒ VARθ (T)≥(g′(θ))2

I(θ)

Els estimadors que satisfan la desigualtat de Cramér-Rao s’anomeneneficientsi sónUMV. No obstant això, poden haver-hi estimadors UMV que no siguin eficients.

5.8. Estimadors de la maxima versemblanca

Suposem que les variables aleatòriesX1,. . . ,Xn constitueixen una mostra aleatòria d’unadistribució discreta o d’una distribució contínua amb funció de probabilitat o funció dedensitatf (x,θ), onθ és un paràmetre o un vector paramètric desconegut que pertany aun espai paramètricΘ.

Donada una observació de la mostra, és a dir, uns certs valorsx1,. . . ,xn, sembla raonableestimar el paràmetreθ de manera que aquests valors siguin com més probables millor.

236

Page 234: Llibre estadística

Mostreig i estimació

És a dir, suposant que la probabilitat d’observarx1,. . . ,xn és molt alta quanθ = θ0 i moltbaixa per a d’altres valors deθ ∈ Θ, és lògic estimarθ ambθ0, llevat que disposemd’alguna informació addicional que desaconselli aquesta estimació. Donats, doncs, unsvalorsx1,. . . ,xn, aquest raonament ens porta a considerar un valor deθ de manera que lafunció de versemblançaL(x1,. . . ,xn,θ) de la mostra sigui màxima i utilitzar aquest valorcom a estimació del paràmetre.

Sigui θ(X1,. . . ,Xn) un estimador deθ . Diem que és de lamàxima versemblançasi inomés si

L(x1,. . . ,xn, θ(x1,. . . ,xn)) = supθ∈Θ

L(x1,. . . ,xn,θ)

Equacions de la màxima versemblança

Sigui X1,. . . ,Xn una mostra aleatòria amb funció de versemblançaL(X1,. . . ,Xn,θ), onθés un paràmetre desconegut, i tal queL > 0 i de classeC 2. Per la positivitat deL, podemdefinir l(X1,. . . ,Xn,θ) = ln(L(X1,. . . ,Xn,θ)). Com que el logaritme és una funció bijecti-va, maximitzarl(X1,. . . ,Xn,θ) en funció deθ és equivalent a maximitzarL(X1,. . . ,Xn,θ).

Anomenemequacions de la màxima versemblançales equacions

∂∂θi

l(X1,. . . ,Xn,θ) = 0.

La solució de les equacions de la màxima versemblança proporciona els extrems de lafunció de versemblança. El màximθ(X1,. . . ,Xn), en cas que existeixi, és estimador de lamàxima versemblança deθ .

Teorema 5.4 (Principi d’invariància) Si θ(X1,. . .Xn) és estimador de la màxima ver-semblança deθ i g és una funció bijectiva, aleshores g(θ(X1,. . .Xn)) és estimador de lamàxima versemblança de r= g(θ).

Demostració. Sigui h(r) la funció inversa deg(θ). Aleshores,θ = h(r) i la funció deversemblança de la mostra queda expressada comL(X1,. . . ,Xn,h(r)). Per definició, l’es-timador de la màxima versemblança ˆr der serà el que maximitziL(X1,. . . ,Xn,h(r)). Atèsque L(X1,. . . ,Xn,θ) és màxima quanθ = θ(X1,. . . ,Xn), resulta queL(X1,. . . ,Xn,h(r))esdevindrà màxima quanh(r) = θ(X1,. . . ,Xn), és a dir, quanr = g(θ(X1,. . . ,Xn)). Pertant,

r(X1,. . . ,Xn) = g(θ(X1,. . . ,Xn)).

5.9. Estimadors pel metode dels moments

Donada una mostra aleatòria de la qual es volen estimark paràmetres, elmètode delsmomentsconsisteix a igualar elsk primers moments teòrics de la variable aleatòria ambels moments mostrals. S’obté així un sistema dek equacions la solució del qual són elsestimadors buscats. En general, els estimadors trobats a partir d’aquest procediment sónconsistents, però solen presentar biaix i no acostumen a ser de la mínima variància.

237

Page 235: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

5.10. Estimacio per intervals de confianca

A les seccions anteriors, s’han exposat diferents mètodes d’estimar un paràmetre donant-ne un valor aproximat, és a dir, unaestimació puntual. En aquesta secció, es tracta l’ano-menadaestimació per intervals, en la qual no es dóna un sol punt, sinó un interval, sobreel qual es pot afirmar que el valor real del paràmetre hi pertany amb una certa confiança.

Donada una mostra aleatòria simpleX1,. . . ,Xn d’una distribució amb paràmetreθ devalor desconegut, suposem que és possible trobar dos estadísticsA(X1,. . . ,Xn) i B(X1,. . . ,Xn) tals que

Pθ (A(X1,. . . ,Xn)≤ θ ≤ B(X1,. . . ,Xn)) = γ

onγ ∈ (0,1) és una probabilitat fixa. Si els valors observats deA(X1,. . . ,Xn) i B(X1,. . . ,Xn) són a i b, respectivament, aleshores es diu que l’interval[a,b] és uninterval deconfiançaper aθ amb un grau de confiançaγ, és a dir, queθ pertany a l’interval[a,b]amb unaconfiançaγ.

5.11. Construccio d’intervals de confianca

Estimacio de la mitjana en poblacions normals amb variancia coneguda

Es disposa d’una mostraX1,. . . ,Xn d’una variableX → N(µ,σ), ambσ coneguda. Atèsque se’n vol estimar la mitjanaµ, es considera l’estadístic mitjana mostralX per a laconstrucció de l’interval de confiança. Per les propietats de la normal, es té que

Z =X−µσ√n

→ N(0,1).

Trobar un interval amb nivell de confiançaγ= 1−α per al paràmetreµ equival a trobar,donada la simetria de la distribució normal,z tal que

P(−z≤ Z ≤ z) = γ

En efecte, observem que

P(−z≤ Z ≤ z) = P

(−z≤ X−µ

σ√n

≤ z

)= P

(X−z

σ√n≤ µ≤ X+z

σ√n

)= γ

Per trobar el valor dez, es consulta a les taules de distribució de laN(0,1) el valorz tal

queF(z) = 1− α2

. Aleshores, es compleix que

F(z)−F(−z) = F(z)− (1−F(z)) = 1− α2− α

2= 1−α= γ

i, per tant,P(−z≤ Z ≤ z) = γ.

238

Page 236: Llibre estadística

Mostreig i estimació

En definitiva, donats uns valors observatsx1,. . . ,xn, l’interval de confiança de nivellγ peraµ és

[x−z

σ√n

, x+zσ√n

]

Estimacio de la mitjana en poblacions normals amb variancia desconeguda

Per a la construcció de l’interval, no podem fer servir l’expressió anterior ja que no enconeixem la variància poblacional. Així doncs, ens cal un resultat previ sobre el compor-tament de l’estimadorS2 de la variància poblacional, conegut com elteorema de Fisher.

Teorema 5.5 (Teorema de Fisher)Sigui X1,. . . ,Xn una mostra aleatòria simple d’unavariable aleatòria X→ N(µ,σ). Aleshores,

n

∑i=1(Xi −X)2

σ2= (n−1)

S2

σ2→ χ2

n−1.

Aquest últim resultat també s’expressa com

S2

σ2→ χ2

n−1

n−1.

En conseqüència, i notant perS=√

S2,

T =X−µ

S√n

=X−µ

√∑n

i=1(Xi−X)2

n−1√n

=

X−µσ√n√

∑ni=1(Xi−X)2

σ2(n−1)

→ tn−1,

ja que és el quocient entre una variable amb distribucióN(0,1) i l’arrel quadrada d’u-na distribucióχ

2n−1

n−1. Per la simetria de la distribuciót de Student, trobar un interval de

confiança de nivellγ= 1−α per aµ equival a trobarδ tal que

P(−δ ≤ T ≤ δ) = P

(−δ ≤ X−µ

S√n

≤ δ)

= γ

El valorδ és tal queF(δ)= 1− α

2, pel mateix raonament que en el cas anterior. Per trobar-

lo cal consultar les taules de lat de Student amb els graus de llibertat que correspongui.

Aïllant µ de l’expressió anterior, obtenim que l’interval de confiança és

[x−δ s√

n, x+δ

s√n

]

on x i s són els valors que prenen els estadísticsX i S, avaluant-los en les observacionsx1,. . . ,xn.

239

Page 237: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Estimacio de la variancia en poblacions normals

S’utilitza l’estadístic

(n−1)S2

σ2

que es distribueix seguint una distribucióχ2n−1.

Donat un nivell de confiançaγ = 1−α, cal trobar a les taules de laχ2n−1 els valorsχ2

a iχ2

b tals que

F (χ2a) =

α

2i F (χ2

b) = 1− α2.

S’obté que

P

(χ2

a ≤ (n−1)S2

σ2≤ χ2

b

)= 1−α= γ

i, aïllantσ2,

P

((n−1)S2

χ2b

≤ σ2 ≤ (n−1)S2

χ2b

)= γ

En conclusió, l’interval de confiança de nivellγ per aσ2, donats els valors observatsx1,. . . ,xn, és

[(n−1)s2

χ2b

,(n−1)s2

χ2a

],

on s2 és el valor de l’estimador avaluat enx1,. . . ,xn.

Estimacio de la diferencia de mitjanes en poblacions normalsamb variancies conegudes

SiguinX1,. . . , Xn i Y1,. . . , Ym dues mostres aleatòries independents de dues distribucionsX → N(µ1,σ1) i Y → N(µ2,σ2). Per tal de construir un interval de confiança de nivellγ= 1−α deµ1−µ2, es considera l’estadístic

D =X−Y− (µ1−µ2)√

σ21

n+ σ2

2

m

→ N(0,1)

Tal i com hem vist en exemples anteriors, per determinar l’interval cal trobar el valorztal que

P(−z≤ D ≤ z) = 1−α.

240

Page 238: Llibre estadística

Mostreig i estimació

Això es pot fer aprofitant queD segueix una distribució normalN(0,1) i la seva simetria.Aleshores, el valor dezés tal que

FD(z) = P(D ≤ z) = 1− α2.

Aïllant µ1−µ2,

P(−z≤ D ≤ z) = P

−z≤ X−Y− (µ1−µ2)√

σ21

n+ σ2

2

m

≤ z

= P

(X−Y−z

√σ2

1

n+σ2

2

m≤ µ1−µ2 ≤ X−Y+z

√σ2

1

n+σ2

2

m

)

= 1−α

L’interval de confiança, donats uns valorsx1,. . . , xn, y1,. . . , ym, és

[x−y−z

√σ2

1

n+σ2

2

m, x−y+z

√σ2

1

n+σ2

2

m

]

Estimacio de la diferencia de mitjanes en poblacions normalsamb variancies desconegudes

En aquest cas, es disposa de dues mostres com les anteriors, però amb variància no cone-guda. Es poden donar dues situacions: que les variàncies siguin iguals (homocedasticitat)o que siguin diferents.

Variàncies iguals

Quan les variàncies són iguals, és a dir,σ2X = σ2

Y = σ2, podem estimarσ a partir del’estimador

S2 =(n−1)S2

X +(m−1)S2Y

σ2→ χ2

n+m−2

on SX i SY són els estimadors de la variància mostral per a la mostraX1,. . . ,Xn i Y1,. . . ,Yn,respectivament.

Per construir l’interval de confiança deσ2, es considera l’estadístic

T =X−Y− (µ1−µ2)√1n+ 1

m

√(n−1)S2

X+(m−1)S2Y

(n−1)+(m−1)

=X−Y− (µ1−µ2)

S√

1n+ 1

m

→ tn+m−2

241

Page 239: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Per la simetria de lat de Student, cal trobarδ tal que

P(−δ ≤ T ≤ δ) = 1−α.

Aïllant µ1−µ2,

P(−δ ≤ T ≤ δ) = P

−δ ≤ X−Y− (µ1−µ2)

S

√1n+

1m

≤ δ

= P

(X−Y−δS

√1n+

1m

≤ µ1−µ2 ≤ X−Y+δS

√1n+

1m

)

= 1−α

L’interval que en resulta és

[x−y−δs

√1n+

1m

, x−y+δs

√1n+

1m

].

Variàncies desiguals

Quan les variàncies no són iguals, l’estadístic que s’utilitza és

T =X−Y− (µ1−µ2)√

S2X

n+ S2

Y

m

→ tp.

La llei que segueix és unatp, però elsp graus de llibertat no es poden determinar a priori;se’n fa un tractament aproximat. Es pren el nombre enter més proper a

p=( s2

X

n+ s2

Y

m)2

(s2X/n)2

n−1+ (s2

Y/n)2

m−1

.

Es pot comprovar que

0≤ n+m−2− p≤ maxn−1,m−1.

El nombre enter positiu∆ = n+m−2− p s’anomenaterme correctori la seva interpre-tació és la següent: si la primera població té una variància molt més gran que la primerai n= m, aleshoress2

X ≫ s2Y i ∆ ≈ m−1, de manera quep= n−1, i els graus de lliber-

tat depenen de la precisió amb què estimem la variància de la primera població. Si lesvariàncies d’ambdues poblacions són similars i també les grandàries mostrals, el termecorrector s’anul.la i estem en el cas anterior. Finalment, si les grandàries mostrals sónmolt diferents i, per exemple,n≫ m, el terme corrector és elevat i els graus de llibertatde lat es redueixen.

242

Page 240: Llibre estadística

Mostreig i estimació

L’interval de confiança que resulta, donats uns valorsx1,. . . ,xn,y1,. . . ,ym, és

[x− y−δ

√s2

x

n+

s2Y

m, x− y+δ

√s2

x

n+

s2Y

m

]

i δ és el valor que fa

P(−δ ≤ T ≤ δ) = 1−α

onT → tp.

Estimacio del quocient entre variancies de poblacions normals

SiguinX1,. . . ,Xn i Y1,. . . ,Ym dues mostres aleatòries independendents. Per estimar el quo-cient entre les variànciesσ

2X

σ2Y, utilitzem l’estadístic

F =(S2

X/σ2X)

(S2Y/σ

2Y)

→ Fn−1,m−1

Donat un nivell de confiançaγ= 1−α, cal buscar en les taules de la distribució de FisherFn−1,m−1 els valorsu1 i u2 tals que

F(u1) =α

2i F(u2) = 1− α

2.

D’aquesta manera,

P(u1 ≤ F ≤ u2) = P

(u1 ≤

(S2X/σ

2X)

(S2Y/σ

2Y)

≤ u2

)

= P

(S2

X

S2Y

1u2

≤ σ2X

σ2Y

≤ S2X

S2Y

1u1

)

= 1−α

L’interval de confiança construït a partir de les observacionsx1,. . . ,xn i y1,. . . ,yn serà

[s2

X

s2Y

1u2

,s2

X

s2Y

1u1

].

Estimacio de la mitjana en poblacions sense normalitat

Sigui X1,. . . ,Xn una mostra aleatòria d’una població que es distribueix sense normalitat.En cas que la variància sigui coneguda, per construir l’interval de confiança de la mitjanautilitzem l’estadístic

Z =X−µσ√n

243

Page 241: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Com que no hi ha normalitat, la llei que segueix l’estadístic no és coneguda. Tanmateix,en virtut del teorema central del límit,Z s’aproxima a unaN(0,1) per an grans –a lapràctica,n > 30. Considerant, doncs, queZ → N(0,1), l’estadístic es construeix de lamateixa manera que per al cas de poblacions normals.

Si la variància és desconeguda, aleshores l’estadístic que s’utilitza és

T =X−µ

S√n

Novament, la seva llei és desconeguda, però per an grans (es prenn> 100) s’aproximaa unaN(0,1) i l’interval es pot determinar com en el cas de normalitat.

Problemes resolts

Problema 5.1 Sigui X1,. . . ,X20 una mostra aleatòria simple d’una variable X amb fun-ció de densitat

fX(x) =

2x, x∈ [0,1]

0, altrament

Sigui S=20

∑i=0

Xi. Calculeu la probabilitat P(S≤ 10) utilitzant el teorema central del límit.

Solucio

Pel teorema central del límit, sabem que, siXi és una successió den variables aleatòriesindependents i idènticament distribuïdes, aleshores

Sn−nµ√nσ

→ N(0,1)

En aquest problema,

µ = E(X) =

∫ 1

0x ·2x dx=

23

σ2 = VAR(X) = E(X2)− (E(X))2 =

∫ 1

0x2 ·2x dx− 4

9=

118

Finalment,

P(S20 ≤ 10) = P

S20−20µ√20σ︸ ︷︷ ︸

Z→N(0,1)

≤ 10−2023√

20√

118

≈ P(Z ≤−

√10)≈ 0.0007821.

244

Page 242: Llibre estadística

Mostreig i estimació

Problema 5.2 Demostreu, mitjançant el teorema central del límit, que

limn→∞

e−nn

∑k=0

nk

k!=

12.

Indicació: Estudieu la distribució d’una suma de variables de Poisson de paràmetre 1.

Solucio

ConsideremX → P(λ) i prenem una mostra de midan: X1,. . . ,Xn.

D’una banda, denotant perSn =n

∑i=0

Xi, pel teorema central del límit tenim que

P(Sn ≤ n) = P

Sn−nλ√nλ︸ ︷︷ ︸

Z→N(0,1)

≤ n−nλ√nλ

→ P

(Z ≤

√n

1−λ√λ

).

Prenentλ= 1, obtenim

P(Sn ≤ n)→ P(Z ≤ 0) =12.

D’altra banda,X1+ . . .+Xn → P(nλ) = P(n). Per tant,

P(Sn = k) =e−nnk

k!

Finalment, en virtut dels dos resultats que hem obtingut,

P(Sn ≤ n) =n

∑k=0

P(Sn = k) = e−nn

∑k=0

nk

k!→ P(Z ≤ 0) =

12

,

om hem fet servir el símbol→ per indicar la convergència en llei quann tendeix a infinit.

Problema 5.3 Es realitza l’experiència aleatòria de llançar una moneda a l’aire. SiguiX la variable aleatòria que val 1 si surt cara i 0 si surt creu. Sigui X1,. . . ,X1000 una mostra

aleatòria de la variable X, i sigui S=1000

∑i=1

Xi. Calculeu:

(a) La probabilitat que490≤ S≤ 510.(b) L’interval [a,b] centrat en 500, que compleixi que P(S∈ [a,b]) = 0.95.

Solucio

(a) Pel teorema central del límit,S−1000· 1

2√10001

2

≈−→ N(0,1). Per tant,

P(490≤ S≤ 510)≈ P

(490−500√

100012

≤ Z ≤ 510−500√10001

2

)

= P(−0,63≤ Z ≤ 0.63) = 0.4714, onZ → N(0,1).

245

Page 243: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) Aproximant pel teorema central del límit com a l’apartat anterior, tenim

0.95= P(S∈ [a,b])≈ P

(Z ∈

[a−500√1000·0.5

,b−500√1000·0.5

]),

cosa que implica quea= 469 ib= 531.

Problema 5.4 Donades X1,X2,. . . ,Xn → N(µ,σ) i X =∑n

i=1 Xi

nla mitjana mostral, con-

sidereu els estimadors deσ2 següents:

S2 =1

n−1

n

∑i=1

(Xi −X

)2

σ2 =1n

n

∑i=1

(Xi −X

)2

σ2∗ = δ

(n

∑i=1

(Xi −X

)2)

(a) Calculeu el biaix dels estimadors.(b) Calculeu la variància de l’estimador S2.(c) Trobeu el valor deδ que minimitza l’error quadràtic, és a dir, E[(σ2

∗ −σ2)2].

Solucio

(a) E(S2) = E

(1

n−1

n

∑i=1

(Xi −X)2

)

=1

n−1E

(n

∑i=1

[X2

i −2XXi +X2])

=1

n−1E

(n

∑i=1

X2i −2X

n

∑i=1

Xi +nX2)

=1

n−1E

(n

∑i=1

X2i −nX

2)

=1

n−1

(n(σ2+µ2)−n

(σ2

n+µ2

))= σ2

on hem utilitzat que l’esperança és un operador lineal i queE(X2i ) = VAR(Xi)+

(E(Xi))2 = σ2+µ2.

E(σ2) = E

(n−1

nS2

)=

n−1nσ2

E(σ2∗) = E(δ(n−1)S2) = δ(n−1)σ2

246

Page 244: Llibre estadística

Mostreig i estimació

(b) Pel teorema de Fisher,

∑ni=1(Xi −X)2

σ2→ χ2

n−1 ⇒VAR

(∑n

i=1(Xi −X)2

σ2

)=VAR(χ2

n−1) = 2(n−1).

Aleshores,

VAR

(n

∑i=1

(Xi −X)2

)= 2(n−1)σ4.

Per tant,

VAR(S2) =2σ4

n−1

(c) E [(σ2∗ −σ2)2] = E((σ2

∗)2−2σ2

∗σ2+σ4)

= 2(n−1)δ2σ4+(δ(n−1)σ2)2−2δ(n−1)σ4+σ4

= n2δ2σ4−δ2σ4−2nδσ4+2δσ4+σ4

Derivant l’expressió anterior i igualant-la a zero (condició d’extrem), obtenim

δ =1

n+1

Problema 5.5 Siguinα1 i α2 dos estimadors independents i sense biaix deα, amb vari-ànciesσ2

1 i σ22, respectivament.

(a) Comproveu queα3 = (1−a)α1+aα2 és estimador deα no esbiaixat per a tot a∈R.(b) Trobeu el valor dea que minimitza la variància deα3.

Solucio

(a) E(α3) = E((1−a)α1+aα2) = (1−a)α+aα= α

(b) VAR(α3) =VAR((1−a)α1+aα2) = (1−a)2σ21 +aσ2

2

Derivant la variància respecte dea i igualant-la a zero per imposar que el valor deasigui extrem obtenim

a=σ2

1

σ21 +σ

22

Problema 5.6 Sigui X → U [0,b], amb b desconegut, i X1,. . . ,Xn una mostra de X. Esconsideren els estimadors

B1 maxX1,X2,. . . ,XnB2 = 2X

B3 =n+1

nmaxX1,X2,. . . ,Xn

247

Page 245: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Calculeu el biaix dels estimadors.(b) Demostreu queB3 és millor estimador queB2.

Solucio

(a) Calculem la funció de densitat deB1:

P(B1 ≤ t) = P(X1 ≤ t,X2 ≤ t,. . . ,Xn ≤ t)

=( t

b

)n

,t ∈ [0,b]⇒ fB1= n

tn−1

bn,t ∈ [0,b].

Aleshores,

E(B1) =

∫ b

0n

tn

bndt =

nn+1

b

E(B2) = E

(2

∑ni=0 Xi

n

)=

2n

n

∑i=0

E(Xi) =2n

nb2= b

E(B3) = E

(n+1

nB1

)= b

(b) Com que tantB2 com B3 són no esbiaixats, en determinem el millor estimadorcomparant la seva variància:

VAR(B2) = VAR(2X)

= 4VAR

(∑n

i=0 Xi

n

)

=4n2

n

∑i=0

VAR(Xi)

=4n2

b2

12=

b2

3n2

VAR(B3) = E(B23)− (E(B3))

2

=

(n+1

n

)2∫ b

0n

tn+1

bndt −b2

=

(n+1

n

)2 nb2

n+2−b2 =

b2

n(n+2)

Per tant, com queVAR(B2)>VAR(B3), és millor estimadorB3.

Problema 5.7 Sigui X → N(0,σ). Transformeu Y=∑n

i=0 |Xi|n

perquè sigui estimador

no esbiaixat deσ.

248

Page 246: Llibre estadística

Mostreig i estimació

Solucio

E(|Xi|) =∫ ∞

−∞|x| fX(x) dx

= 2∫ ∞

0x fX(x) dx

= 2∫ ∞

0x

e−x2

2σ2

√2π

dx

= 2∫ ∞

0t

e−t2

2

√2πσdt =

√2√πσ

on hem aplicat el canvi de variablet =xσ

.

En conclusió, l’estimadorσ∗ =√π√2Y és no esbiaixat.

Problema 5.8 Demostreu que els estimadors següents són suficients per als paràmetresque s’especifiquen:

(a) Donada una mostra de mida n d’una distribució de Bernoulli, amb paràmetre p

desconegut, T=n

∑i=1

Xi.

(b) Donada una mostra de mida n d’una N(µ,σ), amb paràmetreµ desconegut,

T =n

∑i=1

(Xi −µ)2.

Solucio

(a) La funció de versemblança de la mostra és

L(X1,. . . ,Xn, p) =n

∏i=1

P(Xi = xi)

=n

∏i=1

pxi (1− p)1−xi

= p∑ni=1 xi (1− p)n−∑n

i=1 xi

= pT(1− p)n−T

Prenem

u(X1,. . . ,Xn) = 1

v(T, p) = pT(1− p)n−T ,

i, pel teorema de factorització, queda provat queT és suficient.

249

Page 247: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(b) En aquest cas, la funció de versemblança de la mostra és

L(X1,. . . ,Xn,µ) =n

∏i=1

fXi(xi)

=n

∏i=1

e−(xi−µ)2

2σ2

√2πσ2

=

(1√

2πσ2

)n

e−∑n

i=1(xi−µ)2

2σ2

Prenem

u(X1,. . . ,Xn) =

(1√

2πσ2

)n

v(T, p) = e−∑n

i=1(xi−µ)2

2σ2 ,

i novament, pel teorema de factorització, queda provat queT és suficient.

Problema 5.9 Sigui X1,. . . ,Xn una mostra aleatòria d’una variable contínua que té perfunció de densitat

f (x) =

θxθ−1, 0< x< 1

0 altrament

onθ > 0 desconegut. Trobeu un estimador suficient per aθ .

Solucio

Per 0< xi < 1, la funció de versemblança de la mostra és

L(X1,. . . ,Xn,θ) =n

∏i=1

fXi(xi) = θ

n

(n

∏i=1

xi

)θ−1

Si algun dels valorsxi es troba fora de l’interval(0,1), la funció de versemblança és 0per a totθ . Observeu que prenent

u(X1,. . .Xn) = 1

v

(n

∏i=1

xi ,θ

)=

(n

∏i=1

xi

)θ−1

,

la funció de versemblança queda expressada com el producte deu perv.

En conclusió, pel teorema de factorització, l’estadísticT =n

∏i=1

xi és suficient per aθ .

250

Page 248: Llibre estadística

Mostreig i estimació

Problema 5.10 Donada una mostra X1,X2,. . . ,Xm → B(n, p), trobeu un estimador de ppel mètode de màxima versemblança.

Solucio

La funció de versemblança de la mostra és

L(X1,. . . ,Xm) =m

∏i=1

P(Xi = xi)

Per trobar l’estimador ˆpdeppel mètode de la màxima versemblança, cal que ˆpmaximitziln(L). Això és:

ddp

ln(L) = 0

Aleshores,

ddp

(m

∑i=1

ln

(nxi

)+ ln(p)

m

∑i=1

xi + ln(1− p)m

∑i=1

(n−xi)

)= 0⇔ p=

1m ∑m

i=1 xi

n

Per tant, l’estimador que buscàvem és

p=1m ∑m

i=1 xi

n

Problema 5.11 Sigui X → G (p) i x1,. . . ,xn una mostra aleatòria simple. Trobeu un es-timador de p pel mètode dels moments i pel mètode de la màxima versemblança.

Solucio

Per trobar l’estimadorp1 pel mètode dels moments, igualem la mitjana mostral a la mit-jana deX:

x= E(X) =1− p

p⇔ p(x+1) = 1⇔ p=

11+x

En conclusió,

p1 =1

1+x

Per calcular l’estimadorp2 pel mètode de la màxima versemblança, ens cal conèixerprimer la funció de versemblança:

L(x1,. . . ,xn) =m

∏i=1

P(Xi = xi)

=m

∏i=1

(1− p)xi p= (1− p)∑mi=1 xi pn

251

Page 249: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Maximitzem ara ln(L),

ddp

ln(L) =−∑m

i=1 xi

1− p+

np= 0⇔ p=

nn+∑m

i=1 xi

=1

1+x

Així doncs, l’estimador és

p2 =1

1+x

Problema 5.12 Sigui X1,. . . ,Xn una mostra aleatòria simple, amb funció de densitat deXi:

f (x,θ) =

(θ +1)xθ , 0< x< 1

0, altrament

Trobeu un estimador deθ pel mètode dels moments i pel mètode de la màxima versem-blança.

Solucio

Per obtenir l’estimador pel mètode dels moments, cal igualar l’esperança deX amb lamitjana mostral:

E(X) =

∫ 1

0(θ +1)xθ+1 =

θ +1θ +2

= x

Aïllant θ , obtenim l’estimador

θm =1

1−x−2

Pel de màxima versemblança, calculem primer la funció de versemblança:

L =n

∏i=1

f (xi,θ)

=n

∏i=1

(θ +1)xθi 1(1>xi>0)

= (θ +1)n(x1 ·x2 · · ·xn)θ1(min xi>0)1(max xi<1)

Prenent logaritmes, obtenim

ln(L) = nln(θ +1)+θn

∑i=1

ln(xi)

252

Page 250: Llibre estadística

Mostreig i estimació

Derivant l’expressió respecte deθ i igualant la derivada a zero per tal de trobar l’extrem(màxim), obtenim que l’estimador de màxima versemblança és

θmv =−n

n

∑i=1

ln(xi)

−1

Problema 5.13 Sigui X una variable aleatòria que estudia una determinada caracterís-tica d’una població, amb funció de densitat:

fX(x) =

2(θ −x)θ 2

, 0≤ x≤ θ

0, altrament

Trobeu l’estimador del paràmetreθ pel mètode dels moments i estudieu si presenta biaix.

Solucio

Per trobarθm, igualem l’esperança deX al primer moment de la mostra, és a dir, a lamitjana mostralx:

E(X) =∫ θ

0x

2(θ −x)θ 2

dx=2θ 2

[θx2

2− x3

3

0

3= x

Per tant,θm = 3x

Per veure si té biaix, en calculem l’esperança:

θm = E(3x)= 3E

(1n

n

∑i=0

Xi

)= 3E(x) = θ

Així doncs, l’estimador no té biaix.

Problema 5.14 Sigui una mostra X1,X2 . . . ,Xn →U [α−β ,α+β ].

(a) Calculeu la funció de versemblança L(x1,. . . ,xn,α,β) de la mostra i descriviu laregió

R= (α,β) ∈ R2| L(x1,. . . ,xn,α,β) 6= 0

(b) Trobeu els estimadors de màxima versemblança deα i β .

Solucio

(a) Recordem quefXi(xi) =

12β

, x∈ [α−β ,α+β ]

0, altrament

253

Page 251: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Aleshores, la funció de versemblança és

L(x1,. . . ,xn,α,β) =n

∏i=0

12β

1(xi)[α−β ,α+β ] =

(1

)n

1(xmax)[α−β ,α+β ]1(xmin)[α−β ,α+β ]

Denotant perx(n) el màxim valor de la mostra i perx(1) el mínim valor, la regióRqueda definida com

R= (α,β) ∈ R2|x(n) ≤ β+α, x(1) ≥ α−β

(b) Els estimadors de la màxima versemblança han de ser tals que la funcióL siguidiferent de 0, ja que aleshores

L =

(1

)n

.

Prenem els que corresponen al punt de tall de les dues desigualtats, és a dir:

βmv =x(n)−x(1)

2αmv =

x(n)+x(1)2

Problema 5.15 Sigui X1,. . . ,Xm una mostra aleatòria d’una variableB(n, p).

(a) Trobeu l’estimador de la màxima versemblançapmv de p i comproveu que no tébiaix.

(b) Calculeu la fita de Cramér-Rao. Éspmv eficient? És UMV?

(c) Trobeu l’estimador de la màxima versemblança de l=p

1− p.

Solucio

(a) La funció de versemblança de la mostra és

L(X1,. . . ,Xm) =m

∏i=1

P(Xi = xi)

Per trobar l’estimador ˆp de p pel mètode de la màxima versemblança, cal que ˆpmaximitzi ln(L). Això és,

ddp

ln(L) = 0

Aleshores,

ddp

(m

∑i=1

ln

(nxi

)+ ln(p)

m

∑i=1

xi + ln(1− p)m

∑i=1

(n−xi)

)= 0⇔ p=

1m ∑m

i=1 xi

n

254

Page 252: Llibre estadística

Mostreig i estimació

Per tant, l’estimador que buscàvem és

p=1m ∑m

i=1 xi

n

Vegem que no té biaix, calculant-ne l’esperança:

E(p) = E

( 1m ∑m

i=1 xi

n

)=

1n

E(X) = p

(b) Calculem la informació de Fisher:

Im(p) = −E(θ)

(∂ 2

∂ p2l(x1,. . . ,xm, p)

)

= −E

(∑m

i=0 Xi

p2− mn−∑m

i=0 Xi

(1− p)2

)

=mnpp2

+mn

(1− p)2− mnp

(1− p)2=

mnp(1− p)

Aleshores, la cota de Cramér-Rao és

CCR=1mn

p(1−p)

=p(1− p)

mn

Per veure si és eficient i/o UMV, cal calcular la variància de l’estimador:

VAR(p) = VAR

( 1m ∑m

i=1 Xi

n

)

=1

m2n2VAR

(m

∑i=1

Xi

)

=m

m2n2VAR(X)

=p(1− p)

mn

En conclusió, com que assoleix la CCR, l’estimador és eficient i UMV.

(c) Pel principi d’invariància,lmv =p

1− p

Problema 5.16 Donats els pesos de8 nois de 16 anys:58,50,60,65,64,62,56,57, i su-posant que el pes es distribueix segons una variable normal:

255

Page 253: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(a) Trobeu l’interval de confiança al0.95 de la mitjana sabent queσ = 3.(b) Trobeu l’interval de confiança al0.9 per la mitjana siσ és desconeguda.

Solucio

(a) SiguiX la variable aleatòria que dóna el pes d’un noi de 16 anys. Tenim que, per auna mostraX1,. . . ,Xn, la mitjana mostral

X → N

(µ,σ√n

)⇒ X−µ

σ√n

→ N(0,1)

Aleshores, per tal de determinar l’interval de confiança, ens cal trobarδ tal que

P

(−δ ≤ X−µ

σ√n

≤ δ)

= P(−δ ≤ N(0,1)≤ δ) = 0.95

Mirant les taules de probabilitat de laN(0,1), obtenim queδ = 1.96. Així doncs,tenim que

−1.96≤ X−µσ√n

≤ 1.96⇒ µ ∈[X−1.96

σ√n

,X+1.96σ√n

],

amb probabilitat 0.95. Finalment, substituint pels valors de l’enunciat, l’intervaldemanat és[56.9211,61.0788].

(b) Com que es desconeixσ, cal estimar-la a partir de

σ =

√∑n

i=1(Xi −X)2

n−1.

Pel teorema de Fisher, tenim que

σ2 n−1σ2

→ χ2n−1

Aleshores,X−µσ√n

=X−µ√

∑ni=1(Xi−X)2

n−1√n

=

X−µσ√n√

∑ni=1(Xi−X)2

σ(n−1)

→ tn−1

Raonant com abans, cal trobarδ complint:

P

(−δ ≤ X−µ

σ√n

≤ δ)

= P(−δ ≤ tn−1 ≤ δ) = 0.9

Consultant les taules det7, s’obtéδ= 0.9. Aïllantµ com a l’apartat anterior, trobemque l’interval demanat és[55.7371,62.2628].

256

Page 254: Llibre estadística

Mostreig i estimació

Problema 5.17 Sigui X1,. . . ,Xn una mostra aleatòria simple d’una variable aleatòriaX →N(µ,4). Trobeu n perquè[X−1,X+1] sigui un interval de confiança deµ de nivell0.95.

Solucio

Per l’exercici anterior, tenim que l’interval de confiança de nivell 0.95 és de la forma

[X−1.96

σ√n

,X+1.96σ√n

]

Per tant,

1.964√n= 1⇔ n= 61.465

Com que ha de ser un nombre natural, prenemn= 62.

Problema 5.18 Les notes en un determinat test de50 punts es distribueixen segons unadistribució N(30,σ). S’agafen10exàmens a l’atzar i s’obté

110

10

∑i=1

(Xi −30)2 = 12.4.

Trobeu l’interval de confiança amb nivell0.9 per aσ.

Solucio

Tenim que

∑10i=1(Xi −30)2

σ2→ χ2

10

Siguiα = 1−0.9= 0.1, i denotem perχ210,α2

i χ210,1−α2

els punts de manera que la proba-bilitat acumulada ésα

2i 1− α

2, respectivament. Aleshores l’interval que busquem és tal

que

P

(χ2

10,α2≤ ∑10

i=1(Xi −30)2

σ2≤ χ2

10,1−α2

)= P

(∑10

i=1(Xi −30)2

χ210,α2

≤ σ2 ≤ ∑10i=1(Xi −30)2

χ210,1−α2

)

= 0.9

Substituint pels valors de l’enunciat i consultant les taules de la distribucióχ210, obtenim

que l’interval perσ2 és[6.77,31.47]. Per tant, el deσ resulta[2.6,5.61].

Problema 5.19 En un laboratori, s’han fet cinc mesuraments de les quantitats de me-talls pesants en un determinat material de construcció i s’han obtingut els resultats:

257

Page 255: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

5.2,4.8,5.3,5.7 i 5.0 mg. Determineu els intervals de confiança, amb nivell de0.95, dela mitjana i de la variància, assumint normalitat.

Solucio

Per l’interval de confiança deµ, considerem l’estadístic

X−µS√n

→ tn−1, onS=

√∑n

i=1(Xi −X)2

n−1

Per la simetria de lat de Student, l’interval ha de ser de la forma[−δ,δ], onδ és tal que

P

(−δ ≤ X−µ

S√n

≤ δ)

= P(−δ ≤ tn−1 ≤ δ) = 0.95

Considerant les dades de l’enunciat i quen = 5, obtenimδ = 2.2776. L’interval deconfiança és[4.855,5.545].

Per aσ2, apliquem el mateix raonament que a l’exercici anterior. S’obté l’interval[0.041,0.9576].

Problema 5.20 Un material s’empaqueta en caixes per a dos prove´dors X i Y . Elspesos de les caixes X es distribueixen segons una N(µX,0.07) i els de Y, segons unaN(µY,0.04). Una mostra de100caixes de X dóna una mitjana de0.99 kg i una mostrade300de Y, una mitjana de1.01 kg. Determineu l’interval de confiança per aµX −µY

al 0.9.

Solucio

L’estadístic que utilitzem per fer l’interval és

D =X−Y− (µX −µY)√

0.072

100+ 0.042

300

→ N(0,1)

Cal trobarz tal que

P(−z≤ D ≤ z) = 0.9⇒ z= 1.645

Aïllant µX −µY de l’expressió anterior, obtenim

P

(X−Y−1.645

√0.072

100+

0.042

300≤ µ1−µ2 ≤ X−Y+1.645

√0.072

100+

0.042

100

)

= 0.9

L’interval de confiança, donats els valors observatsX = 0.99 i Y = 1.01, és[−0.0321,−7.88·10−3].

258

Page 256: Llibre estadística

Mostreig i estimació

Problema 5.21 Sigui X1,. . . ,Xn una mostra aleatòria d’una distribució exponencial ambmitjana τ. Trobeu el valor de n per tal que l’interval de confiança, al nivel del 95%obtingut utilitzant la desigualtat de Txebitxev per la mitjana poblacional, sigui

[20X21

,20X19

].

Solucio

Per la desigualtat de Txebitxev, tenim que

P(|X−E(X)| ≥ k

√VAR(X)

)≤ VAR(X)

k2VAR(X)=

1k2

Per tant,

1−P(|X−E(X)| ≤ k

√VAR(X)

)≤ 1

k2⇒ P

(|X−E(X)| ≤ k

√VAR(X)

)≥ 1− 1

k2

Com queE(X) = E(X) = τ i VAR(X) =τ2

n, tenim que

P

(|X−τ| ≤ k

τ√n

)≥ 1− 1

k2⇒ P

(−kτ√

n≤ X−τ≤ kτ√

n

)

= P

(X

1+ k√n

≤ τ≤ X1− k√

n

)≥ 1− 1

k2

de manera que l’interval que proporciona la desigualtat de Txebitxev és

[X

1+ k√n

,X

1− k√n

].

Atès que el nivell de confiança ha de ser 0.95, tenim que

1− 1k2

= 0.95⇒ k≈ 4.4721

Finalment, perquè l’interval coincideixi amb el que proposa l’enunciat, cal que

2021

=1

1+ k√n

⇒ n≈ 8000

259

Page 257: Llibre estadística

Hola

Page 258: Llibre estadística

Contrast d’hipòtesi

“[Statistics are] the only tools by which an opening can be cutthrough the formidablethicket of difficulties that bars the path of those who pursue the Science of Man.”

Francis Galton, citat al llibreThe Life, Letters and Labours of Francis Galton, de Karl Pearson (1914).

6.1. Proves d’hipotesi parametriques

En moltes ocasions, els problemes estadístics no són determinar el valor d’un paràmetreθ desconegut, sinó comprovar si aquest és contingut o no en un determinat subconjuntde l’espai paramètricΩ al qual pertany. Per exemple, en la secció anterior hem vist que,per estimar la diferència de mitjanes de dues poblacionsX i Y sota normalitat, ens calconèixer si les variàncies poden ser considerades iguals o no, és a dir, siθ = σ2

X/σ2Y pot

ser considerat igual a 1 o no. Una estimació deθ no ens proporciona prou informaciója que, fins i tot essent iguals les variàncies, la probabilitat que les variàncies observadessiguin iguals és 0. Per això, ens cal aplicar les eines que proporciona la teoria de contrastd’hipòtesi.

Hipòtesi nul·la i alternativa

Suposem que es pot descompondreΩ en dos subconjunts disjuntsΩ0 i Ω1, i que l’esta-dístic ha de determinar si el valor desconegut deθ pertany aΩ0 o bé aΩ1. Es defineixen

H0 : θ ∈ Ω0 (hipòtesi nul·la)

H1 : θ ∈ Ω1 (hipòtesi alternativa)

Com que els subconjuntsΩ0 i Ω1, coneguts com aregió crítica, són disjunts i la seva unióésΩ, exactament una i només una de les hipòtesis és certa. L’estadístic ha de decidir siacceptaH0 o bé la rebutja i acceptaH1. Quan el conjuntΩi = θ0, es diu que la hipòtesiéssimple. Quan conté més d’un valor, es diu que la hipòtesi éscomposta.

261

Page 259: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Els problemes de decisió estadística en què existeixen nomésdues opcions s’anomenendecontrast d’hipòtesi.

Errors de primera i segona espècie

Sempre que es realitza un contrast d’hipòtesi es poden cometre dos tipus d’error:

(i) Error de primera espècie: rebutjar la hipòtesi nul·laH0 malgrat que sigui certa. Lafunció que defineix l’error és

α1 : Ω0 → [0,1]

θ 7→ Pθ (Ω1)

(ii) Error de segona espècie: acceptarH0 quan és falsa, és a dir, quanθ ∈ Ω1. La funcióque el defineix és

α2 : Ω1 → [0,1]

θ 7→ Pθ (Ω0)

El supremα de la probabilitat de cometre un error de primera espècie, és a dir, el supremdeα1, s’anomenanivell de significaciódel test. El valorφ = 1−β , onβ és el supremde la probabilitat de cometre un error de segona espècie, s’anomenapotènciadel test.Observem que sempre hi haurà la possibilitat de cometre algun dels dos errors, ja quel’única manera que l’error de primera espècie o de segona sigui sempre 0 és acceptant orebutjant sempre.

Donat un nivell de significacióα, diem que un procediment de constrastδ ésunifor-mement més potent(UMP) si la seva potència és més gran o igual que la de qualsevolaltre procediment per al mateix problema amb el mateix nivell de significació. L’objec-tiu de l’estadístic és trobar procediments UMP amb baixos nivells de significació, és adir, aquells pels quals les probabilitats de cometre errors siguin molt petites.

L’estratègia per construir un test d’hipòtesi, coneguda com aestratègia Neyman-Pearson,consisteix a fixar un cert nivell de significacióα i intentar minimitzarβ . En general, sesol prendreα = 0.05 oα = 0.01, de manera que la fiabilitat del test és del 95% o del99%, respectivament.

Construcció de contrasts per intervals de confiança

Un dels procediments més habituals per resoldre proves d’hipòtesi és construint la regiód’acceptació mitjançant un interval de confiança. L’interval pot ser fitat o no, depenentdel tipus de constrast.

Problema de contrast bilateral

Anomenemproblema de contrast bilaterala les proves d’hipòtesi paramètriques en quèles hipòtesis són

H0 : θ = θ0

H1 : θ 6= θ0

262

Page 260: Llibre estadística

Contrast d’hipòtesi

Per a la construcció d’un test de significació 1−γ per a aquests problemes amb intervalsde confiança, es prenen dos estadístics,T1(X) i T2(X), tals que

Pθ (x∈ Ω‖ T1(x)≤ θ ≤ T2(x)) = γ

Aleshores, es considera com a regió d’acceptació

A0 = x∈ Ω | T1(x)≤ θ0 ≤ T2(x)

és a dir, les observacionsx tals que l’interval de confiança del paràmetre conté el parà-metre vertader.

En efecte, comprovem que aleshores

α= Pθ0(Ac

0) = Pθ0(x∈ Ω | θ0 6∈ [T1(x),T2(X)]) = 1−γ

Per decidir si s’accepta o no la hipòtesi nul·la, s’avaluen els estadísticsT1(X) i T2(X) i escomprova siθ0 pertany a l’interval que determinen o no.

Exemple 6.1 Donada una N(µ,σ) ambσ coneguda, es planteja decidir siµ = µ0 obé µ 6= µ0, essent la primera la hipòtesi nul·la i la segona, l’alternativa. El nivell designificació que es desitja és de0.95.

Per construir un test per a aquest problema de decisió, prenem l’estadístic

Tn(X) =Xn−µ0

σ√n

Com que la mostra és normal, Tn(x) → N(0,1) sota H0. Construïm, doncs, l’interval deconfiança a un nivell de0.95per a la mitjana, que al capítol anterior s’ha vist que és

[xn−1.96

σ√n

, xn+1.96σ√n

].

Finalment, la regió d’acceptació és

A0 =

x | xn−1.96

σ√n≤ µ0 ≤ xn+1.96

σ√n

Problema de contrast unilateral

Anomenemproblema de contrast unilateralles proves d’hipòtesi paramètriques en quèles hipòtesis són d’una de les dues formes següents:

H0 : θ ≤ θ0 H0 : θ > θ0

H1 : θ > θ0 H1 : θ ≤ θ0

Per a la construcció d’un test de significació 1−γ per a aquests problemes amb intervalsde confiança, es pren un estadísticT(X), amb el qual es construeix una regió d’acceptacióde la forma

263

Page 261: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

A0 = x ∈ Ω | T(x)≤ θ0 o béA0 = x ∈ Ω | T(x)> θ0

tal quePθ0(A0) = 1−γ.

Exemple 6.2 Considereu el problema de decidir, donada X→ N(µ,σ) ambσ cone-guda, si la mitjanaµ és més gran o no que un determinat valorµ0, amb un nivell designificació de0.95. Es tracta de resoldre el contrast

H0 : µ≤ µ0

H1 : µ> µ0

Prenem l’estadístic

Tn(X) =Xn−µ0

σ√n

Si µ=µ0, aleshores Tn(X) →N(0,1). En cas que sigui certa la hipòtesi nul·la, aleshoresl’estadístic Tn(X) pren valors més petits com més petita ésµ, ja que sabem, per la lleidels grans nombres, queXn → µ i, com queµ ≤ µ0, el valor serà negatiu. De maneraque la regió d’acceptació serà tal que Pµ0

(Tn(x)≤ δ) = 0.95. Com que Tn(X) →N(0,1),essentµ= µ0, tenim queδ = 1.64. Finalment, la regió d’acceptació és

A0 = x∈ Ωn | Tn(x)≤ 1.64 .

Observem que, en efecte, el test és del nivell triat:

Pµ≤µ0(Ac

0) = Pµ≤µ0

Xn−µ0

σ√n

> 1.64

≤ Pµ0

Xn−µ0

σ√n

> 1.64

= P(N(0,1)> 1.64) = 0.05.

Construcció de contrasts segons la metodologia Neyman-Pearson

L’estratègia de Neyman-Pearson serveix per resoldre tests d’hipòtesi de la forma

H0 : θ = θ0

H1 : θ = θ1

Denotem perL0(x) la funció de versemblança sotaH0, és a dir,L(x,θ0), i per L1(x) lafunció de versemblança sotaH1. Siguiα el nivell de significació del test. Aleshores,

A0 =

x ∈ Ωn | L1(x)

L0(x)≤ c

on c és tal quePθ0(Ac

0) = α, defineix la regió d’acceptació d’un test UMP per al contrastplantejat, amb nivell de significacióα.

Cal destacar que no sempre és possible trobar un tal valorc.

264

Page 262: Llibre estadística

Contrast d’hipòtesi

Test de la raó de versemblança

El test de la raó de versemblança és una de les eines més potents de la teoria de provesd’hipòtesi paramètriques. És especialment útil per resoldre problemes d’hipòtesis com-postes, és a dir, del tipus

H0 : θ ∈ Θ0

H1 : θ ∈ Θ1

on Θ0 ∪Θ1 = Θ, i Θ és l’espai paramètric que conté el conjunt de valors possibles quepot prendreθ .

Definim

L(x,Θ0) = supθ∈Θ0

L(x,θ)

L(x,Θ) = supθ∈Θ

L(x,θ)

Aleshores, en cas que existeixin i siguin mesurables, s’anomenaraó de versemblançaelseu quocient:

λ(x) =L(x,Θ0)

L(x,Θ)

El test de raó de versemblança per al contrast plantejat amb nivell de significacióα ésaquell que té com a regió d’acceptació

A0 = x ∈ Ωn | λ(x)≥ c

onc és tal quePθ (Ac0)≤ α, per a totθ ∈ Θ0.

És clar que per construir aquest test cal conèixer la llei deλ(x) sotaH0, fet que pot noser possible.

Observació 6.1Si existeix un estimadorθmv de màxima versemblança per aθ , aleshoresL(x,Θ) = L(x, θmv).

6.2. Proves d’hipotesi no parametriques

A les seccions anteriors d’estimació i contrast d’hipòtesi, s’ha suposat que les observaci-ons procedien d’una mostra la funció de distribució de la qual era coneguda, encara quecalia determinar el valor d’algun dels seus paràmetres. Malauradament, en general no esconeix a priori com es comporten les poblacions que es volen estudiar: no se’n coneixla distribució, no se sap si realment dues mostres són independents entre elles o no, etc.En aquests casos, cal dur a terme proves d’hipòtesi no paramètriques, que són aquellesque tenen per objectiu determinar propietats de la població sense suposar o sense haverdeterminat quina és la seva distribució.

265

Page 263: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Proves khi quadrat

Sigui X una gran població que consisteix enn objectes dem tipus diferents i siguipi

la probabilitat que un objecte seleccionat a l’atzar sigui del tipusi, on i = 1,. . . ,m. Ésclar que 0< pi < 1 i ∑m

i=1 pi = 1. Es diu que una tal variableX segueix una distribuciómultinomialM (n,m; p1,. . . , pm). Denotant perni el nombre d’objectes de l’i-èsim tipus,observem que, donatsni tals que∑m

i=1 ni = n, es compleix que

P(X = (n1,. . . ,nm)) =n!

n1! · · ·nm!pn1

1 · · · pnm

m

Siguin p01,. . . , p0

m uns valors possibles per ap1,. . . , pm, pels quals es vol contrastar

H0 : (p1,. . . , pm) = (p01,. . . , p0

m)

H1 : (p1,. . . , pm) 6= (p01,. . . , p0

m)

És a dir, es vol esbrinar siX → M(n,m; p01,. . . , p0

m). Per resoldre-ho, es pren l’estadístic

D(X) =m

∑i=1

(ni −np0i )

2

np0i

Observem queD(X) mesura la suma dels quadrats de la diferència entre el valor obser-vat ni i l’esperat sotaH0, dividits pel valor esperat. Per tant, siH0 és certa, és d’esperarque el valor deD(X) sigui petit. Per això, donat un nivell de confiançaα, la regió d’ac-ceptació del test és

A0 = x= (n1,. . . ,nm)|D(x)≤ c,

on el valor dec es troba imposant que el test sigui de nivellα, és a dir, que es compleixi

PH0(Ac

0)≤ α.

Per trobar el valorc, ens cal conèixer la llei deD(X) sotaH0. El teorema central dellímit multidimensional proporciona aquest resultat.

Teorema central del límit multidimensional

SiguiX → M (n,m; p1,. . . , pm), ambpi ∈ (0,1) i ∑mi=1 pi = 1. Denotant perxi el nombre

d’aparicions de l’i-èsim element, siguiZ = (Z1,. . . ,Zm) tal queZi =xi−npi√

npi. Aleshores,

limn→∞

Z = multinormal

essent la convergència en llei.

Com a conseqüència del teorema que acabem d’enunciar,∑mi=1 Z2

i s’aproxima a una dis-tribucióχ2

m−1 per a valors grans den. Per tant, l’estadísticD(X) segueix, sotaH0 i per avalors grans den, una lleiχ2

m−1. És per això que aquest contrast s’anomenacontrast khiquadrat.

266

Page 264: Llibre estadística

Contrast d’hipòtesi

Observació 6.2Sempre que el valor np0i (i = 1,. . . ,m) no sigui molt petit, l’aproximacióper unaχ2

m−1 de la llei deD(X) sota H0 serà bona. Acostuma a ser molt acurada quannp0

i > 5. En altres casos, cal augmentar, si és possible, la grandària de la mostra.

Prova d’ajustament khi quadrat

Siguin X una variable aleatòria real i(X1,. . . ,Xn) una mostra aleatòria simple. Donadauna distribució de probabilitatF0, es vol resoldre el constrast

H0 : X → F0

H1 : X 6 → F0

Per resoldre’l, considerem una partició d’intervalsAi deR (i = 1,. . . ,m) , i definimp0

i = PH0(X ∈ Ai). Denotem perNi la variable que compta el nombre de vegades que

apareix algun element deAi a la mostra, és a dir,Ni = ∑ni=1 1Ai

(Xj).

Plantegem el nou contrast

H ′0 : (N1,. . . ,Nm) → M(n,m; p0

1,. . . , p0m)

H ′1 : (N1,. . . ,Nm) 6 → M(n,m; p0

1,. . . , p0m)

D’aquesta manera, si s’acceptaH ′0 també s’acceptaràH0. S’ha convertit un contrast de

model no paramètric en un de paramètric, que es resol com s’ha explicat a l’apartatanterior.

Observació 6.3A l’hora de fer la partició deR, cal tenir present que, com més conjuntshi ha, menys informació es perd de la distribucióF0, però s’ha d’evitar que, per a alguni, np0

i < 5.

Observació 6.4En cas que la distribucióF0 presenti paràmetres desconeguts, i sempreque sigui prou regular, aquests paràmetres se substitueixen per estimadors (generalment,per estimadors de màxima versemblança). Aleshores, en virtut d’un resultat de Cramér,

D(X) =m

∑i=1

(ni −np0i )

2

np0i

s’aproxima a χ2m−1−k

on k és el nombre de paràmetres estimats ip0i representa com abans PH0

(X ∈ Ai), amb ladiferència que ara la distribució sota H0 té alguns paràmetres estimats.

Prova d’independència khi quadrat

Suposem que volem estudiar la relació entre el color de cabell i el color d’ulls. Per fer-ho,prenem una mostra de 240 persones i les classifiquem de la manera següent:

cabell ros cabell castany cabell negre cabell pèl-roig Totals

ulls blaus 12 10 13 9 44

ulls grisos-verds 13 10 5 1 29

ulls marró 21 90 35 21 167

Totals 46 110 53 31 240

267

Page 265: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Una taula com aquesta, on cada observació es classifica de duesformes o més , s’anome-nataula de contingències. Quan un estadístic analitza una taula de contingències, sovintestà interessat a contrastar les hipòtesis que les classificacions siguin independents o no.

DonadesX i Y dues variables aleatòries sobre una població, es planteja el contrast:

H0 : X,Y independentsH1 : X,Y no independents

Donada una mostra de midan de la població, es classifica en una taula de contingènciasegons els valors del recorregut deX i Y, de manera que a la posició(i, j) de la taula hiha els individusg tals queX(g) = xi i Y(g) = yj . Denotant permx els valors possibles deX i per my els deY, la taula témx files i my columnes. SotaH0, és a dir, assumint queXi Y són independents, es té que la probabilitat de pertànyer a(i, j), que denotem perpi, j ,éspi, j = P(X = xi)P(Y = yj).

Per resoldre el test, es calculen els valorsp0k = pi, j , ambi = 1,. . . ,mx, j = 1,. . . ,my i k,

de manera que es recorre la taula de contingència d’esquerra a dreta i de dalt a baix, i escontrasten les hipòtesis

H ′0 : (N1,. . . ,Nmx+my

) → M(n,mx+my; p01,. . . , p0

mx+my)

H ′1 : (N1,. . . ,Nmx+my

) 6 → M(n,mx+my; p01,. . . , p0

mx+my)

onNk = ∑nl=1 1xi

(X)1y j(Y), és a dir, les variables que compten el nombre d’individus a la

posició(i, j).

Observació 6.5És important assenyalar que, en general, les probabilitats P(X = xi) iP(Y = yj) no són conegudes, sinó que s’estimen d’acord amb la taula

P(X = xi) =nxi

n

P(Y = yj) =ny j

n

on nxiés el nombre d’individus g tals que X(g) = xi, i anàlogament per a ny j

. En aquestcas, com que s’estimen mx−1 + my−1 paràmetres (les pxi

i les py j, menys una en tots dos

casos, ja que l’últim valor surt del fet que el sumatori de probabilitats puntuals ha de ser1), l’estadísticD per resoldre el constrast segueix una distribucióχ2

mx·my−(mx−1)−(my−1) =

χ2(mx−1)·(my−1).

Problemes resolts

Problema 6.1 Es disposa d’una observació X d’una distribució normal amb mitjanaµ desconeguda i variància 1. Se sap que el valor deµ pot ser−5, 0 o 5, i es volencontrastar les hipòtesis següents al nivell de significació0.05:

H0 : µ= 0H1 : µ=−5 o µ= 5

268

Page 266: Llibre estadística

Contrast d’hipòtesi

Suposem que el procediment de constrast que s’utilitza rebutja H0 quan |X| > k, on ks’escull de manera que Pµ=0(|X|> c) = 0.05. Determineu el valor de k i demostreu que,si X = 2, aleshores es rebutja H0.

Solucio

Pµ=0(|X|> c) =P(|N(0,1)|> c) =P(N(0,1)> c∪−c> N(0,1)) = 0.05⇔ c= 1.96

Per tant, com que 2 pertany a la regió crítica, siX = 2, es rebutjaH0.

Problema 6.2 Sigui p la proporció d’ítems defectuosos en una gran població. Es volrealitzar la prova d’hipòtesi següent:

H0 : p= 0.2H1 : p 6= 0.2

S’ha considerat una mostra de grandària20d’aquesta població. Denotant per X el nom-bre d’ítems defectuosos a la mostra, es considera un procediment que rebutja H0 quanX ≥ 7 o X ≤ 1. Calculeu la probabilitat d’un error de primera espècie.

Solucio

SotaH0, la variableX → B(20,0.2), de manera que

α1 = PH0(RebutjarH0) = Pp=0.2(X ≥ 7 o X ≤ 1) = 0.1559.

Problema 6.3 Sigui X1,. . . ,Xn una mostra aleatòria simple d’una variable X→N(µ,σ).Es vol resoldre el contrast

H0 : µ= 0

H1 : µ 6= 0

Es disposa de la informació següent:∑8i=1 Xi =−11.2 i ∑8

i=1 X2i = 42.7. Resoleu la prova

d’hipòtesi per a un nivell de significacióα= 0.1.

Solucio

Considerem l’estadístic

Z(X) =X8−µ

S8√8

=∑8

i=1 Xi

8−µ√

∑8i=1

(Xi−X8)2

7

8

→ t7

Hem de construir una regió d’acceptació tal que

Pµ=0(x ∈ Ω8|T1(x)≤ µ= 0≤ T2(x)) = 0.9

Aleshores, per la simetria de lat de Student, l’interval és tal que

269

Page 267: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Pµ=0(Z(x) ∈ [−δ,δ]) = P(t7 ∈ [−δ,δ]) = 0.9⇒ δ = 1.895

La regió d’acceptació és

A0 =

x ∈ Ω8 | X8−1.895

S8√8≤ 0≤ X8+1.895

S8√8

Bo i atenent les dades de què disposem,

s2 = 42.7−8(11.2)2

82= 27.02

x8 = −1.4

Per tant, la regió d’acceptació construïda a partir de la mostra resulta[−4.88,2.08], demanera que s’acceptaH0.

Problema 6.4 Per tal d’escollir vicepresident, el republicà John McCain encarrega unaenquesta a100 militants del partit perquè situïn políticament els dos possibles candi-dats: Sarah Palin i Ron Paul. Els enquestats han de puntuar de0 –extrema esquerra– a10–extrema dreta– els dos polítics. Les respostes de l’enquesta es distribueixen seguintnormalitat, amb variància1 i amb una mitjana de6.9 per a Palin i de5.95 per a RonPaul. Se sap que el Partit Republicà mobilitza el màxim nombre d’electors quan el vice-president és vist per les bases com un polític llibertari i conservador moderat, és a dir,quan se’l puntua amb un6.

(a) Es pot admetre que Sarah Palin és massa conservadora si pel possible electorattotal republicà és valorada amb un6.5 o més, amb un nivell de confiança del0.95?

(b) Es pot assumir que Ron Paul maximitzarà els vots republicans, amb un nivell deconfiança del0.95?

(c) Es pot admetre que Sarah Palin és exactament1 punt més dretana que Paul, ambun nivell de confiança del0.9?

Solucio

Denotem perXS la variable aleatòria que indica la puntuació de Sarah Palin i perµS lavaloració mitjana de Sarah Palin. Anàlogament,XR és la puntuació assignada a Ron Pauli µR, la seva mitjana.

(a) Es tracta de resoldre el problema de contrast

H0 : µS ≥ 6.5

H1 : µS < 6.5

Considerem l’estadístic

TS(X) =XS,100−6.5

110

270

Page 268: Llibre estadística

Contrast d’hipòtesi

(a) Si µS = 6.5, aleshoresT es distribueix seguint unaN(0,1). SotaH0, el valor deTtendeix a fer-se gran, ja que, per la llei dels grans nombres,X100 → µS.

De manera que la regió d’acceptació serà tal que

PµS=6.5(T(x)> δ) = 0.95

Com queT(X) → N(0,1), essentµS = 6.5, tenim queδ = −1.64. Finalment, laregió d’acceptació és

A0 =

x∈ Ωn|

100

∑i=1

xi > 633.6

Observem que, en efecte, el test és del nivell triat:

PµS≥6.5(Ac0) = PµS≥6.5

(XS,100−6.5

110

<−1.64

)≤ P6.5

(XS,100−6.5

110

<−1.64

)

= P(N(0,1)<−1.64) = 0.05

Com que les 100 persones han valorat Palin amb una mitjana de 6.9, tenim que∑100

i=1 xi = 690, de manera que podem concloure que la candidata és massa conserva-dora.

(b) Es tracta de resoldre el problema de constrast

H0 : µR = 6H1 : µR 6= 6

Considerem l’estadísticTR(x) definit de manera anàloga alTs(x). L’interval de con-fiança del 0.95 per a la mitjanaµR, construït a partir deTR(x), és[XR,100−1.96

110

,XR,100+1.96110

]

De manera que acceptaremH0 si µR = 6 pertany a aquest interval. I, en efecte, do-nada l’observacióXR,100= 5.95, s’obté l’interval[5.754, 6.146], i comprovem que eltest acceptaH0.

(c) En aquest apartat, es planteja un problema de constrast d’hipòtesi referent a la dife-rència de mitjanes de dues distribucions normals:

H0 : µS−µR = 1H1 : µS−µR 6= 1

Per resoldre’l, construïm un interval de confiança de nivell 0.9 a partir de l’estadístic

D(x) =XS,100−XR,100− (µS−µR)√

2100

271

Page 269: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

(c) L’interval de confiança que resulta per a la diferència de mitjanes amb les observa-cions que tenim és

[xS,100−xR,100−1.64

√2

100,xS,100+xR,100+1.64

√2

100

]= [0.718,1.1893]

Com que la diferènciaµS−µR = 1 pertany a l’interval, s’acceptaH0.

Problema 6.5 Una mostra aleatòria de100calculadores va mostrar que el temps quetrigaven a avaluar la funció cosinus era de12 mil·lisegons, amb una estimació de ladesviació tipus de9 mil·lisegons. Contrasteu, amb un nivell de significacióα= 0.05, sia partir de les dades es pot inferir que el temps mitjà és de10mil·lisegons.

Solucio

Cal realitzar un test per tal de resoldre el contrast

H0 : µ= 10H1 : µ> 10

amb un nivell de significacióα= 0.05.

Considerem l’estadístic

Z =X100−10

σ

10

que s’aproxima a unaN(0,1), ja quen és gran.

El tipus de contrast és unilateral. Observem que, sotaH1, l’estadísicZ tendirà a prendrevalors grans siµ és major, ja que per la llei dels grans nombresX100 → µ. Per tant, laregió d’acceptació serà tal que

Pµ=10(Z(x)≤ δ) = 0.95

Com queZ(X) → N(0,1), essentµ= 10, tenim queδ= 1.64. Finalment, la regió d’ac-ceptació és

A0 = x∈ Ωn|Z ≤ 1.64

AvaluantZ a partir de les observacions que proporciona l’enunciat, obtenimZ = 2.22.Com que no pertany a la regió d’acceptació, descartem la hipòtesi nul·la.

Problema 6.6 Un fabricant de cotxes disposa d’un sistema A per a la producció d’au-tomòbils. Se li suggereix que adopti un nou sistema B, que sembla més eficient ja querequereix menys recursos. Per verificar-ho, se selecciona una mostra de15 cotxes fa-bricats segons el procés A i17segons B. La quantitat de matèria primera emprada pelscotxes fabricats amb el sistema A és de400grams de mitjana i de 9 grams de desviació

272

Page 270: Llibre estadística

Contrast d’hipòtesi

tipus i, pels de B, la mitjana és de385 grams i la desviació, de10.5 grams. Suposantque en ambdós casos la quantitat de recursos es distribueix segons una normal, decidiusi es pot acceptar que les variàncies són iguals amb un nivell de confiança del0.98 i siB requereix menys recursos que A prenentα= 0.05.

Solucio

El contrast que s’ha de resoldre per a les variàncies el formulem com

H0 :σ2

A

σ2B

= 1 H1 :σ2

A

σ2B

6= 1

Per resoldre el test, construïm un interval de confiança del 0.98 per al quocientσ2A

σ2B. Al

capítol anterior, hem vist que, per a fer-ho, ens cal trobara i b tals que

P

(a≤ S2

A,15/σ2A

S2B,15/σ

2B

≤ b

)= 0.98 on

S2A,15/σ

2A

S2B,15/σ

2B

→ F(14,16)

Els valors els trobem consultant les taules de la distribució de Fisher. SubstituintXA =400 ,XB = 385,SA = 9 I sB = 10.5, obtenim l’interval[0.21292,2.65862].

Com que 1 pertany a l’interval, acceptemH0.

El segon contrast que s’ha de resoldre és

H0 : µA−µB = 0H1 : µA−µB > 0

Com que les variàncies poden suposar-se iguals, considerem l’estadístic

T(X) =(XA−XB)

Sp√

115+ 1

17

on Sp=

√14S2

A+16S2B

30

Observem que, sotaH0, l’estadístic es distribueix seguint unat30 i que, sotaH1, el valordeT tendeix a fer-se gran, de manera que la regió crítica del test, és a dir, el complemen-tari d’acceptació, serà de la formaT > k, on k és tal queP(t30 ≤ k) = 0.95. En efecte,aleshores el test compleix que és de nivell

α= 0.05 :PH0(Ac

0) = P(t30 > k) = 0.05

Consultant les taules de la distribuciót30, s’obték= 1.6973.

Finalment, per resoldre el contrast, cal avaluarT segons les dades que tenim

T(x) =400−385

9.82853·0.354245= 4.30821

Com que no pertany a la regió d’acceptació, refutemH0.

273

Page 271: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Problema 6.7 A partir d’una mostra de mida n= 10 d’una distribució de Poisson deparàmetreλ desconegut, es vol contrastar

H0 : λ= 0.3H1 : λ= 0.4

Construïu un test amb nivellα= 0.05a partir del mètode de Neyman-Pearson. Calculeula potència del test.

Solucio

Calculem el quocient de versemblances

L1(x,λ= 0.4)L0(x,λ= 0.3)

=e−44∑10

i=0 Xi

e−33∑10i=0 Xi

= e−1

(43

)∑10i=0 Xi

Ara calculem la regió d’acceptacióA0 segons el lema de Neyman-Pearson. És a dir,

Pλ=0.3

(L1(x)L0(x)

> c

)= Pλ=0.3

((43

)∑10i=0 Xi

> e·c)

= Pλ=0.3

(10

∑i=0

Xi · ln(

43

)> K

)

= Pλ=0.3

(10

∑i=0

Xi > Q

)= 0.05

on s’ha canviat el nom de la constant a mesura que es dividia o multiplicava per termespositius.

Com que, sotaH0, ∑10i=0 Xi → P(3), tenim queQ= 7.

La regió d’acceptació del test és

A0 =

x∈ Ω10|

10

∑i=0

xi ≤ 7

i la seva potènciaφ,

PH1(A0) = P(P(4)> 7) = 1−P(P(4)≤ 7) = 0.11067⇒ φ = 0.8893

Problema 6.8 Sigui X → N(0,σ). Sobre la base d’una sola observació, proposeu untest amb nivell de significacióα= 0.01per resoldre el contrast

H0 : σ2 = 0.5H1 : σ2 = 1

274

Page 272: Llibre estadística

Contrast d’hipòtesi

Solucio

Construïm el test per mitjà de l’estratègia Neyman-Pearson, que és especialment indicadaper a aquest tipus de prova d’ hipòtesi.

En primer lloc, calculem el quocient de versemblances

L1(x)L0(x)

=1√2π

e− x2

21√

2π(0.5)2e− x2

2(0.5)2

=12

e3x2

2

La regió d’acceptació és de la forma

A0 =

x∈ Ω | L1(x)

L0(x)≤ k

i tal quePH0(Ac

0) = 0.01. Per determinar-la, cal imposar aquesta condició:

PH0

(12

e3X2

2 > k

)= PH0

(3X2

2> ln(2k))

= PH0(X2 > Q)

= PH0

(X >

√Q)+PH0

(X <−

√Q)

Per la simetria de la distribucióN(

0, 1√2

), que és la que segueixX, sotaH0, i notant

√Q= c, obtenimc= 1.2879.

En conclusió, la regió d’acceptació que resulta és

A0 = x∈ Ω ||x| ≤ 1.2789.

Problema 6.9 Es disposa d’una mostra X1,. . . ,X25 d’una variable X→ N(µ,10). A par-tir del mètode de la raó de versemblança, plantegeu un test amb nivell de significació0.1per resoldre el contrast

H0 : µ= 0H1 : µ 6= 0

Solucio

Com que l’estimador deµ pel mètode de la màxima versemblança ésµm.v = X25, alesho-res la raó de versemblança és

λ(X) =L0

L=

(1√

2π10

)25

e−∑25

i=1 X2i

200

(1√

2π10

)25

e−∑25

i=1(Xi−µm.v)2

200

= e−∑25

i=1 X2i −(Xi−X25)

2

200

275

Page 273: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

La regió d’acceptació serà

A0 =(X1,. . . ,X25)|e−

∑25i=1 X2

i −(Xi−X25)2

200 > c

=

(X1,. . . ,X25)|

25

∑i=1

X2i − (Xi −X25)

2 <−200ln(c) =K

=(X1,. . . ,X25)|X

2

25 < 25K = Q

on s’ha tingut en compte que∑25i=1(Xi −X25)

2 = ∑25i=1 X2

i −25X2

25.

De manera que, finalment, podem expressar

A0 = (X1,. . . ,X25) | |X25|< q.

Imposant quePµ=0(Ac0) = 0,1, s’obtéq= 3.29.

Problema 6.10 Un estudi del Departament de Medi Ambient estima que un25% deles llars catalanes recicla la matèria orgànica. És vàlida aquesta afirmació si, en unamostra de100llars, es troba que30recliclen? Utilitzeu un nivell de significació de0.05.

Solucio

Sigui X la variable que, donada una llar, li assigna el valor 1, si recicla la matèria or-gànica, o 0, en cas contrari. És clar queX és una distribució de Bernoulli, de la qualdesconeixemp. El contrast que s’ha de resoldre, pensat en termes de mitjanes, és

H0 : µ= 0.25H1 : µ 6= 0.25

Per resoldre el test, construïm un interval de confiança per aµ a partir de l’observació.Considerem l’estadístic

T(X) =1

100 ∑100i=1 Xi −0.25

σ

10

on σ =√

0.25(1−0.25)

SotaH0, la llei deT la podem aproximar per unaN(0,1) en virtut del teorema centraldel límit. Els valors que prenT sotaH0 pertanyen a[−1.96, 1.96] en un 95% dels casos,és a dir, que la regió d’acceptació és

A0 = (x1,. . .x100) | T ∈ [−1.96, 1.96]

Si avaluemT en els valors de la mostra,

T =30100

−0.25σ

10

= 1.1547

Per tant, acceptemH0.

276

Page 274: Llibre estadística

Contrast d’hipòtesi

Problema 6.11 En tres dies consecutius (72 hores), es van registrar290 accidents decotxe mortals d’acord amb les dades següents:

accidents mortals per hora 0 1 2 3 4 5 6 7 8

hores 3 2 10 15 14 12 8 5 3

Contrasteu pel test khi quadrat si el nombre d’accidents per hora segueix una llei dePoisson.

Solucio

Sigui X la variable que compta el nombre d’accidents per hora. Suposem que segueixuna llei de Poisson; aleshores, pel mètode de la màxima versemblança,

λX ≈ λm.v =∑72

i=1 xi

72=

29072

= 4.0277⇒ λX = 4

Construïm una particióAi del recorregut deX i calculem les probabilitats queX ∈ Ai:

A1 = [0,1] np1 = 6.59

A2 = 2 np2 = 10.548

A3 = 3 np3 = 14.066

A4 = 4 np4 = 14.066

A5 = 5 np5 = 11.25

A6 = 6 np6 = 7.5

A7 = ≥ 7 np7 = 6.43

Per fer la provaχ2, prenem l’estadísticD definit en aquest capítol. Com que hem estimatun paràmetre i hem fet una partició en set conjunts,D → χ2

7−2=5. Per construir la regiód’acceptacióA0 = x | D(x)≤ c, només cal buscar a les taules de laχ2

5 el valor dec quefa queP(χ2

5 > c) =0.05. Aquest tal valor ésc= 11.07.

Finalment, per decidir si s’accepta o noH0, cal avaluar l’estadístic a les dades.

D(x) =(5−6.59)2

6.59+

(10−10.55)2

10.55+

(15−14.066)2

14.066

+(14−14.066)2

14.066+

(12−11.25)2

11.25+

(8−7.5)2

7.5+

(8−6.43)2

6.43

En conclusió, com queD(x)≈ 0.945, acceptemH0.

Problema 6.12 Es pren una mostra de grandària 100 d’una variable aleatòria Y , ambels resultats següents:

277

Page 275: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

40≤Y ≤ 60 10observacions

60≤Y ≤ 80 25observacions

80≤Y ≤ 100 25observacions

100≤Y ≤ 120 20observacions

120≤Y ≤ 140 20observacions

Es pot admetre que Y segueix una distribució uniforme en[40,140], amb un risc nosuperior aα= 0.1?

Solucio

Si segueix una distribució uniforme, la densitat deY és

fY(y) =

1100

, 40≤ x≤ 140

0, altrament

Aleshores, la probabilitat de qualsevol dels intervals és la mateixa, 0.2, de manera queel nombre esperat de valors de l’observació que pertanyin a cada interval és 20.

Com que no hi ha cap paràmetre estimat i el nombre d’intervals és 5,D(X) → χ24 .

Consultant les taules de la distribucióχ24 , s’obté que la regió d’acceptació del test és

A0 = (x1,. . . ,x100) | D(x1,. . . ,x100)≤ 7.78

Avaluant l’estadístic en els valors de l’observació de què disposem, tenimD(x1,. . . ,x100)= 7.5, de manera que acceptemH0, tot i que amb poca contundència.

Problema 6.13 Es vol estudiar si dues variables aleatòries són independents o no, ambun nivell de significacióα= 0.1, a partir de la taula següent:

y1 y2 y3

x1 42 8 10

x2 58 12 29

Solucio

Estimem les probabilitats dels diferents valors dels recorreguts deX i Y.

P(X = x1) ≈ 60159

= 0.3778

P(X = x2) = 1−P(X = x1)≈ 0.6222

P(Y = y1) ≈ 100159

= 0.6289

P(Y = y2) ≈ 20159

= 0.1258

P(Y = y3) = 1−P(Y = y1)−P(Y = y2)≈ 0.2453

278

Page 276: Llibre estadística

Contrast d’hipòtesi

Els valors esperats per a la taula de contingència, en cas que hi hagi independència, són:

y1 y2 y3

x1 37.78 7.56 14.74

x2 62.22 12.44 24.27

Considerem la variableN, que compta el nombre de casos que hi ha a cada casella de lataula de contingència, és a dir, els individus que compleixen simultàniamentxi i yj . Elrecorregut deN ésn1 = (x1,y1), n2 = (x1,y2), . . . ,n6 = (x2,y3).

Resoldre el test d’independència és contrastar siN es distribueix seguint una multinomialamb probabilitatspk = P(N = nk) = P(X = xi ,Y = yj) per als valorsi, j que correspon-guin en cada cas. L’estadísticD que utilitzem per als tests khi quadrat en aquest cassegueix una distribucióχ2

4 .

Per construir la regió d’acceptacióA0 = n | D(n)≤ c, només cal buscar a les taules dela χ2

4 el valor dec que fa queP(χ24 > c) = 0.1. Aquest valor ésc= 7.78.

Finalment, per decidir si s’accepta o noH0, cal avaluar l’estadístic a les dades. Com queD(n)≈ 3.641, acceptemH0.

279

Page 277: Llibre estadística

Hola

Page 278: Llibre estadística

Taules

7.1. Distribucio normal

Aquesta taula proporciona els valors de la funció de distribució per a la distribució normaltipificada (amb mitjana zero i variància la unitat).

7.1La taula proporciona elsvalors de la funció dedistribució

( )z = P(Z z),

on Z N(0,1).

z

Φ(z) = P(Z ≤ z)

La taula dóna els valors de la funció de distribució de la llei normal tipificada, per a valorspositius i amb una resolució de dos decimals.

Per a d’altres situacions, utilitzeu les equivalències següents:

- Si z> 0, aleshoresP(Z ≥ z) = 1−P(Z ≤ z) = 1−Φ(z).

- Si z< 0, aleshoresP(Z ≤ z) = 1−P(Z ≤−z) = 1−Φ(−z).

- Si z< 0, aleshoresP(Z ≥ z) = P(Z ≤−z) = Φ(−z).

281

Page 279: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

7.2Equivalències per al càlculde la funció de distribució

per a valors negatius.

z −z−z

F(z) = P(Z ≤ z) P(Z ≥−z) 1 P(Z ≤−z)

Per obtenir les probabilitats corresponents a una normal(µ,σ), tipifiquem la variableabans de fer servir les taules.

Observació 7.1Si es disposa d’una eina de càlcul simbòlic, com ara Maple, aquestesprobabilitats es poden calcularexactamentfent:

> f:=x->1/sqrt(2*Pi)*exp(-x^2/2):

> int(f(x),x=-infinity..z);

7.2. Distribucio t

Proporciona els percentils de la distribuciót de Student, en funció del nombre de grausde llibertat (n), és a dir, donatp> 0.5 ens dóna el valortp tal queP(t ≤ tp) = p. Recor-dant que aquesta distribució és simètrica amb mitjana zero, podem obtenir els percentilscomplementaris als que apareixen a les taules.

7.3Donada la distribució de

Student, correspon alpercentil , és a dir, el

valor tal que

tt

pt

P t( ) = p.tp

tp

tp

tp

P(t ≤ tp) = p

p

Observació 7.2Si es disposa d’una eina de càlcul simbòlic, com ara Maple, aquestpercentil es pot calcularexactamentfent:

> f:=x->1/sqrt(n*Pi)*GAMMA((n+1)/2)/GAMMA(n/2)/(1+x^2/n)^((n+1)/2):

> fsolve(int(f(x),x=-infinity..tp)=p,tp);

onp i n corresponen al valor del percentil i els graus de llibertat, respectivament.

282

Page 280: Llibre estadística

Taules

7.3. Distribucio χ2χ2χ2

Proporciona els percentils per a una distribucióχ2, ambn graus de llibertat. La sevautilització és similar a la distribuciót, per= amb la diferència que la distribucióχ2 no éssimètrica.

Per ak> 100, es fa servir l’aproximació que√

2χ2n es distribueix de forma asimptòtica-

ment normal amb paràmetres(√

2n−1,1).

7.4Donada la distribució

p correspon al percentil

, és a dir, el valor p

tal que ( 2 p) = .

χ2,

χ

χ

χ χ

p

P p

χ2

χ2

χp

χp

χp

P(χ2 ≤ χp) = p

p

Observació 7.3Si es disposa d’una eina de càlcul simbòlic, com ara Maple, aquestpercentil es pot calcularexactamentfent:

> f:=x->1/2^(n/2)/GAMMA(n/2)*x^(n/2-1)*exp(-x/2):

> fsolve(int(f(x),x=0..Xp)=p,Xp=0..infinity);

onp i n corresponen al valor del percentil i els graus de llibertat, respectivament.

7.4. Distribucio F

7.5Distribució : representael percentil 0.95.

F z

z

P(F ≤ z) = 1−α= 0.95

0.95

283

Page 281: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

7.6Distribució : representa

el percentil 0.99.F z

z

P(F ≤ z) = 1−α= 0.99

0.99

Proporciona els percentils 0.95 i 0.99 de la distribucióFd1,d2en quèd1 és el nombre de

graus de llibertat del numerador id2 és el nombre de graus de llibertat del denominador,és a dir, donada la distribucióF , z correspon al percentilp= 1−α, és a dir, el valorztal queP(F ≤ z) = 1−α, onα és el nivell de significació.

Observació 7.4Si es disposa d’una eina de càlcul simbòlic, com ara Maple, aquestpercentil es pot calcularexactamentfent:

> f:=x->1/Beta(d1/2,d2/2)*(d1*x/(d1*x+d2))^(d1/2)

*(1-d1*x/(d1*x+d2))^(d2/2)*1/x:

> fsolve(int(f(x),x=0..z)=1-alpha,z=0..infinity);

ond1 són els graus de llibertat del numerador,d2 són els graus de llibertat del denomi-nador ialpha és el nivell de significació.

284

Page 282: Llibre estadística

Taules

Distribució normaltipificada. Valors de lafunción de distribució

( )z = P Z( z),

on z N(0,1).

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141

0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517

0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879

0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

0.7 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.7852

0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133

0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621

1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830

1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90147

1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774

1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449

1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327

1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062

1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574

2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899

2.3 0.98928 0.98956 0.98983 0.920097 0.920358 0.920613 0.920863 0.921106 0.921344 0.921576

2.4 0.921802 0.922024 0.922240 0.922451 0.922656 0.922857 0.923053 0.923244 0.923431 0.923613

2.5 0.923790 0.923963 0.924132 0.924297 0.924457 0.924614 0.924766 0.924915 0.925060 0.925201

2.6 0.925339 0.925473 0.925604 0.925731 0.925855 0.925975 0.926093 0.926207 0.926319 0.926427

2.7 0.926533 0.926636 0.926736 0.926833 0.926928 0.927020 0.927110 0.927197 0.927282 0.927365

2.8 0.927445 0.927523 0.927599 0.927673 0.927744 0.927814 0.927882 0.927948 0.928012 0.928074

2.9 0.928134 0.928193 0.928250 0.928305 0.928359 0.928411 0.928462 0.928511 0.928559 0.928605

3.0 0.928650 0.928694 0.928736 0.928777 0.928817 0.928856 0.928893 0.928930 0.928965 0.928999

3.1 0.930324 0.930646 0.930957 0.931260 0.931553 0.931836 0.932112 0.932378 0.932636 0.932886

3.2 0.933129 0.933363 0.933590 0.933810 0.934024 0.934230 0.934429 0.934623 0.934810 0.934991

3.3 0.935166 0.935335 0.935499 0.935658 0.935811 0.935959 0.936103 0.936242 0.936376 0.936505

3.4 0.936631 0.936752 0.936869 0.936982 0.937091 0.937197 0.937299 0.937398 0.937493 0.937585

3.5 0.937674 0.937759 0.937842 0.937922 0.937999 0.938074 0.938146 0.938215 0.938282 0.938347

3.6 0.938409 0.938469 0.938527 0.938583 0.938637 0.938689 0.938739 0.938787 0.938834 0.938879

3.7 0.938922 0.938964 0.940039 0.940426 0.940799 0.941158 0.941504 0.941838 0.942159 0.942468

3.8 0.942765 0.943052 0.943327 0.943593 0.943848 0.944094 0.944331 0.944558 0.944777 0.944988

3.9 0.945190 0.945385 0.945573 0.945753 0.945926 0.946092 0.946253 0.946406 0.946554 0.946696

4.0 0.946833 0.946964 0.947090 0.947211 0.947327 0.947439 0.947546 0.947649 0.947748 0.947843

285

Page 283: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Distribució de Student.tValors de la funció de

distribucióP t( tp) = p,on són els graus den

llibertat.

P t( ) = p,tp

n t0.995 t0.99 t0.975 t0.95 t0.90 t0.80 t0.75 t0.70 t0.60 t0.55

1 63.66 31.82 12.71 6.31 3.08 1.376 1.000 0.727 0.325 0.158

2 9.92 6.96 4.30 2.92 1.89 1.061 0.816 0.617 0.289 0.142

3 5.84 4.54 3.18 2.35 1.64 0.978 0.765 0.584 0.277 0.137

4 4.60 3.75 2.78 2.13 1.53 0.941 0.741 0.569 0.271 0.134

5 4.03 3.36 2.57 2.02 1.48 0.920 0.727 0.559 0.267 0.132

6 3.71 3.14 2.45 1.94 1.44 0.906 0.718 0.553 0.265 0.131

7 3.50 3.00 2.36 1.90 1.42 0.896 0.711 0.549 0.263 0.130

8 3.36 2.90 2.31 1.86 1.40 0.889 0.706 0.546 0.262 0.130

9 3.25 2.82 2.26 1.83 1.38 0.883 0.703 0.543 0.261 0.129

10 3.17 2.76 2.23 1.81 1.37 0.879 0.700 0.542 0.260 0.129

11 3.11 2.72 2.20 1.80 1.36 0.876 0.697 0.540 0.260 0.129

12 3.06 2.68 2.18 1.78 1.36 0.873 0.695 0.539 0.259 0.128

13 3.01 2.65 2.16 1.77 1.35 0.870 0.694 0.538 0.259 0.128

11 2.98 2.62 2.14 1.76 1.34 0.868 0.692 0.537 0.258 0.128

15 2.95 2.60 2.13 1.75 1.34 0.866 0.691 0.536 0.258 0.128

16 2.92 2.58 2.12 1.75 1.34 0.865 0.690 0.535 0.258 0.128

17 2.90 2.57 2.11 1.74 1.33 0.863 0.689 0.534 0.257 0.128

18 2.88 2.55 2.10 1.73 1.33 0.862 0.688 0.534 0.257 0.127

19 2.86 2.54 2.09 1.73 1.33 0.861 0.688 0.533 0.257 0.127

20 2.84 2.53 2.09 1.72 1.32 0.860 0.687 0.533 0.257 0.127

21 2.83 2.52 2.08 1.72 1.32 0.859 0.686 0.532 0.257 0.127

22 2.82 2.51 2.07 1.72 1.32 0.858 0.686 0.532 0.256 0.127

23 2.81 2.50 2.07 1.71 1.32 0.858 0.685 0.532 0.256 0.127

24 2.80 2.49 2.06 1.71 1.32 0.857 0.685 0.531 0.256 0.127

25 2.79 2.48 2.06 1.71 1.32 0.856 0.684 0.531 0.256 0.127

26 2.78 2.48 2.06 1.71 1.32 0.856 0.684 0.531 0.256 0.127

27 2.77 2.47 2.05 1.70 1.31 0.855 0.684 0.531 0.256 0.127

28 2.76 2.47 2.05 1.70 1.31 0.855 0.683 0.530 0.256 0.127

29 2.76 2.46 2.04 1.70 1.31 0.854 0.683 0.530 0.256 0.127

30 2.75 2.46 2.04 1.70 1.31 0.854 0.683 0.530 0.256 0.127

40 2.70 2.42 2.02 1.68 1.30 0.851 0.681 0.529 0.255 0.126

60 2.66 2.39 2.00 1.67 1.30 0.848 0.679 0.527 0.254 0.126

120 2.62 2.36 1.98 1.66 1.29 0.845 0.677 0.526 0.254 0.126

∞ 2.58 2.33 1.96 1.645 1.28 0.842 0.674 0.524 0.253 0.126

286

Page 284: Llibre estadística

Taules

Distribució khi-quadrat dePearson. Valors de lafunció de distribució,

( ) = , on sónels graus de llibertat.P p nχ2 2χp

n χ20.995 χ2

0.99 χ20.975 χ2

0.95 χ20.90 χ2

0.75 χ20.50 χ2

0.25 χ20.10 χ2

0.05 χ20.025 χ2

0.01 χ20.005

1 7.88 6.63 5.02 3.84 2.71 1.32 0.455 0.102 0.0158 0.0039 0.0010 0.0002 0.0000

2 10.6 9.21 7.38 5.99 4.61 2.77 1.39 0.575 0.211 0.103 0.0506 0.0201 0.0100

3 12.8 11.3 9.35 7.81 6.25 4.11 2.37 1.21 0.584 0.352 0.216 0.115 0.072

4 14.9 13.3 11.1 9.49 7.78 5.39 3.36 1.92 1.06 0.711 0.484 0.297 0.207

5 16.7 15.1 12.8 11.1 9.24 6.63 4.35 2.67 1.61 1.15 0.831 0.554 0.412

6 18.5 16.8 14.4 12.6 10.6 7.84 5.35 3.45 2.20 1.64 1.24 0.872 0.676

7 20.3 18.5 16.0 14.1 12.0 9.04 6.35 4.25 2.83 2.17 1.69 1.24 0.989

8 22.0 20.1 17.5 15.5 13.4 10.2 7.34 5.07 3.49 2.73 2.18 1.65 1.34

9 23.6 21.7 19.0 16.9 14.7 11.4 8.34 5.90 4.17 3.33 2.70 2.09 1.73

10 25.2 23.2 20.5 18.3 16.0 12.5 9.34 6.74 4.87 3.94 3.25 2.56 2.16

11 26.8 24.7 21.9 19.7 17.3 13.7 10.3 7.58 5.58 4.57 3.82 3.05 2.60

12 28.3 26.2 23.3 21.0 18.5 14.8 11.3 8.44 6.30 5.23 4.40 3.57 3.07

13 29.8 27.7 24.7 22.4 19.8 16.0 12.3 9.30 7.04 5.89 5.01 4.11 3.57

14 31.3 29.1 26.1 23.7 21.1 17.1 13.3 10.2 7.79 6.57 5.63 4.66 4.07

15 32.8 30.6 27.5 25.0 22.3 18.2 14.3 11.0 8.55 7.26 6.26 5.23 4.60

16 34.3 32.0 28.8 26.3 23.5 19.4 15.3 11.9 9.31 7.96 6.91 5.81 5.14

17 35.7 33.4 30.2 27.6 24.8 20.5 16.3 12.8 10.1 8.67 7.56 6.41 5.70

18 37.2 34.8 31.5 28.9 26.0 21.6 17.3 13.7 10.9 9.39 8.23 7.01 6.26

19 38.6 36.2 32.9 30.1 27.2 22.7 18.3 14.6 11.7 10.1 8.91 7.63 6.84

20 40.0 37.6 34.2 31.4 28.4 23.8 19.3 15.5 12.4 10.9 9,59 8.26 7.43

21 41.4 38.9 35.5 32.7 29.6 24.9 20.3 16.3 13.2 11.6 10.3 8.90 8.03

22 42.8 40.3 36.8 33.9 30.8 26.0 21.3 17.2 14.0 12.3 11.0 9.54 8.64

23 44.2 41.6 38.1 35.2 32.0 27.1 22.3 18.1 14.8 13.1 11.7 10.2 9.26

24 45.6 43.0 39.4 36.4 33.2 28.2 23.3 19.0 15.7 13.8 12.4 10.9 9.89

25 46.9 44.3 40.6 37.7 34.4 29.3 24.3 19.9 16.5 14.6 13.1 11.5 10.5

26 48.3 45.6 41.9 38.9 35.6 30.4 25.3 20.8 17.3 15.4 13.8 12.2 11.2

27 49.6 47.0 43.2 40.1 36.7 31.5 26.3 21.7 18.1 16.2 14.6 12.9 11.8

28 51.0 48.3 44.5 41.3 37.9 32.6 27.3 22.7 18.9 16.9 15.3 13.6 12.5

29 52.3 49.6 45.7 42.6 39.1 33.7 28.3 23.6 19.8 17.7 16.0 14.3 13.1

30 53.7 50.9 47.0 43.8 40.3 34.8 29.3 24.5 20.6 18.5 16.8 15.0 13.8

40 66.8 63.7 59.3 55.8 51.8 45.6 39.3 33.7 29.1 26.5 24.4 22.2 20.7

50 79.5 76.2 71.4 67.5 63.2 56.3 49.3 42.9 37.7 34.8 32.4 29.7 28.0

60 92.0 88.4 83.3 79.1 74.4 67.0 59.3 52.3 46.5 43.2 40.5 37.5 35.5

70 104.2 100.4 95.0 90.5 85.5 77.6 69.3 61.7 55.3 51.7 48.8 45.4 43.3

80 116.3 112.3 106.6 101.9 96.6 88.1 79.3 71.1 64.3 60.4 57.2 53.5 51.2

90 128.3 124.1 118.1 113.1 107.6 98.6 89.3 80.6 73.3 69.1 65.6 61.8 59.2

100 140.2 135.8 129.6 124.3 118.5 109.1 99.3 90.1 82.4 77.9 74.2 70.1 67.3

287

Page 285: Llibre estadística

Probabilitat i estadística: teoria i problemes resolts

Distribució ( = 0.05, 1graus de llibertat del

numerador, 2 graus dellibertat del denominador).

F d

d

a 1d

2dd

2\d

11

23

45

67

89

10

12

15

20

24

30

40

60

12

0∞∞

11

61.4

19

9.5

21

5.7

22

4.6

23

0.2

23

4.0

23

6.8

23

8.9

24

0.5

24

1.9

24

3.9

24

5.9

24

8.0

24

9.1

25

0.1

25

1.1

25

2.2

25

3.3

25

4.3

21

8.5

11

9.1

61

9.25

19.3

01

9.3

31

9.3

51

9.3

71

9.3

81

9.4

01

9.4

11

9.4

31

9.4

51

9.4

51

9.4

61

9.4

71

9.4

81

9.4

81

9.4

91

9.5

0

31

0.1

39.5

59.2

89.1

29.0

18.9

48.8

98.8

58.8

18.7

98.7

48.7

08.6

68.6

48.6

28.5

98.5

78.5

58.5

3

47.7

16.9

46.5

96.3

96.2

66.1

66.0

96.0

46.0

05.9

65.9

15.8

65.8

05.7

75.7

55.7

25.6

95.6

65.6

3

56.6

15.7

95.4

15.1

95.0

54.9

54.8

84.8

24.7

74.7

44.6

84.6

24.5

64.5

34.5

04.4

64.4

34.4

04.3

6

65.9

95.1

44.7

64.5

34.3

94.2

84.2

14.1

54.1

04.0

64.0

03.9

43.8

73.8

43.8

13.7

73.7

43.7

03.6

7

75.5

94.7

44.3

54.1

23.9

73.8

73.7

93.7

33.6

83.6

43.5

73.5

13.4

43.4

13.3

83.3

43.3

03.2

73.2

3

85.3

24.4

64.0

73.8

43.6

93.5

83.5

03.4

43.3

93.3

53.2

83.2

23.1

53.1

23.0

83.0

43.0

12.9

72.9

3

95.1

24.2

63.8

63.6

33.4

83.3

73.2

93.2

33.1

83.1

43.0

73.0

12.9

42.9

02.8

62.8

32.7

92.7

52.7

1

10

4.9

64.1

03.7

13.4

83.3

33.2

23.1

43.0

73.0

22.9

82.9

12.8

52.7

72.7

42.70

2.6

62.6

22.5

82.5

4

11

4.8

43.9

83.5

93.3

63.2

03.0

93.0

12.9

52.9

02.8

52.7

92.7

22.6

52.6

12.57

2.5

32.4

92.4

52.4

0

12

4.7

53.8

93.4

93.2

63.1

13.0

02.9

12.8

52.8

02.7

52.6

92.6

22.5

42.5

12.47

2.4

32.3

82.3

42.3

0

13

4.6

73.8

13.4

13.1

83.0

32.9

22.8

32.7

72.7

12.6

72.6

02.5

32.4

62.4

22.38

2.3

42.3

02.2

52.2

1

14

4.6

03.7

43.3

43.1

12.9

62.8

52.7

62.7

02.6

52.6

02.5

32.4

62.3

92.3

52.31

2.2

72.2

22.1

82.1

3

15

4.5

43.6

83.2

93.0

62.9

02.7

92.7

12.6

42.5

92.5

42.4

82.4

02.3

32.2

92.25

2.2

02.1

62.1

12.0

7

16

4.4

93.6

33.2

43.0

12.8

52.7

92.6

62.5

92.5

42.4

92.4

22.3

52.2

82.2

42.19

2.1

52.1

12.0

62.0

1

17

4.4

53.5

93.2

02.9

62.8

12.7

02.6

12.5

52.4

92.4

52.3

82.3

12.2

32.1

92.15

2.1

02.0

62.0

11.9

6

18

4.4

13.5

53.1

62.9

32.7

72.6

62.5

82.5

12.4

62.4

12.3

42.2

72.1

92.1

52.11

2.0

62.0

21.9

71.9

2

19

4.3

83.5

23.1

32.9

02.7

42.6

32.5

42.4

82.4

22.3

82.3

12.2

32.1

62.1

12.07

2.0

31.9

81.9

31.8

8

20

4.3

53.4

93.1

02.8

72.7

12.6

02.5

12.4

52.3

92.3

52.2

82.2

02.1

22.0

82.04

1.9

91.9

51.9

01.8

4

21

4.3

23.4

73.0

72.8

42.6

82.5

72.4

92.4

22.3

72.3

22.2

52.1

82.1

02.0

52.01

1.9

61.9

21.8

71.8

1

22

4.3

03.4

43.0

52.8

22.6

62.5

52.4

62.4

02.3

42.3

02.2

32.1

52.0

72.0

31.98

1.9

41.8

91.8

41.7

8

23

4.2

83.4

23.0

32.8

02.6

42.5

32.4

42.3

72.3

22.2

72.2

02.1

32.0

52.0

11.96

1.9

11.8

61.8

11.7

6

24

4.2

63.4

03.0

12.7

82.6

22.5

12.4

22.3

62.3

02.2

52.1

82.1

12.0

31.9

81.94

1.8

91.8

41.7

91.7

3

25

4.2

43.3

92.9

92.7

62.6

02.4

92.4

02.3

42.2

82.2

42.1

62.0

92.0

11.9

61.92

1.8

71.8

21.7

71.7

1

26

4.2

33.3

72.9

82.7

42.5

92.4

72.3

92.3

22.2

72.2

22.1

52.0

71.9

91.9

51.90

1.8

51.8

01.7

51.6

9

27

4.2

13.3

52.9

62.7

32.5

72.4

62.3

72.3

12.2

52.2

02.1

32.0

61.9

71.9

51.88

1.8

41.7

91.7

31.6

7

28

4.2

03.3

42.9

52.7

12.5

62.4

52.3

62.2

92.2

42.1

92.1

22.0

41.9

61.9

11.87

1.8

21.7

71.7

11.6

5

29

4.1

83.3

32.9

32.7

02.5

52.4

32.3

52.2

82.2

22.1

82.1

02.0

31.9

41.9

01.85

1.8

11.7

51.7

01.6

4

30

4.1

73.3

22.9

22.6

92.5

32.4

22.3

32.2

72.2

12.1

62.0

92.0

11.9

31.8

91.84

1.7

91.7

41.6

81.6

2

40

4.0

83.2

32.8

42.6

12.4

52.3

42.2

52.1

82.1

22.0

82.0

01.9

21.8

41.7

91.74

1.6

91.6

41.5

81.5

1

60

4.0

03.1

52.7

62.5

32.3

72.2

52.1

72.1

02.0

41.9

91.9

21.8

41.7

51.7

01.65

1.5

91.5

31.4

71.3

9

12

03.9

23.0

72.6

82.4

52.2

92.1

72.0

92.0

21.9

61.9

11.8

31.7

51.6

61.6

11.5

51.5

01.4

31.3

51.2

5

∞3.9

43.0

02.6

02.3

72.2

12.1

02.0

11.9

41.8

81.8

31.7

51.6

71.5

71.5

21.4

61.3

91.3

21.2

21.0

0

288

Page 286: Llibre estadística

Taules

Distribució ( = 0.01, 1graus de llibertat delnumerador, 2 graus dellibertat del denominador).

F d

d

a 1d

2d

12

34

56

78

910

12

15

20

24

30

40

60

120

∞∞

14052

4999.5

5403

5625

5764

5859

5928

5982

6022

6056

6101

6157

6209

6235

6261

6287

6313

6339

6366

298.50

99.00

99.17

99.25

99.30

99.33

99.36

99.37

99.39

99.40

99.42

99.43

99.45

99.46

99.47

99.47

99.48

99.49

99.50

334.12

30.82

29.46

28.71

28.24

27.91

27.67

27.49

27.35

27.23

27.05

26.87

26.69

26.60

26.50

26.41

26.32

26.22

26.13

421.20

18.00

16.69

15.98

15.52

15.21

14.98

14.80

14.66

14.55

14.37

14.20

14.02

13.93

13.84

13.75

13.65

13.56

13.46

516.26

13.27

12.06

11.39

10.97

10.67

10.46

10.29

10.16

10.05

9.89

9.72

9.55

9.47

9.38

9.29

9.20

9.11

9.02

613.75

10.92

9.78

9.15

8.75

8.47

8.26

8.10

7.98

7.87

7.72

7.56

7.40

7.31

7.23

7.14

7.06

6.97

6.88

712.25

9.55

8.45

7.85

7.46

7.19

6.99

6.84

6.72

6.62

6.47

6.31

6.16

6.07

5.99

5.91

5.82

5.74

5.65

811.26

8.65

7.59

7.01

6.63

6.37

6.18

6.03

5.91

5.81

5.67

5.52

5.36

5.28

5.20

5.12

5.03

4.95

4.86

910.56

8.02

6.99

6.42

6.06

5.80

5.61

5.47

5.35

5.26

5.11

4.96

4.81

4.73

4.65

4.57

4.48

4.40

4.31

10

10.04

7.56

6.55

5.99

5.64

5.39

5.20

5.06

4.94

4.85

4.71

4.56

4.41

4.33

4.25

4.17

4.08

4.00

3.91

11

9.65

7.21

6.22

5.67

5.32

5.07

4.89

4.74

4.63

4.54

4.40

4.25

4.10

4.02

3.94

3.86

3.78

3.69

3.60

12

9.33

6.93

5.95

5.41

5.06

4.82

4.64

4.50

4.39

4.30

4.16

4.01

3.86

3.78

3.70

3.62

3.54

3.45

3.36

13

9.07

6.70

5.74

5.21

4.86

4.62

4.44

4.30

4.19

4.10

3.96

3.82

3.66

3.59

3.51

3.43

3.34

3.25

3.17

14

8.86

6.51

5.56

5.04

4.69

4.46

4.28

4.14

4.03

3.94

3.80

3.66

3.51

3.43

3.35

3.27

3.18

3.09

3.00

15

8.68

6.36

5.42

4.89

4.56

4.32

4.14

4.00

3.89

3.80

3.67

3.52

3.37

3.29

3.21

3.13

3.05

2.96

2.87

16

8.53

6.23

5.29

4.77

4.44

4.20

4.03

3.89

3.78

3.69

3.55

3.41

3.26

3.18

3.10

3.02

2.93

2.84

2.75

17

8.40

6.11

5.18

4.67

4.34

4.10

3.93

3.79

3.68

3.59

3.46

3.31

3.16

3.08

3.00

2.92

2.83

2.75

2.65

18

8.29

6.01

5.09

4.58

4.25

4.01

3.84

3.71

3.60

3.51

3.37

3.23

3.08

3.00

2.92

2.84

2.75

2.66

2.57

19

8.18

5.93

5.01

4.50

4.17

3.94

3.77

3.63

3.52

3.43

3.30

3.15

3.00

2.92

2.84

2.76

2.67

2.58

2.49

20

8.10

5.85

4.94

4.43

4.10

3.87

3.70

3.56

3.46

3.37

3.23

3.09

2.94

2.86

2.78

2.69

2.61

2.52

2.42

21

8.02

5.78

4.87

4.37

4.04

3.81

3.64

3.51

3.40

3.31

3.17

3.03

2.88

2.80

2.72

2.64

2.55

2.46

2.36

22

7.95

5.72

4.82

4.31

3.99

3.76

3.59

3.45

3.35

3.26

3.12

2.98

2.83

2.75

2.67

2.58

2.50

2.40

2.31

23

7.88

5.66

4.76

4.26

3.94

3.71

3.54

3.41

3.30

3.21

3.07

2.93

2.78

2.70

2.62

2.54

2.45

2.35

2.26

24

7.82

5.61

4.72

4.22

3.90

3.67

3.50

3.36

3.26

3.17

3.03

2.89

2.74

2.66

2.58

2.49

2.40

2.31

2.21

25

7.77

5.57

4.68

4.18

3.85

3.63

3.46

3.32

3.22

3.13

2.99

2.85

2.70

2.62

2.54

2.45

2.36

2.27

2.17

26

7.72

5.53

4.64

4.14

3.82

3.59

3.42

3.29

3.18

3.09

2.96

2.81

2.66

2.58

2.50

2.42

2.33

2.23

2.13

27

7.68

5.49

4.60

4.11

3.78

3.56

3.39

3.26

3.15

3.06

2.93

2.78

2.63

2.55

2.47

2.38

2.29

2.20

2.10

28

7.64

5.45

4.57

4.07

3.75

3.53

3.36

3.23

3.12

3.03

2.90

2.75

2.60

2.52

2.44

2.35

2.26

2.17

2.06

29

7.60

5.42

4.54

4.04

3.73

3.50

3.33

3.20

3.09

3.00

2.87

2.73

2.57

2.49

2.41

2.33

2.23

2.14

2.03

30

7.56

5.39

4.51

4.02

3.70

3.47

3.30

3.17

3.07

2.98

2.84

2.80

2.55

2.47

2.39

2.30

2.21

2.11

2.01

40

7.31

5.18

4.31

3.83

3.51

3.29

3.12

2.99

2.89

2.80

2.66

2.52

2.37

2.29

2.20

2.11

2.02

1.92

1.80

60

7.08

4.98

4.13

3.65

3.34

3.12

2.95

2.82

2.72

2.63

2.50

2.35

2.20

2.12

2.03

1.94

1.84

1.73

1.60

120

6.85

4.79

3.95

3.48

3.17

2.96

2.79

2.66

2.56

2.47

2.34

2.19

2.03

1.95

1.86

1.76

1.66

1.53

1.38

∞6.63

4.61

3.78

3.32

3.02

2.80

2.64

2.51

2.41

2.32

2.18

2.04

1.88

1.79

1.70

1.59

1.47

1.32

1.00

d2\d

1

289

Page 287: Llibre estadística