tema 1 (copia en conflicto de josé juan pérez gonzález)

Upload: yoel-garcia

Post on 06-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    1/21

    Grado en Ingenieŕıa Inform´ atica 

    Estad́ıstica 

    Roćıo Raya [email protected]

    Curso 2013/2014

    Dpto. Estad́ıstica e I.O.Universidad de Granada

    http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    2/21

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Introducción: Conceptos básicos

    TEMA 1. ESTAD́ISTICA DESCRIPTIVA UNIDIMENSIONAL

    INTRODUCCIÓN: CONCEPTOS BÁSICOS

    La observación de fenómenos que acontecen en la vida real permiten establecer unaclasificación de los mismos:

    Fenómeno determinista: Un fenómeno es  determinista  si al repetirlo en idénticascondiciones se obtiene el mismo resultado.

    Fenómeno aleatorio: Un fenómeno es  aleatorio  si al repetirlo en análogas condiciones puedepresentar resultados diferentes.

    La estad́ıstica se ocupa principalmente de los fenómenos aleatorios, encontrándose ante unconjunto de observaciones que presentan una variabilidad dif́ıcil de explicar y que requieren untratamiento especial (”tratamiento estad́ıstico”) para poder efectuar conclusiones. Por lo tanto,la estadı́stica  es una rama de las matemáticas que trata de la recopilación, el análisis, lainterpretación y la representación de una gran cantidad de datos numéricos.

    Las etapas de un estudio estad́ıstico son las siguientes:1.  Recogida de datos

    2.   Ordenación, tabulación y gráficos

    3.   Descripción de caracteŕısticas

    −→  Estad́ıstica descriptiva

    4.   Análisis formal

    −→  Inferencia estad́ıstica

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 2 / 122

    http://-/?-http://-/?-http://-/?-http://find/http://goback/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    3/21

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Introducción: Conceptos básicos

    Definición

    Se denomina poblaci´ on al conjunto objeto de estudio, es decir, cualquier conjunto de unidades con ciertas caracteŕısticas comunes, sobre las que se desea informaci´ on.

    Definición

    Cada uno de los elementos de la poblaci´ on se denomina unidad estad́ıstica  o  individuo .

    La población puede ser finita o infinita, según que los elementos que la formen se presenten ennúmero finito o infinito.

    DefiniciónSe denomina muestra a un subconjunto representativo de la poblaci´ on.

    Definición

    Se llaman  caracteres  a las propiedades que se desean observar en los elementos de la poblaci´ on y 

    que han de tener todos y cada uno de ellos.

    En un estudio particular pueden considerarse una sola caracteŕıstica o varias a la vez.

    Definición

    Las  modalidades  son cada una de las formas en que puede presentarse un carácter.

    Para estar bien definidas deben cumplir dos requisitos: exhaustividad e incompatibilidad.R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 3 / 122

    http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    4/21

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Introducción: Conceptos básicos

    Modalidades exhaustivas:   Se dice que las modalidades de un carácter son exhaustivas si cubren

    todas las posibles formas en que éste se manifiesta.Modalidades incompatibles:   Se dice que las modalidades de un carácter son incompatibles

    cuando cada individuo solo puede presentar una de las modalidades.

    Clasificación de caracteres según las modalidades:

    Cuantitativos:   Un carácter es cuantitativo cuando sus modalidades son mediblesnuméricamente. Los caracteres cuantitativos se denominan también  variablesestad́ısticas. Se subdividen en dos grupos:

    Variables estad́ısticas discretas: Son aquellas que tienen un número finito oinfinito numerable de modalidades. Las modalidades son valores aislados.Variables estad́ısticas continuas: El número de modalidades es nonumerable. Las posibles modalidades son todos los valores de un intervalo.

    Cualitativos:   Un carácter es cualitativo cuando sus modalidades no son mediblesnuméricamente. Un carácter cualitativo recibe también el nombre de atributo.

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 4 / 122

    T 1 E d́ i D i i U idi i l Di ib i´ d f i

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    5/21

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Distribución de frecuencias

    DISTRIBUCIÓN DE FRECUENCIAS

    Definición

    La distribuci´ on de frecuencias de una variable estad́ıstica  es el conjunto de valores ordenados de la variable con sus frecuencias correspondientes.

    Formalmente se representa por el conjunto de pares ordenados.

    Variable cualitativa Variable cuantitativaDiscreta Continua{(M i; ni)}

    ki=1   {(xi; ni)}

    ki=1   {(I i; ni)}

    ki=1

    o o o{(M i; f i)}ki=1   {(xi; f i)}

    ki=1   {(I i; f i)}

    ki=1

    M i: cada una de las modalidades de una variable cualitativa.

    xi: cada uno de los valores numéricos que puede tomar una variable estad́ıstica discreta.

    I i: cada uno de los intervalos que constituyen las modalidades de una variable estad́ısticacontinua, considerando que  I i  = (ei−1; ei], siendo  ei−1  y  ei  los extremos inferior y superior,respectivamente, del intervalo.

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 5 / 122

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    6/21

    Tema 1 Estad́ıstica Descriptiva Unidimensional Distribución de frecuencias

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    7/21

    Tema 1. Estadıstica Descriptiva Unidimensional   Distribucion de frecuencias

    Definición

    Frecuencia absoluta acumulada ( N i): N´ umero de individuos que presentan un valor de la variable menor o igual que el considerado, por lo tanto, es la suma de las frecuencias absolutas hasta lai-ésima modalidad,

    N i  = n1 + n2 + ... + ni  =i

    j=1

    nj  ⇒ N k  =  N   =k

    i=1

    ni

    Definición

    Frecuencia relativa acumulada ( F i): Proporci´ on de individuos de la poblaci´ on que presentan unvalor de la variable menor o igual que el considerado, por lo tanto, es la suma de las frecuencias relativas hasta la i-ésima modalidad,

    F i  = f 1 + f 2 + ... + f i  =

    i

    j=1

    f j  ⇒ F k  = 1 =

    k

    i=1

    f i

    También puede calcularse como    F i  =  N iN 

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 7 / 122

    Tema 1 Estad́ıstica Descriptiva Unidimensional Tablas de frecuencias

    http://-/?-http://-/?-http://-/?-http://goforward/http://find/http://goback/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    8/21

    Tema 1. Estadıstica Descriptiva Unidimensional   Tablas de frecuencias

    TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADÍSTICA DISCRETA

    Se considera una variable estad́ıstica discreta,  X , que toma los valores   x1, . . . , xi, . . . , xk. Latabla estad́ıstica con los tipos de frecuencias estudiados se construye de la siguiente forma:

    xi   ni   N i   f i   F ix1   n1   N 1   f 1   F 1x2   n2   N 2   f 2   F 2

    ......

    ......

    ...xi   ni   N i   f i   F i...

    ......

    ......

    xk   nk   N k  = N f k   F k  = 1Total   N    1

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 8 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional Tablas de frecuencias

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    9/21

    Tema 1. Estadıstica Descriptiva Unidimensional   Tablas de frecuencias

    TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADÍSTICA CONTINUA

    En las variables de tipo continuo se agrupan los valores de la variable en intervalos o clases quese denotan como  I i  = (ei−1, ei]

    Cada clase está representada por su punto medio, que recibe el nombre de marca de clase, y sedenota por   xi, por lo tanto, se obtiene como

    xi  =  ei−1 + ei

    2

    Se define amplitud del intervalo  a la diferencia entre los extremos del intervalo,

    ai  =  ei − ei−1

    Los intervalos de una población pueden elegirse de igual o distinta amplitud.

    El número de intervalos,  k, a utilizar no está determinado de forma fija y por tanto, se usa un

    k  que permita trabajar cómodamente y represente bien la estructura de los datos.

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 9 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Tablas de frecuencias

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    10/21

    p

    La tabla de frecuencias correspondiente a las variables estad́ısticas de tipo continuo con lasfrecuencias estudiadas es la siguiente:

    I i  = (ei−1, ei]   xi   ni   N i   f i   F i   ai[e0, e1]   x1   n1   N 1   f 1   F 1   a1

    ......

    ......

    ......

    ...

    (ei−1, ei]   xi   ni   N i   f i   F i   ai...

    ......

    ......

    ......

    (ek−1, ek]   xk   nk   N k  = N f k   F k  = 1   akTotal   N    1

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 10 / 122

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    11/21

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Representaciones gráficas

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    12/21

    REPRESENTACIONES GRÁFICAS DE VARIABLES ESTADÍSTICAS CONTINUAS

    Histograma: El histograma se construye representando losintervalos en el eje de abscisas y la densidad de frecuencia enel eje de ordenadas. Se dibujan rectángulos de base laamplitud  ai  y de altura la densidad de frecuencia,  hi, siendo

    hi  =

      ni

    ai o  hi  =

      f i

    ai .

    Poĺıgono de frecuencias: Es la ĺınea que se obtiene uniendocon segmentos, los puntos medios de los extremos superioresde los rectángulos que forman el histograma.

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 12 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Representaciones gráficas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    13/21

    REPRESENTACIONES GRÁFICAS DE VARIABLES ESTADÍSTICAS CUALITATIVAS

    Diagrama de barras: En unos ejes cartesianos se representansobre el eje de abscisas las distintas modalidades del carácter ysobre el eje de ordenadas los valores de las frecuenciasabsolutas. A continuación, en el eje de abscisas se levantanrectángulos de base constante y de altura proporcional a la

    frecuencia absoluta correspondiente.

    Gráfico de sectores: En esta representación un ćırculo se divideen tantos sectores circulares como modalidades tenga elcarácter, teniendo cada sector el área proporcional a lafrecuencia absoluta correspondiente. Los grados de cada sector

    se obtienen resolviendo la proporción   niN 

      =   αio

    360o

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 13 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    14/21

    MEDIDAS DE POSICIÓN CENTRAL

    Definición

    Las  medidas de posici´ on tratan de resumir y sintetizar el conjunto de datos mediante un valor numérico.

    Si este valor numérico se sitúa hacia el centro de la distribución se habla, entonces, de medidasde posición central. Las principales medidas de posición central son: la media, la mediana y lamoda. Se estudiarán también otras  medidas de posición no central llamadas cuantiles. En cadamedida se distingue para su cálculo entre los casos discreto y continuo.

    Definición

    Media aritmética: Sea una variable   X , con valores  x1, x2, . . . , xk   y frecuencias absolutas n1, n2, . . . , nk. Entonces, se define la media, y se denota por  x̄, como la suma ponderada de los valores de la variable por sus frecuencias.

    -   Caso discreto:   x̄ =k

    i=1 xif i  =

      1

    N k

    i=1 xini   siendo   N   el número total deobservaciones.

    -  Caso continuo: En este caso los intervalos se representan por su marca de clase,definiéndose la media de forma análoga al caso de variable estad́ıstica discreta.

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 14 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    15/21

    Definición

    Mediana: Se define la mediana y se denota por Me, como aquel valor de la variable estad́ısticaque divide en dos conjuntos iguales a los valores de la variable supuestos ordenados de forma

    ascendente seg´ un el carácter.

    -   Caso discreto:

    1   Si no existe un valor  xi   con   F i  = 0.5, entonces la mediana es el primer valor de lavariable tal que   F i   > 0.5

    2   Si existe un valor  xi   con  F i  = 0.5, entonces la mediana será la media aritmética de los

    valores  xi   y   xi+1, es decir,M e =

      xi + xi+1

    2

    -   Caso continuo:

    1   Si existe algún intervalo   I i, tal que  F i  = 0.5, entonces   M e =  ei2   Si no existe un intervalo I i, tal que  F i  = 0.5, se selecciona el primer intervalo en el

    que   F i   > 0.5. A este intervalo se le denomina intervalo mediano, se denota por   I Me.El valor exacto de la mediana se obtiene aplicando al intervalo mediano la siguientefórmula:

    M e =  ei−1 + 0.5 − F i−1

    f i· ai

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 15 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    16/21

    Definición

    Moda: Se define la moda y se nota por Mo, como el valor más frecuente de la distribuci´ on, o lo que es lo mismo, el que más se repite.

    La moda puede no ser única (más de una modalidad tienen igual frecuencia máxima) o inclusono existir (cuando todos las modalidades de la variable tengan igual frecuencia).

    -   Caso discreto: En este caso, la moda es el valor de la variable que corresponde a la máximafrecuencia absoluta.

    M o =  xi   tal que   ni  =  maxjnj

    -  Caso continuo: En primer lugar, se elige el intervalo modal,   I Mo  = (ei−1, ei], que es aquelque tenga máxima altura o densidad de frecuencia  hi  = max

    jhj . El valor exacto de la moda

    se obtiene aplicando al intervalo modal la siguiente fórmula:

    M o =  ei−1 +   (hi − hi−1)(hi − hi−1) + (hi − hi+1)

      · ai

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 16 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    17/21

    OTRAS MEDIDAS DE POSICIÓN. CUANTILES

    Sea  X   una variable estad́ıstica y sea   α  un número real tal que  0 < α

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    18/21

    Cálculo de un cuantil

    Para calcular un cuantil  C (α)  se razona de manera análoga al cálculo de la mediana.

    -   Caso discreto:

    1   Si no existe un valor  xi   con   F i  = α, entonces el cuantil de orden   α  es el primer valorde la variable tal que   F i   > α.

    2   Si existe un valor de la variable  xi  que verifique  F i  =  α, entonces el cuantil de orden  αserá

    C (α) =

      xi + xi+1

    2

    -   Caso continuo:

    1   Si existe algún intervalo   I i, tal que  F i  =  α, entonces   C (α) =  ei2   Si no existe un intervalo I i, tal que  F i  =  α, se selecciona el primer intervalo en el

    F i  > α. Dicho intervalo contiene el cuantil y para determinar el valor exacto se utilizala interpolación con la siguiente fórmula:

    C (α) =  ei−1 +  α − F i−1

    f i· ai

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenierı́a Informática Estadı́stica   Curso 2013/2014 18 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    ´

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    19/21

    MEDIDAS DE DISPERSIÓN

    Las medidas de dispersión informan de lo próximas o alejadas que están las observaciones entreśı o en relación con un valor de referencia que normalmente es una medida de centralización. Deesta forma, se pueden considerar las medidas de tendencia central como muy representativas del

    conjunto, poco representativas, o en algunos casos, nada representativas, dependiendo de losvalores adoptados por las medidas de dispersión.

    Se considera la variable estad́ıstica   X  que toma los valores   x1, x2, . . . , xk   (con variableestad́ıstica continua se consideran las marcas de clase de los intervalos) y frecuenciasn1, n2, . . . , nk.

    DefiniciónRango o recorrido : Es la medida de dispersi´ on más simple y se calcula como la diferencia entre el valor máximo y el ḿınimo de la variable.

    R = maxi=1,...,k

    {xi} −   mini=1,...,k

    {xi}

    Definición

    Recorrido Intercuart́ılico : Es la diferencia entre el tercer y primer cuartil. Presenta la ventaja de que elimina el efecto distorsionante de los valores extremos.

    RIQ =  Q3 − Q1

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 19 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    20/21

    Definición

    Varianza: Se define la varianza y se denota por  σ2, como la media aritmética de los cuadrados de las desviaciones entre los valores de la variable estad́ıstica y la media aritmética.

    σ2 =k

    i=1

    (xi −  x̄)2f i  =

      1

    ki=1

    (xi −  x̄)2ni

    La varianza siempre será mayor o igual que cero. Mientras más se aproxime a cero, más

    concentrados están los valores en torno a la media. Por el contrario, mientras mayor sea lavarianza, más dispersos están. El inconveniente que presenta es que no está acotadasuperiormente, por lo que cuando los valores son grandes no se tiene una clara interpretación.

    Cálculo simplificado de la varianza (Teorema de König)

    Se obtiene una expresión más simple y sencilla para calcular la varianza

    σ2 =k

    i=1

    x2i f i −  x̄2 =

      1

    ki=1

    x2i ni −  x̄2

    R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 20 / 122

    Tema 1. Estad́ıstica Descriptiva Unidimensional   Caracterı́sticas de variables estad́ısticas

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-

  • 8/18/2019 Tema 1 (Copia en Conflicto de José Juan Pérez González)

    21/21

    Definición

    Desviaci´ on T́ıpica: La varianza es una medida de dispersi´ on que viene dada en unidades al cuadrado. Para mantener la misma unidad de medida de las observaciones, se define ladesviaci´ on t́ıpica, y se denota por   σ, como la ráız cuadrada positiva de la varianza,

    σ  =

      ki=1

    (xi −  x̄)2f i  =

      1N 

    ki=1

    (xi −  x̄)2ni  =

      1N 

    ki=1

    x2i ni −  x̄2

    Definición

    Coeficiente de variaci´ on de Pearson: Se define el coeficiente de variaci´ on de Pearson de unavariable estad́ıstica  X , y se denota por  CV  x, como el cociente entre la desviaci´ on t́ıpica y lamedia aritmética,

    CV  x  =  σx

    Se utiliza para comparar la dispersión de dos o más distribuciones en las que las variablesvienen expresadas en unidades distintas ya que es una medida de dispersión relativa sin

    dimensión. Presenta la ventaja de utilizar toda la información que suministra la distribución. El

    coeficiente de variación representa el número de veces que la desviación t́ıpica contiene a la

    media aritmética, por tanto, cuanto mayor sea el coeficiente de variación significa que mayor

    número de veces contiene la desviación t́ıpica a la media aritmética y entonces la media

    aritmética es menos representativa.R. Raya (Dpto. Estad́ıstica e I.O.)   Grado en Ingenieŕıa Informática Estadı́stica   Curso 2013/2014 21 / 122

    http://-/?-http://-/?-http://-/?-http://find/http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-http://-/?-