estadística descriptiva

13
Contenido Introducci´ on y Test inicial Estad´ ıstica Descriptiva An´ alisis de Varianza R:M´oduloII Sociedad Ecuadoriana de Estad´ ıstica SEE ıctor Morales O˜ nate 25/02/2015-10/03/2015 VMO R:M´oduloII

Upload: victor-morales-onate

Post on 27-Sep-2015

215 views

Category:

Documents


1 download

DESCRIPTION

Estadística Descriptiva en R

TRANSCRIPT

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    R: Modulo II

    Sociedad Ecuadoriana de EstadsticaSEE

    Vctor Morales Onate

    25/02/2015-10/03/2015

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Introduccion y Test inicial

    Estadstica Descriptiva

    Analisis de Varianza

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Estimador

    Los datos siguientes provienen de una muestra aleatoria simple:

    I 5 8 10 7 10 14

    I Cual es la estimacion puntal de la media poblacional?

    Como respuestas a una pregunta de una encuesta a 150 individuosde una muestra se obtuvieron 75 SI, 55 NO, y 20 individuos nodieron su opinion.

    I Cual es la estimacion puntual de la proporcion que respondeSI?

    I Cual es la estimacion puntual de la proporcion que respondeNO?

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Estimadores basicos

    A continuacion se vera las funciones basicas estadsticas como:

    I Media

    I Varianza

    I Desviacion Estandar

    I Correlacion

    Todas estas funciones y su interpretacion se analizaran a partir delarchivo table2 8.csv

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Exploracion grafica

    Al parecer los datos no provienen de una distribucion normal. Real-izamos un test:

    library(car)

    scatterplot(TOTALEXP, FOODEXP, smooth=F,

    main="Relacion entre el gasto total y gasto en comida",

    xlab="Gasto total", ylab="Gasto en comida",grid=F)

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Normalizacion

    Que ganamos con los datos normalizados?

    mean(normtot)

    sd(normtot)

    var(TOTALEXP,FOODEXP) #varianza

    cor(TOTALEXP,FOODEXP) #correlacion

    var(normt1,normf1) #varianza

    cor(normt1,normf1) #correlacion

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Normalizacion

    Veamos los datos graficamente:

    plot(normtot, normfood,

    main=

    "Relacion entre el gasto total

    y gasto en comida (estandarizadas)",

    xlab="Gasto total", ylab="Gasto en comida")

    abline(v=0)

    abline(h=0)

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Interpretacion

    I Cuadrante 1: gasto total y en comida en comida mayor que elpromedio

    I Cuadrante 2: gasto total inferior al promedio, pero gastanmas que el promedio en comida

    I Cuadrante 3: tienen menos gasto total que el promedio y elgasto en comida es menor al promedio

    I Cuadrante 4: tiene un gasto total mayor el promedio pero sugasto en comida es menor al promedio

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Contraste de medias

    Abrimos la base de datos InsectSprays

    str(InsectSprays)

    names(InsectSprays)

    summary(InsectSprays)

    library(ggplot2)

    qqnorm(InsectSprays$count)

    tapply(InsectSprays$count,InsectSprays$spray,qqnorm)

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Contraste de medias

    Al parecer los datos no provienen de una distribucion normal. Real-izamos un test:

    shapiro.test(InsectSprays$count) # Ho: Pob Normal

    tapply(ChickWeight$weight,ChickWeight$Diet,shapiro.test)

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Contraste de medias

    La va alternativa es hacer un test no parametrico

    boxplot(count ~ spray,data = InsectSprays, col = rainbow(6))

    tapply(ChickWeight$weight,ChickWeight$Diet,mean)

    kruskal.test(count ~ spray, data = InsectSprays) # Ho: Pob identicas

    VMO

    R: Modulo II

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Analisis de Varianza

    Si hubiera sido de distribucion normal, pudimos haber usado elanalisis de varianza:

    aov.spray1

  • Contenido Introduccion y Test inicial Estadstica Descriptiva Analisis de Varianza

    Analisis de Varianza

    Que sucede dentro de los grupos?

    TukeyHSD(aov.spray1,"spray")

    VMO

    R: Modulo II

    Introduccin y Test inicialEstadstica DescriptivaAnlisis de Varianza