covarianza 123
Post on 06-Jul-2018
221 Views
Preview:
TRANSCRIPT
-
8/17/2019 Covarianza 123
1/13
Covarianza
La covarianza de una variable bidimensional es la media aritméticade los productos de las desviaciones de cada una de las variables
respecto a sus medias respectivas.
La covarianza se representa por sxy o σxy.
La covarianza indica el sentido de la correlación entre las variables
Si σxy > 0 la correlación es directa.
Si σxy < 0 la correlación es inversa.
La covarianza presenta como inconveniente, el hecho de que suvalor depende de la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos la altura en metros oen centímetros. ambién variará si el dinero lo expresamos en euroso en dólares.
Ejemplos:
Las notas de !" alumnos de una clase en #atemáticas $ %ísica son lassiguientes&
Matemáticas Física
2 1
3 3
2
-
8/17/2019 Covarianza 123
2/13
!
"
" "
#
# "
$ #
10 %
10 10
'allar la covarianza de la distribución.
xi yi xi & yi
2 1 2
3 3 %
2 $
1"
5 4 20
6 4 24
6 6 36
7 4 28
7 6 42
-
8/17/2019 Covarianza 123
3/13
8 7 56
10 9 90
10 10 100
72 60 431
(espués de tabular los datos hallamos las me'ias aritm(ticas &
Los valores de dos variables ) e * se distribu$en seg+n la tablasiguiente&
Y/X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
'allar la covarianza de la distribución.
En primer lugar convertimos la tabla de doble entrada en tabla simple
$ calculamos las medias aritméticas.
xi yi f i xi · f i yi · f i xi · yi · f i
0 1 2 0 2 0
0 2 1 0 2 0
http://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.html
-
8/17/2019 Covarianza 123
4/13
0 3 2 0 6 0
2 1 1 2 1 2
2 2 4 8 8 16
2 3 5 10 15 30
4 1 3 12 3 12
4 2 2 8 4 16
20 40 41 76
Coefciente de correlación lineal
El coe)iciente 'e correlaci*n lineal es el cociente entre
la covarianza $ el producto de las 'esviaciones típicas de ambas
variables.
El coe)iciente 'e correlaci*n lineal se expresa mediante la letra r .
+ropie'a'es
1, El coe)iciente 'e correlaci*n no varía al hacerlo la escala de
medición.
Es decir, si expresamos la altura en metros o en centímetros el
coeiciente de correlación no varía.
2, El signo del coe)iciente 'e correlaci*n es el mismo que el dela covarianza.
-
8/17/2019 Covarianza 123
5/13
Si la covarian-a es positiva, la correlación es directa.
Si la covarian-a es negativa, la correlación es inversa.
Si la covarian-a es nula, no existe correlación.
3, El coe)iciente 'e correlaci*n lineal es un n+mero realcomprendido entre ! $ !.
-1 . r . 1
, Si el coe)iciente 'e correlaci*n lineal toma valores cercanos a! la correlación es )/erte e inversa, $ será tanto más uerte cuantomás se aproxime r a !.
!, Si el coe)iciente 'e correlaci*n lineal toma valores cercanos a !
la correlación es )/erte y 'irecta, $ será tanto más uerte cuantomás se aproxime r a !.
", Si el coe)iciente 'e correlaci*n lineal toma valores cercanos a/, la correlación es '(il.
#, Si r 0 ! ó !, los puntos de la nube están sobre la recta crecienteo decreciente. Entre ambas variables ha$ 'epen'encia )/ncional.
Ejemplos:
Las notas de !" alumnos de una clase en #atemáticas $ %ísica son lassiguientes&
Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
-
8/17/2019 Covarianza 123
6/13
7 6
8 7
10
10 10
'allar el coe)iciente 'e correlaci*n de la distribución e
interpretarlo.
!i "i !i #"i !i2 "i2
2 1 2 4 1
3 3
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 4 16
7 6 42 4 36
8 7 56 64 4
10 0 100 81
10 10 100 100 100
72 60 431 504 380
1 'allamos las me'ias aritm(ticas .
http://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.html
-
8/17/2019 Covarianza 123
7/13
2 1alculamos la covarianza.
3 1alculamos las 'esviaciones típicas.
2plicamos la órmula del coe)iciente 'e correlaci*n lineal.
2l ser el coe)iciente 'e correlaci*n positivo, la correlación es
directa.
1omo coe)iciente 'e correlaci*n está mu$ próximo a ! la
correlación es mu$ uerte.
Los valores de dos variables ) e * se distribu$en seg+n la tablasiguiente&
$%& 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
'eterminar el coefciente de correlación(
1onvertimos la tabla de doble entrada en tabla simple.
!i "i ) i !i # ) i !i2 # ) i "i # ) i "i2 # ) i !i # "i # ) i
0 1 2 0 0 2 2 0
http://www.vitutor.com/estadistica/bi/covarianza.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_16.htmlhttp://www.vitutor.com/estadistica/bi/covarianza.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_16.html
-
8/17/2019 Covarianza 123
8/13
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 7 76
2l ser el coe)iciente 'e correlaci*n negativo, la correlación es
inversa.
1omo coe)iciente 'e correlaci*n está mu$ próximo a / lacorrelación es mu$ débil.
'ia*rama de +,ntos3n diagrama de puntos es una gráica utili-ada para ilustrar un n+mero
reducido de datos, la cual permite identiicar con acilidad dos características&
!. La locali-ación de los datos.
". La dispersión o variabilidad de los datos.
-
8/17/2019 Covarianza 123
9/13
Este diagrama muestra cada uno de los elementos de un conjunto de datos
numéricos por encima de una recta numérica 4eje hori-ontal5, acilita la
ubicación de los espacios vacíos $ los agrupamientos en un conjunto de datos,
así como la manera en que estos datos se distribu$en a los largo del eje
hori-ontal.
-os .asos .ara constr,ir el dia*rama
son/
6aso 7 !& ra-ar una línea hori-ontal con el valor mínimo colocado en el
extremo i-quierdo, seleccionar una escala $ utili-ando intervalos regulares,
marcar la escala hasta que el valor máximo sea alcan-ado.
6aso 7 "& 6ara cada valor numérico presente en la tabla de datos, colocar un
punto sobre la escala de valores en la recta numérica, cuando el valor
numérico aparece más de una ve-, apilar los puntos.
em.lo/
La tabla siguiente muestra los datos de longitud en milímetros de un conjunto
de cables que serán utili-ados en un estudio de resistencia a la tensión&
Cale -on*it,
d
Cale -on*it,
d
Cale -on*it,
d
Cale -on*it,
d
1 20 6 40 11 40 16 40
2 80 7 20 12 110 17 200
3 110 8 20 13 120 18 10
4 100 9 90 14 20 19 100
5 80 10 80 15 40 20 150
+aso 1& ra-ar una línea hori-ontal con el valor mínimo colocado en el
extremo i-quierdo, seleccionar una escala $ utili-ando intervalos regulares,
marcar la escala hasta que el valor máximo sea alcan-ado.
-
8/17/2019 Covarianza 123
10/13
+aso 2: 6ara cada valor numérico presente en la tabla de datos, colocar un
punto sobre la escala de valores en la recta numérica, cuando el valor
numérico aparece más de una ve-, apilar los puntos.
mportante: El diagrama de puntos es una representación de datos +til para
muestras peque8as, hasta 4digamos5 unas "/ observaciones 4(ouglas 1.
#ontgomer$, "//95.
nálisis de re*resión linealEl objeto de un análisis de regresión es investigar la relación estadística
que existe entre una variable dependiente 4Y 5 $ una o más
variables independientes 4 , ... 5. 6ara poder reali-ar esta investigación, se
debe postular una relación uncional entre las variables. (ebido a su simplicidad
analítica, la orma uncional que más se utili-a en la práctica es la relación lineal .
1uando solo existe una variable independiente, esto se reduce a una línea recta&
-
8/17/2019 Covarianza 123
11/13
(onde los coeicientes b/ $ b! son parámetros que deinen la posición e
inclinación de la recta. 4:ótese que hemos usado el símbolo especial para
representar el valor deY calculado por la recta. 1omo veremos, el valor real de Y rara
ve- coincide exactamente con el valor calculado, por lo que es importante hacer esta
distinción.5
El parámetro b/, conocido como la ;ordenada en el origen,; nos indica cuánto es Y
cuando X 0 /. El parámetro b!, conocido como la ;pendiente,; nos indica cuánto
aumenta Y por cada aumento de una unidad en X . :uestro problema consiste en
obtener estimaciones de estos coeicientes a partir de una muestra de observaciones
sobre las variables Y $ X . En el análisis de regresión, estas estimaciones se obtienen
por medio del método de mínimos cuadrados.
1omo ejemplo, consideremos las ciras del 1uadro !, que muestra datos mensuales
de producción $ costos de operación para una empresa británica de transporte depasajeros por carretera durante los a8os !9" 4la producción se mide en términos
de miles de millas=vehículo recorridas por mes, $ los costos se miden en términos de
miles de libras por mes5. 6ara poder visuali-ar el grado de relación que existe entre las
variables, como primer paso en el análisis es
conveniente elaborar un diagrama de
dispersión, que es una representación en un
sistema de coordenadas cartesianas de los datos numéricos observados. En el
diagrama resultante, en el eje X se miden las millas=vehículo recorridas, $ en el
eje Y se mide el costo de operación mensual. 1ada punto en el diagrama muestra la
pareja de datos 4millas=vehículo $ costos de operación5 que corresponde a un mesdeterminado. 1omo era de esperarse, existe una relación positiva entre estas
variables& una ma$or cantidad de millas=vehículo recorridas corresponde un ma$or
nivel de costos de operación.
-
8/17/2019 Covarianza 123
12/13
-
8/17/2019 Covarianza 123
13/13
o 1aso 2 = Elecciones en %lorida
o 1aso @ Le$ de Jun& (esempleo $ 1recimiento Económico, 3S2
!9AA=9>.
o 1aso 1 Le$ de Jun& (esempleo $ 1recimiento Económico, 3S2
!9"9=>
top related