t ecnicas econom etricas - home | universidad de …romansg/material/webeco/master.pdf ·...

99
ecnicas Econom´ etricas aster Universitario ecnicas Cuantitativas en Gesti´ on Empresarial Rom´ anSalmer´onG´ omez Granada, 2013

Upload: buihanh

Post on 07-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Tecnicas

Econometricas

Master Universitario

Tecnicas Cuantitativas en Gestion Empresarial

Roman Salmeron GomezGranada, 2013

Page 2: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,
Page 3: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Tecnicas Econometricas: breve descripcion de contenidos

Roman Salmeron Gomez

A continuacion se comenta brevemente la parte de la asignatura Tecnicas Econometricas impartidapor el Prof. Roman Salmeron en el master en Tecnicas Cuantitativas para la Gestion Empresarial.

Es conveniente hacer hincapie al estudiante de la necesidad de repasar conocimientos adquiridosen el grado (calculo diferencial, algebra matricial, inferencia estadıstica, etc) ya que seran usados deforma constante durante el discurrir de la asignatura.

La asignatura comienza con una introduccion al alumno al concepto de Econometrıa y modeloeconometrico. Con tal objetivo se realiza un breve bosquejo historico de la Econometrıa, ademasde proporcionar una definicion de la misma. A continuacion se define que se entiende por modeloeconometrico y se describen las fases a realizar en todo analisis econometrico (especificacion, estimacion,validacion y explotacion del modelo). Finalmente, se explica la naturaleza de la informacion utilizada.

Tras conocer que es un modelo econometrico se presenta su formulacion matematica ası como lashipotesis basicas que debe verificar. Este ultimo aspecto es importante destacarlo, ya que el alumnodebe saber que toda estimacion y validacion del modelo queda supeditada a que se verifiquen dichashipotesis (es mas, los ultimos temas de la asignatura - segunda parte - se dedican a esta cuestion). Acontinuacion se estimaran, por el metodo de Mınimos Cuadrados Ordinarios, las cantidades desconoci-das del modelo (coeficientes de los regresores y varianza de la perturbacion aleatoria) y se analizaran suspropiedades. Finalmente, se comenzara con la fase de validacion del modelo econometrico presentandouna primera herramienta para medir la bondad del ajuste realizado: el coeficiente de determinacion ycoeficiente de determinacion corregido.

A continuacion se introduce en el modelo la suposicion de que la perturbacion aleatoria se distri-buye segun una normal. A partir de este momento, el modelo econometrico toma una nueva dimensionya que esta suposicion permitira calcular intervalos de confianza y contrastes de hipotesis para losparametros desconocidos del modelo. Ası, en primer lugar se presentaran las distribuciones en el mues-treo de los estimadores obtenidos en el tema anterior por el metodo de Mınimos Cuadrados Ordinarios(MCO), las cuales permitiran contrastar un conjunto de hipotesis lineales. Como casos particulares sedestacan los contrastes de significacion individual y se realiza una breve resena a los Mınimos Cuadra-dos Restringidos. Ademas, constituyen tambien el punto de partida que permitira introducir el analisisde la varianza (analisis ANOVA). En este punto es interesante mostrar su relacion con el coeficientede determinacion, ya que permite obtener un valor a partir del cual este ultimo es significativo y, portanto, valida el modelo.

En la ultima fase, se explotara el modelo a partir de la prediccion puntual optima y por intervalo,ası como a traves del contraste de permanencia estructural. Finalmente, se destacara que todas lasconclusiones obtenidas no tienen validez si antes no se comprueba que la perturbacion aleatoria sigueuna distribucion normal.

Todos estos contenidos seran abordados tanto desde un aspecto teorico/practico como (muy espe-cialmente) desde un aspecto computacional, mas concretamente, con el software econometrico Gretl.

Page 4: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,
Page 5: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 1

MÓDULO ASIGNATURA CURS

O SEMESTR

E CRÉDITOS CARÁCTER

1 TÉCNICAS ECONOMÉTRICAS 1 1 4 OPTATIVA

PROFESOR(ES) DIRECCIÓN COMPLETA DE CONTACTO PARA TUTORÍAS

(Dirección postal, teléfono, correo electrónico, etc.)

JORGE CHICA OLMO

ROMÁN SALMERÓN GÓMEZ

Departamento de Métodos Cuantitativos para

la Economía y la Empresa.

Facultad de Ciencias Económicas y

Empresariales. Campus de Cartuja s/n. 18011

Granada.

Teléfono 958 240 619 Fax 958 240 620

Prof. Chica Olmo: [email protected]

Despacho C-223. Tfno. 958 249922

Prof. Salmerón Gómez: [email protected]

Despacho B-00. Tfno. 958 249637

HORARIO DE TUTORÍAS

El horario actualizado de tutorías puede consultarse en el siguiente enlace: http://metodoscuantitativos.ugr.es/pages/docencia

MÁSTER EN EL QUE SE IMPARTE OTROS MÁSTERES A LOS QUE SE PODRÍA OFERTAR

Técnicas Cuantitativas en Gestión Empresarial

PRERREQUISITOS Y/O RECOMENDACIONES (si procede)

Conocimientos básicos de técnicas cuantitativas y ordenador.

TÉCNICAS ECONOMÉTRICAS

GUIA DOCENTE DE LA ASIGNATURA

Page 6: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 2

BREVE DESCRIPCIÓN DE CONTENIDOS (SEGÚN MEMORIA DE VERIFICACIÓN DEL MÁSTER)

REGRESIÓN

1. El modelo de Regresión Lineal. Supuestos e Hipótesis. 2. El Procedimiento de Estimación Mínimo Cuadrático. Estimación Máximo

Verosímil. 3. Explotación de los Resultados de Estimación. Análisis de la Varianza (ANOVA).

Medidas de Ajuste y Diagnosis del Modelo. 4. Caso Práctico de Aplicación

INFERENCIA EN EL MODELO LINEAL

5. El Papel de Supuesto de Normalidad de las Perturbaciones. 6. Distribución de los Estimadores de los Parámetros en el Muestreo.

7. Inferencia en le Modelo de Regresión y Contraste de Hipótesis. Estimación por

Intervalo. Intervalos de Confianza. 8. Caso Práctico de Aplicación (Continuación)

TEMAS COMPLEMENTARIOS

9. Cambio Estructural y Estabilidad de los Parámetros 10. Estimación del Modelo Generalizado.

11. Problemas con los Datos: Multicolinealidad y Errores de Especificación.

COMPETENCIAS GENERALES Y ESPECÍFICAS DEL MÓDULO

Competencias Generales

- *CG0: Hablar bien en público. - CG1: Que los estudiantes adquieran la capacidad de trabajar en entornos internacionales. - CG2: Que los estudiantes adquieran la capacidad de crítica y autocrítica. - *CG3: Que los estudiantes sean capaces de buscar y recopilar información de un tema de interés

proveniente de fuentes diversas, especialmente a partir de las nuevas tecnologías. - *CG4: Que los estudiantes sean competentes para analizar, sintetizar y gestionar la información y

documentos disponibles de forma eficaz, incluyendo la capacidad de interpretar, evaluar y emitir un juicio razonado.

- *CG5: Que los estudiantes adquieran la capacidad de trabajar en equipo, fomentando el intercambio de ideas, compartiendo el conocimiento y generando nuevas metas y modelos de trabajo colaborativo.

- CG6: Que los estudiantes tengan la capacidad de trabajar en equipos multidisciplinares. - *CG7: Que los estudiantes tengan la capacidad de organización y planificación.

Page 7: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 3

Competencias Específicas

- *CE1: Aplicar las herramientas cuantitativas a la resolución de problemas en el ámbito empresarial planteados con datos procedentes de muestras de la población objetivo en estudio.

- *CE2: Aplicar las nuevas aportaciones en técnicas cuantitativas al ámbito empresarial así como la resolución de problemas en entornos nuevos o poco conocidos.

- *CE3: Capacidad de utilizar técnicas cuantitativas actuales que le permitan incorporarse a tareas de investigación en el contexto de la gestión empresarial.

- *CE4: Comprender el valor y los límites del método científico así como fomentar el interés por una investigación rigurosa propia del área de Métodos Cuantitativos para la Economía y la Empresa.

- *CE5: Capacidad de acceder a las bases de datos y fuentes documentales existentes para conocer las nuevas aportaciones en el campo de Métodos Cuantitativos para la Economía y la Empresa.

- CE6: Desarrollar una visión amplia y multidisciplinar de las aplicaciones de las principales técnicas cuantitativas.

- CE7: Adquirir conocimientos altamente especializados, alguno de ellos a la vanguardia en un campo de trabajo o estudio concreto, que sienten las bases de un pensamiento o investigación originales en el área de conocimiento de Métodos Cuantitativos para la Economía y la Empresa, así como ampliar sus conocimientos y atender las exigencias del mundo académico y profesional.

- CE8: Adquirir conciencia crítica de cuestiones de conocimiento en un tema concreto de las técnicas cuantitativas para emitir informes o juicios profesionales.

- *CE9: Capacidad de seleccionar las técnicas cuantitativas más idóneas para un correcto análisis o estudio.

- CE11: Plantear y construir modelos de series temporales que expliquen la evolución de una variable a lo largo del tiempo y a predecir sus valores futuros.

- *CE12: Capacidad de cuantificar relaciones de comportamiento entre variables económicas, verificar hipótesis sobre los parámetros de dichas relaciones y efectuar predicciones sobre las variables de interés.

*Con asterisco se indican las competencias de esta asignatura.

OBJETIVOS (EXPRESADOS COMO RESULTADOS ESPERABLES DE LA ENSEÑANZA)

El alumno sabrá/comprenderá: - Conocimientos sobre aspectos principales de la terminología económica, de la naturaleza de la

economía y el entorno económico inmediato, nacional e internacional. - Conocimientos sobre los principales modelos y técnicas de representación y análisis de la realidad

económica. - Las instituciones económicas como resultado y aplicación de representaciones teóricas o formales

acerca de cómo funciona la economía. - Las principales técnicas instrumentales aplicadas al ámbito económico.

El alumno será capaz de:

- Interpretar datos económicos, proporcionar información relevante útil para todo tipo de usuarios. - Aplicar al análisis de los problemas criterios profesionales basados en el manejo de instrumentos

técnicos. - Emitir informes de asesoramiento sobre situaciones concretas de la economía (internacional, nacional

o regional) o de sectores de la misma. - Desarrollar habilidades de aprendizaje para emprender estudios posteriores en el ámbito de la

economía con un alto grado de autonomía.

Page 8: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 4

TEMARIO DETALLADO DE LA ASIGNATURA

REGRESIÓN

1. El modelo de Regresión Lineal. Supuestos e Hipótesis. 2. El Procedimiento de Estimación Mínimo Cuadrático. Estimación Máximo

Verosímil.

3. Explotación de los Resultados de Estimación. Análisis de la Varianza (ANOVA). Medidas de Ajuste y Diagnosis del Modelo.

4. Casos prácticos desarrollados con software libre econométrico.

INFERENCIA EN EL MODELO LINEAL 5. El Papel de Supuesto de Normalidad de la las Perturbaciones.

6. Distribución de los Estimadores de los Parámetros en el Muestreo. 7. Inferencia en le Modelo de Regresión y Contraste de Hipótesis. Estimación por

Intervalo. Intervalos de Confianza. 8. Casos prácticos desarrollados con software libre econométrico (Continuación)

TEMAS COMPLEMENTARIOS

9. Cambio Estructural y Estabilidad de los Parámetros. Test de Chow. 10. Incumplimiento de las hipótesis básicas del modelo. Contraste de normalidad

en las perturbaciones.

11. Estimación del Modelo Generalizado. Heterocedasticiad y autocorrelación. 13. Problemas con los Datos. Multicolinealidad. Errores de Especificación. Datos

espaciales. 14. Casos prácticos desarrollados con software libre econométrico (Continuación)

BIBLIOGRAFÍA

ALONSO, A.; FERNÁNDEZ, J. y GALLASTEGUI, I. (2005).- Econometría. Ed. Prentice Hall GUJARATI, D. (2010).- Econometría.- Ed. McGraw Hill

MATILLA, M, PÉREZ, P y SANZ, B. (2013) Econometría y predicción. Ed. McGraw Hill

SÁNCHEZ, C. (1999) Métodos Econométricos. Ariel Economía. Barcelona.

STOCK, J.H. y WATSON, M.M. (2012) Introducción a la Econometría, 3ª ed. Pearson WOOLDRIDGE, J.M. (2010).- Introducción a la Econometría. Un enfoque moderno. 2ª Edic. Thomson

ENLACES RECOMENDADOS

Web del Dpto. de Métodos Cuantitativos para la Economía y la Empresa. http://metodoscuantitativos.ugr.es/

Instituto nacional de Estadística. http://www.ine.es/ Instituto de estadística andaluz. http://www.juntadeandalucia.es:9002/ Banco de España. http://www.bde.es/webbde/es/

Page 9: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 5

Bolsa de Madrid. http://www.bolsamadrid.es/homei.htm

Anuario Económico de La Caixa. http://www.anuarieco.lacaixa.comunicacions.com Eurostat, http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/.

Descarga gratuita del programa Gretl: http://descargar.portalprogramas.com/gretl.html, http://gretl.softonic.com/ Guía multimedia para la elaboración de un modelo econométrico. www.ugr.es/local/jchica/Pagina2/Modelo/Modelo.htm

Página personal de Román Salmerón: www.ugr.es/local/romansg/material/WebEco/index.html

METODOLOGÍA DOCENTE

La metodología que se llevará a cabo es la siguiente: 1. Tutorías personalizadas para buscar información reciente en diversas fuentes bibliográficas, plantear

cuestiones de investigación, etc.

2. Realización de trabajos individuales o en grupo para la resolución de problemas en el ámbito empresarial.

3. Lectura e interpretación de la bibliografía especializada, incluyendo artículos de actualidad,

propuesta en el programa de la materia.

4. Diseño, elaboración y exposición de un trabajo individual o en grupo de aplicación de los conocimientos teórico-práctico adquiridos.

5. Resolución de problemas relacionados con la materia y aplicados al ámbito empresarial. 6. Aplicaciones con ordenador.

En dicha metodología es importante:

1. Desarrollo de clases teóricas en las que se expondrán los distintos contenidos con ayuda de material didáctico diverso.

2. Desarrollo de clases prácticas en las que se resolverán problemas relacionados con la materia y aplicados en el ámbito empresarial. Asimismo se fomentará la participación de los alumnos.

3. Realización de lecturas relacionadas con la materia, sobre las que se formularán preguntas o se solicitará un resumen crítico.

4. Realización de sesiones de discusión del material bibliográfico previas a las lecciones magistrales fomentando la participación del alumno.

5. Asistencia a seminarios teórico-prácticos que puedan desarrollarse durante el desarrollo de la materia y que incluyan foros de discusión.

6. Realización de prácticas en el aula de informática.

7. Charlas/coloquios que refuercen los conocimientos de la materia y fomenten la participación activa del alumno.

Page 10: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Página 6

EVALUACIÓN (INSTRUMENTOS DE EVALUACIÓN, CRITERIOS DE EVALUACIÓN Y PORCENTAJE SOBRE LA CALIFICACIÓN FINAL, ETC.)

1. Prueba escrita: exámenes de ensayo, pruebas objetivas, resolución de problemas, casos o supuestos,

pruebas de respuesta breve, informes y diarios de clase. (Ponderación: 0.6)

2. Prueba oral: exposiciones de trabajos orales en clase, individuales o en grupo, sobre contenidos de la materia (seminario) y sobre ejecución de tareas prácticas correspondientes a competencias concretas. (Ponderación: 0.3)

3. Técnicas basadas en la asistencia y participación activa del alumno en clase, seminarios y tutorías:

trabajos en grupos reducidos sobre supuestos prácticos propuestos. (Ponderación: 0.1) El sistema de evaluación será preferentemente continua, entendiendo por tal la evaluación diversificada que se establece en este apartado. No obstante, se podrá realizar una evaluación única final a la que podrán acogerse aquellos estudiantes que no puedan cumplir con el método de evaluación continua por motivos laborales, estado de salud, discapacidad o cualquier otra causa debidamente justificada que les impida seguir el régimen de evaluación continua.

INFORMACIÓN ADICIONAL

La asignatura se desarrollará con la ayuda de ordenador.

Page 11: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Master TCGE Introduccion a la Econometrıa: regresion multiple – 1 / 68

Introducci on a la EconometrıaEl modelo de regresi on lineal multiple

Roman Salmeron Gomez

Universidad de Granada

Contenidos

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 2 / 68

Introducci on

Especificaci on del modelo

Estimaci on del modelo

Validaci on del modelo

Explotaci on del modelo

Ejemplos

Page 12: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Introducci on

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 3 / 68

Econometrıa

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 4 / 68

La Estadıstica juega un papel importante en cualquier ciencia empırica a la horade estimular la formulacion de modelos y contrastarlos. En la ciencia economicaeste papel se hace especialmente importante hasta el punto de que la necesidadde extender la Estadıstica ha dado lugar al nacimiento de una disciplina nuevaque hoy goza de una gran vitalidad: la Econometrıa .

La Econometrıa es una rama de la Economıa que aglutina a la TeorıaEconomica, las Matematicas, la Estadıstica y la Informatica para estudiar y ana-lizar fenomenos economicos. Puede decirse que constituye en sı misma una dis-ciplina dentro de la Economıa y a la vez una potente herramienta que tanto loseconomistas como otros muchos investigadores sociales utilizan para el estudiode sus problemas concretos. El principal proposito de la Econometrıa es propor-cionar un sustrato empırico a la Teorıa Economica.

Una breve descripcion de la historia econometrica la puedes encontrar en laslecturas recomendadas.

Page 13: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Definici on de Econometrıa

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 5 / 68

De entre las muchas definiciones existentes sobre la Econometrıa destacarıa lasiguiente:

“La Econometrıa, usando la Teorıa Economica, las Matematicas yla Inferencia Estadıstica como fundamentos analıticos, y los datoseconomicos como la base informativa, proporciona una base para:

1. Modificar, refinar o posiblemente refutar las conclusiones en elcuerpo de conocimientos conocido como Teorıa Economica.

2. Conseguir signos, magnitudes y afirmaciones de calidad paralos coeficientes de las variables en las relaciones economicas,de modo que esta informacion puede usarse como base para laeleccion y toma de decisiones.”

Judge y otros (1985)

Modelo econ omico y econom etrico

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 6 / 68

Modelo econ omico: Un modelo economico es una representacion simplificadade la realidad economica mediante la expresion matematica de una determina-da teorıa economica.

Modelo econom etrico: Un modelo econometrico es aquel modelo economicoque contiene todos los elementos necesarios para ser estudiado desde un pun-to de vista empırico. Es decir, un modelo economico en el que se ha especi-ficado el tipo de relacion entre variables (en este curso lineal), el numero devariables, introduccion de la perturbacion aleatoria (para recoger el efecto delas variables no incluidas fundamentalmente), etc.

Ası, por ejemplo, un modelo economico es aquel en el que se especifica que elconsumo es una funcion de la renta: Consumo = f(Renta).

Mientras el modelo econometrico sera aquel en el que se establece que larelacion es lineal y se introduce la perturbacion aleatoria ut:

Consumot = β1 + β2 ·Rentat + ut.

Page 14: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Fases del m etodo econom etrico

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 7 / 68

La elaboracion de un modelo econometrico se puede dividir en las siguientesfases:

Especificaci on: En esta fase se propone la forma matematica de la relacion queliga las variables presentes en el modelo y la perturbacion aleatoria. Tambiendebe decidirse el numero de ecuaciones y variables que forman el modelo. Todoello se realizara partiendo de la Teorıa Economica.

Estimaci on: Esta fase consiste en la obtencion de valores numericos de lascantidades constantes del modelo econometrico. Por tanto, sera necesario dis-poner de informacion empırica sobre el fenomeno (datos) y haber decidido elmetodo de estimacion a usar.

Validaci on: En esta fase se evaluan los resultados obtenidos en la etapa ante-rior para decidir si los mismos son o no aceptables tanto desde el punto de vistade la teorıa economica (magnitudes, signos, etc) como desde el punto de vistaestadıstico (validez del modelo).

Explotaci on: Si el modelo es aceptado, este puede ser usado para la predicciony contrastar la permanencia de la estructura estimada.

Componentes de un modelo econom etrico

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 8 / 68

Las principales componentes de un modelo econometrico son:

Variables: Dentro de las variables podemos distinguir entre las variables obser-vables (aquellas de las que se disponen datos) y no observables (la perturba-cion aleatoria). Y dentro de las primeras tenemos a las variables dependientes,explicadas o endogenas (aquellas que estan influidas por otras variables) y va-riables independientes, explicativas o exogenas (aquellas que no estan influidaspor otras).

Parametros: Los parametros son las cantidades fijas o constantes del mode-lo econometrico que se desean estimar (los coeficientes de las variables y lavarianza de la perturbacion aleatoria).

Ecuaciones: Las relaciones entre las distintas variables se explicitara medianteuna o mas ecuaciones.

Page 15: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Naturaleza de la informaci on utilizada en Econometrıa

Contenidos

Introduccion

Definicion deEconometrıa

Modelo economico yeconometrico

Fases del metodoeconometrico

Componentes de unmodelo econometrico

Naturaleza de lainformacion utilizadaen Econometrıa

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 9 / 68

Los datos economicos suelen ser de clases muy variadas, siendo los tipos masimportantes los siguientes:

Datos de corte transversal: son un conjunto de datos formada por unidades(individuos, empresas, regiones, etc) observadas en un momento determinado(dıa, mes, trimestre, ano, etc). Por ejemplo, el consumo de varias familias en unmes en concreto.

Datos de series temporales: son un conjunto de datos formado por observa-ciones de una misma variable a lo largo del tiempo. Por ejemplo, el consumomensual de una familia a lo largo de todo un ano.

Datos de panel o longitudinales: son un conjunto de datos que combinan unadimension temporal con otra transversal. Por ejemplo, el consumo mensual deun conjunto de familias a lo largo de todo un ano.

Habra que atender al tipo de datos que se analicen ya que dependiendo de sunaturaleza se podran aplicar unos u otros metodos econometricos.

Especificaci on del modelo

Contenidos

Introduccion

Especificacion delmodelo

Modelo linealuniecuacional multiple

Hipotesis del modelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 10 / 68

Page 16: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Modelo lineal uniecuacional multiple

Contenidos

Introduccion

Especificacion delmodelo

Modelo linealuniecuacional multiple

Hipotesis del modelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 11 / 68

El modelo lineal uniecuacional multiple analiza la relacion lineal entre una variabledependiente, Y , y mas de una variable independiente, Xi, i = 1, . . . , k, k > 1,mas un termino aleatorio, u.

Ası, a partir de n observaciones para cada variable, el modelo puede serexpresado como:

Yt = β1 + β2Xt2 + β3Xt3 + · · ·+ βkXtk + ut, t = 1, . . . , n, (1)

donde se ha considerado que hay termino constante, es decir, X1t = 1, ∀t.El objetivo sera estimar (es decir, obtener una aproximacion numerica) aque-

llas cantidades constantes presentes en el modelo (1), ası como la bondad de laestimacion realizada. En primer lugar, se escribe dicho modelo para todas y cadauna de las observaciones:

Y1 = β1 + β2X12 + β3X13 + · · ·+ βkX1k + u1

Y2 = β1 + β2X22 + β3X23 + · · ·+ βkX2k + u2

......

Yn = β1 + β2Xn2 + β3Xn3 + · · ·+ βkXnk + un

Modelo lineal uniecuacional multiple

Contenidos

Introduccion

Especificacion delmodelo

Modelo linealuniecuacional multiple

Hipotesis del modelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 12 / 68

Que nos conduce a la siguiente forma matricial:

yn×1 = Xn×k · βk×1 + un×1, (2)

donde:

yn×1 =

Y1

Y2

...Yn

, βk×1 =

β1

β2

...βk

, un×1 =

u1

u2

...un

,

Xn×k =

1 X12 . . . X1k

1 X22 . . . X2k

......

. . ....

1 Xn2 . . . Xnk

.

Page 17: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Hipotesis del modelo

Contenidos

Introduccion

Especificacion delmodelo

Modelo linealuniecuacional multiple

Hipotesis del modelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 13 / 68

Consideraremos las siguientes hipotesis basicas en el modelo lineal uniecuacionalmultiple:

El vector y se puede expresar como combinacion lineal de las variables expli-cativas mas un vector de perturbacion.La perturbacion aleatoria esta centrada (E[ut] = 0, t = 1, . . . , n), eshomocedastica

(V ar(ut) = E[u2

t ] = σ2, t = 1, . . . , n)

e incorrelada(Cov(ut, us) = E[ut · us] = 0, ∀t 6= s, t, s = 1, . . . , n). En tal caso sedice que las perturbaciones son esfericas y se verifica que E[u] = 0n×1 yV ar(u) = E[u · ut] = σ2 · In×n.La matriz X es no estocastica y de rango completo por columnas, es decir,rg(X) = k (como consecuencia n > k y las columnas de X , es decir, Xi,i = 1, . . . , n, son linealmente independientes).No hay relacion entre variables independientes y la perturbacion aleatoria:

Cov(un×1, Xi) = E[(u− E[u]) · (Xi − E[Xi])

t]

= E[u · (Xi −Xi)

t] = E[un×1 · 01×n] = 0n×n.

Estimaci on del modelo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 14 / 68

Page 18: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Estimaci on mınimo cuadr atica de los coeficientes del modelo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 15 / 68

Definiendo los errores o residuos, e, del modelo lineal uniecuacional multiple comola diferencia entre los verdaderos valores de la variable dependiente y su estima-cion, esto es

e = y − y,

donde y = Xβ, y siguiendo la premisa de minimizar la suma de los cuadradosde los residuos

ete = (y −Xβ)t · (y −Xβ) = yty − 2βtXty + βtXtXβ,

se obtiene la estimacion del parametro β como

β =(XtX

)−1 ·Xty.

Dicho metodo recibe el nombre de mınimos cuadrados ordinarios, MCO, porlo que los estimadores obtenidos a partir de dicho metodo reciben el nombre deestimadores de mınimos cuadrados ordinarios, EMCO.

Como consecuencias de dicha estimacion se verifica que Xt · e = 0k×1,it · e = 01×1, it · y = it · y y yt · e = 01×1 donde it = (1 1 . . . 1)1×n.

Estimaci on mınimo cuadr atica de los coeficientes del modelo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 16 / 68

Adviertase que:

XtX =

nn∑

t=1Xt2 · · ·

n∑t=1

Xtk

n∑t=1

Xt2

n∑t=1

X2t2 · · ·

n∑t=1

Xt2Xtk

......

. . ....

n∑t=1

Xtk

n∑t=1

XtkXt2 · · ·n∑

t=1X2

tk

,

y

Xty =

n∑t=1

Yt

n∑t=1

Xt2Yt

...n∑

t=1XtkYt

.

Page 19: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Teorema de Gauss-Markov

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 17 / 68

Teorema 1 (Teorema de Gauss-Markov) Los estimadores de mınimos cuadra-dos ordinarios son lineales, insesgados y optimos (ELIO), es decir, tienen varianzamınima entre la clase de los estimadores lineales e insesgados.

En efecto, por la forma de escribirse el estimador es evidente que es lineal.Ası, llamando:

Ck×n =(XtX

)−1

k×k·Xt

k×n =

c11 c12 . . . c1nc21 c22 . . . c2n

......

. . ....

ck1 ck2 . . . ckn

,

se tiene que β se expresa como combinacion lineal del vector y:

βk×1 = Ck×n · yn×1 =

c11Y1 + c12Y2 + . . .+ c1nYn

c21Y1 + c22Y2 + . . .+ c2nYn

...ck1Y1 + ck2Y2 + . . .+ cknYn

.

Teorema de Gauss-Markov

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 18 / 68

Para que el estimador β de β sea insesgado se ha de cumplir que E[β] = β. En

efecto, sustituyendo y = Xβ + u en β:

β =(XtX

)−1 ·Xty =(XtX

)−1 ·Xt(Xβ + u)

= β +(XtX

)−1 ·Xtu −→ β = β +(XtX

)−1 ·Xtu.

Entonces, teniendo en cuenta que E[u] = 0:

E[β] = E[β +

(XtX

)−1 ·Xtu]= β +

(XtX

)−1 ·Xt · E[u] = β.

Por otro lado, la matriz de varianzas-covarianzas de β:

V ar(β)

= E

[(β − E[β]

)·(β − E[β]

)t]= E

[(β − β

)·(β − β

)t]

= E[(XtX

)−1Xtu · utX

(XtX

)−1]

=(XtX

)−1Xt · E[u · ut] ·X

(XtX

)−1

= σ2 ·(XtX

)−1XtX

(XtX

)−1= σ2 ·

(XtX

)−1,

Page 20: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Teorema de Gauss-Markov

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 19 / 68

donde se ha tenido en cuenta que β es insesgado, β − β = (XtX)−1

Xtu yV ar(u) = E[u · ut] = σ2 · In×n.

Para demostrar que β es de mınima varianza consideraremos otro estimador,

β∗, de β lineal e insesgado de forma que V ar(β)< V ar (β∗).

En efecto, β∗ = Dk×n · yn×1 tal que D ·X = Ik×k es lineal e insesgado.Ademas, V ar (β∗) = σ2 ·DDt.

En tal caso, puesto que podemos escribir D = (XtX)−1

Xt + W con

W 6= 0k×n, se tiene que DDt = (XtX)−1

+WW t, y en tal caso:

V ar (β∗) = σ2 ·DDt = σ2 ·(XtX

)−1+σ2 ·WW t = V ar

(β)+σ2 ·WW t,

esto es, V ar (β∗)− V ar(β)= σ2 ·WW t.

Y como WW t es definida positiva: V ar (β∗) − V ar(β)

> 0, y en talcaso:

V ar (β∗) > V ar(β).

Estimaci on de la varianza de la perturbaci on aleatoria

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Estimacion mınimocuadratica de loscoeficientes delmodelo

Teorema deGauss-Markov

Estimacion de lavarianza de laperturbacion aleatoria

Validacion del modelo

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 20 / 68

Ademas de los coeficientes de las variables independientes, hay en el modelootra cantidad constante que habra que estimar: la varianza de la perturbacionaleatoria, σ2.

Un estimador insesgado de σ2 es:

σ2 =ete

n− k,

ya que E[ete] = (n− k) · σ2.Para calcular dicho estimador se dispone de la expresion:

σ2 =yty − βtXty

n− k.

En consecuencia, la estimacion de la matriz de varianzas-covarianzas de β es:

V ar

(β)= σ2 ·

(XtX

)−1.

Page 21: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Validaci on del modelo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 21 / 68

Bondad de ajuste: Coeficiente de determinaci on

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 22 / 68

Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob-tenidas las estimaciones de β y σ2, el siguiente paso sera estudiar la calidad dedichas estimaciones.

Ası, a continuacion, obtendremos el coeficiente de determinacion, que no esmas que una medida para estudiar la bondad del ajuste lineal determinado por losestimadores por mınimos cuadrados ordinarios.

Dicho coeficiente de determinacion, que se denota por R2, se define como elporcentaje de variabilidad explicada por el modelo. Por tanto, este se obtendra co-mo el cociente entre la varianza explicada por la estimacion y la total:

R2 =

1T ·

n∑i=1

(Yi − Y

)2

1T ·

n∑i=1

(Yi − Y

)2 =

n∑i=1

(Yi − Y

)2

n∑i=1

(Yi − Y

)2 .

Como se observa, el coeficiente de determinacion queda expresado en funcionde la suma de cuadrados explicados (SCE) y los totales (SCT).

Page 22: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Bondad de ajuste: Coeficiente de determinaci on

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 23 / 68

Luego, teniendo en cuenta la descomposicion

SCT = SCE + SCR,

se tiene que

R2 =SCE

SCT= 1− SCR

SCT.

Entonces, para calcular dicho coeficiente se dispone de la expresion:

R2 =βtXty − n · Y 2

yty − n · Y 2 = 1− yty − βtXty

yty − n · Y 2 .

Adviertase que, siempre que el modelo lineal tenga termino independiente, elcoeficiente de determinacion varıa entre 0 y 1. El valor 0 lo toma cuando la SCE esnula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuandola SCR es nula y, por tanto, el modelo es adecuado.

Coeficiente de determinaci on corregido

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 24 / 68

Puesto que a medida que vamos incluyendo variables en el modelo el coeficientede determinacion aumenta aunque las variables que incluyamos no sean signifi-cativas, esto supone un problema.

El coeficiente de determinacion corregido, R2, viene a resolver este proble-

ma del coeficiente de determinacion. Dicho coeficiente mide el porcentaje de va-riacion de la variable dependiente (al igual que el coeficiente de determinacion)pero teniendo en cuenta el numero de variables incluidas en el modelo. Se definecomo:

R2= 1− (1−R2) · n− 1

n− k.

En cualquier caso, estas medidas de bondad del ajuste no deben de ser

sobrevaloradas. Obtener un R2 o R2

cercano a 1 no indica que los resultadossean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de lashipotesis basicas y los resultados no ser validos. Por tanto, estos indicadores hande ser considerados como una herramienta mas a tener en cuenta dentro delanalisis.

Page 23: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Distribuci on en el muestreo de los estimadores MCO

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 25 / 68

Introduciendo la hipotesis de que la perturbacion aleatoria sigue una distribucionnormal, esto es:

un×1 ∼ N(0n×1, σ2 · In×n).

En consecuencia, βk×1 ∼ N(β, σ2 · (XtX)−1

), ya que:

β sigue una distribucion normal ya que se puede expresar en funcion de unanormal: β = β + (XtX)

−1 ·Xtu.

se tienen calculados el vector de medias, E[β]= β, y matriz de varianzas-

covarianzas, V ar(β)= σ2 · (XtX)

−1.

Por otro lado, ya que ete = utMu siendo Mn×n = I −X (XtX)−1

Xt

simetrica, idempotente y con rg(M) = n− k < k se tiene que utMuσ2 ∼ χ2

n−k,lo que se traduce en que

(n− k) · σ2

σ2∼ χ2

n−k.

Contraste de un conjunto de hip otesis lineales

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 26 / 68

A continuacion abordaremos la especificacion de contrastes sobre un conjunto dehipotesis lineales sobre los coeficientes del modelo. Concretamente, suponiendoq restricciones lineales independientes entre sı:

a11β1 + a12β2 + · · ·+ a1kβk = b1

a21β1 + a22β2 + · · ·+ a2kβk = b2...

... =...

aq1β1 + aq2β2 + · · ·+ aqkβk = bq

Plantearemos contrastar la hipotesis nula H0 : Rβ = r donde

Rq×k =

a11 a12 . . . a1ka21 a22 . . . a2k

......

. . ....

aq1 aq2 . . . aqk

, rq×1 =

b1b2...bq

.

Page 24: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Contraste de un conjunto de hip otesis lineales

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 27 / 68

Usando la distribucion

(Rβ −Rβ

)t

·

[R (XtX)

−1Rt

]−1

q · σ2·(Rβ −Rβ

)∼ Fq,n−k,

rechazaremos la hipotesis nula al nivel de significacion α si

(Rβ − r

)t

·

[R (XtX)

−1Rt

]−1

q · σ2·(Rβ − r

)> Fq,n−k(1− α),

donde Fq,n−k(1 − α) es el punto de una F de Senedecor de q y n− k gradosde libertad que deja por debajo suyo una probabilidad 1− α.

Casos particulares

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 28 / 68

Un caso particular de suma importancia sera aquel en el que se desee contrastarla hipotesis nula H0 : βi = bi, i = 1, . . . , k.

En tal caso, q = 1, R = (0 0 . . . 1i) . . . 0) y r = bi, por lo que ladistribucion anterior queda simplificada como

(βi − bi

)2

σ2 · wi∼ F1,n−k,

donde wi es el elemento (i,i) de la matriz (XtX)−1

, o lo que es lo mismo, σ2 ·wi

es el elemento (i,i) de σ2 · (XtX)−1

=

V ar(β)

, esto es, la varianza estimada

de βi.Teniendo en cuenta que la raız cuadrada de una F-Snedecor con 1 y n grados

de libertad es una t-Student con n grados de libertad se tiene que

βi − biσ · √wi

∼ tn−k,

Page 25: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Casos particulares

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 29 / 68

y en tal caso rechazaremos H0 : βi = bi al nivel de significacion α si

∣∣∣∣∣βi − biσ · √wi

∣∣∣∣∣ > tn−k

(1− α

2

),

donde tn−k

(1− α

2

)es el punto de una distribucion t de student con n − k

grados de libertad que deja por debajo suya una probabilidad 1− α2 .

Este caso particular es de vital importancia cuando bi = 0, ya que entoncesestaremos contrastando si el coeficiente de la variable independiente Xi es ono nulo. De forma que al rechazar dicha hipotesis tenemos garantizado que lavariable Xi ha de estar en el modelo, por lo que sus variaciones influyen en lavariable dependiente. En tal caso se dice que dicha variable es significativa y queel contraste es un contraste de significacion individual.

Mınimos Cuadrados Restringidos

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 30 / 68

En el caso en el que no se rechace la hipotesis nula H0 : Rβ = r, serıa deseableincorporar dicha informacion al modelo. En tal caso, se obtiene un nuevo estima-dor:

βR = β +(XtX

)−1Rt

[R(XtX

)−1Rt

]−1

·(r −Rβ

),

que recibe el nombre de mınimos cuadrados restringidos ya que se ha obtenidocon la restriccion de que ha de verificar que RβR = r.

Dicho estimador es lineal, insesgado siempre que la hipotesis nula H0 :Rβ = r sea cierta y optimo. Es decir, el estimador por mınimos cuadrados restrin-gidos tiene menor varianza que el estimador mınimo cuadratico ordinario siemprey cuando la restriccion (hipotesis nula) sea cierta.

Luego, cuando una restriccion lineal sobre los coeficientes de las variablesindependientes es cierta, el estimador por mınimos cuadrados ordinarios deja deser optimo y habra que usar el estimador por mınimos cuadrados restringidos.

Ademas se verifica que:

SCRR ≥ SCR, R2R ≤ R2.

Page 26: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Analisis de la varianza

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 31 / 68

El analisis de la varianza aborda el contraste que tiene por hipotesis nula quetodos los coeficientes de las variables independientes son nulos simultaneamente,esto es, H0 : β2 = β3 = · · · = βk = 0.

Salta a la vista que estamos ante un caso particular de un contraste sobrek − 1 restricciones lineales de los coeficientes de las variables independientes.En este caso, rechazaremos la hipotesis nula al nivel de significacion α si

Fexp =SCEk−1SCRn−k

> Fk−1,n−k(1− α).

Para calcular dicho estadıstico se suele resumir la informacion anterior en unatabla, conocida como tabla de analisis de la varianza (tabla ANOVA) ya que enella se recogen las fuentes de variacion de la varianza:

Fuente de variacion Suma de Cuadrados Grados de Libertad Medias

Explicada SCE = βtXty − nY2

k − 1 SCEk−1

Residuos SCR = yty − βtXty n− k SCRn−k

Total SCT = yty − nY2

n− 1

Analisis de la varianza

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 32 / 68

Adviertase que rechazar H0 implica que hay al menos un coeficiente no nulo, porlo que la relacion existente entre las variables independientes y la dependiente nose debe al azar, lo cual valida el modelo en su conjunto.

Por otro lado, sin mas que dividir la region de rechazo por SCT tanto en elnumerador como en el denominador se obtiene la expresion equivalente:

R2

k−1

1−R2

n−k

> Fk−1,n−k(1− α).

La importancia de esta nueva expresion para la region de rechazo es que permitecalcular una cota, sin mas que despejar R2, a partir de la cual el coeficiente dedeterminacion es significativo. Esto es, el coefciente de determinacion es signifi-cativo al nivel de significacion α si

R2 >k−1n−k · Fk−1,n−k(1− α)

1 + k−1n−k · Fk−1,n−k(1− α)

.

Page 27: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Intervalos de confianza

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Bondad de ajuste:Coeficiente dedeterminacion

Distribucion en elmuestreo de losestimadores MCO

Contraste de unconjunto de hipotesislineales: casosparticulares

Mınimos CuadradosRestringidos

Analisis de la varianza

Intervalos de confianza

Explotacion del modelo

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 33 / 68

A partir de las distribuciones en el muestreo para los estimadores estudiados esinmediato obtener los siguientes intervalos de confianza al nivel 1− α:

Intervalo de confianza para βi

βi ± tn−k

(1− α

2

)· σ · √wi, i = 1, . . . , k.

Intervalo de confianza para σ2

[(n− k) · σ2

χ2n−k

(1− α

2

) , (n− k) · σ2

χ2n−k

(α2

)],

donde χ2n−k

(1− α

2

)y χ2

n−k

(α2

)son los puntos de una distribucion chi-

cuadrado con n−k grados de libertad que dejan a su izquierda, respectivamente,una probabilidad 1− α

2 y α2 .

Una forma alternativa de contrastar hipotesis es usando los intervalos deconfianza. De manera que para contrastar H0 : Rβ = r se calculara la region deconfianza para Rβ y si r pertenece a dicha region, no se rechazara la hipotesisnula.

Explotaci on del modelo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Prediccion PuntualOptima

Prediccion porintervalo

Contraste dePermanenciaEstructural

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 34 / 68

Page 28: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Predicci on Puntual Optima

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Prediccion PuntualOptima

Prediccion porintervalo

Contraste dePermanenciaEstructural

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 35 / 68

Una vez validado el modelo, la siguiente fase de un modelo econometrico es laexplotacion, siendo entonces la prediccion o la permanencia estructural algunosde sus objetivos.

La prediccion se realiza desde dos puntos de vista: a) por un lado realizare-mos una prediccion puntual dando un unico valor de prediccion para un instanteen concreto; b) por otra parte, puesto que Y es una variable aleatoria, podemoscalcular su esperanza dado un valor en concreto de las variables independientes.

Siguiendo las directrices anteriores se llega a la misma expresion algebraicaen ambos casos:

p0 = xt0 · β,

donde xt0 = (1 X02 X03 . . . X0k) contiene los valores de las variables inde-

pendientes para los que se quiere obtener la prediccion.Este predictor, p0, mınimo cuadratico (ya que se obtiene a partir del estima-

dor por mınimos cuadrados ordinarios de β) es lineal, insesgado y optimo (en elsentido de mınima varianza).

Predicci on por intervalo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Prediccion PuntualOptima

Prediccion porintervalo

Contraste dePermanenciaEstructural

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 36 / 68

En este apartado calcularemos el intervalo de confianza para el valor esperadode Y dado x0, es decir, para E[Y0/x0] = xt

0 · β.

Como xt0 · β se distribuye segun una normal (ya que esta en funcion de β) y

E[xt0 · β] = xt

0β, ya que es insesgado.

V ar(xt0 · β

)= E

[(xt0 · β − xt

0 · β)·(xt0 · β − xt

0 · β)]

= xt0 ·

E

[(β − β

)·(β − β

)t]·x0 = xt

0 ·V ar(β)·x0 = σ2 ·xt

0 (XtX)

−1x0.

se tiene que

xt0 · β ∼ N

(xt0 · β, σ2 · xt

0

(XtX

)−1x0

).

Ahora bien, esta distribucion no es apta para hacer inferencia puesto quedepende de la cantidad desconocida σ2. Para resolver este problema, tipificare-mos la anterior distribucion normal y la dividiremos entre la raız cuadrada de lasiguiente distribucion chi-cuadrado

Page 29: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Predicci on por intervalo

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Prediccion PuntualOptima

Prediccion porintervalo

Contraste dePermanenciaEstructural

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 37 / 68

(n− k) · σ2

σ2∼ χ2

n−k,

dividida a su vez entre sus grados de libertad, obteniendo la siguiente distribuciont-Student:

xt0 · β − xt

0 · βσ ·

√xt0 (X

tX)−1 x0

∼ tn−k.

A partir de esta distribucion, el intervalo de confianza al nivel 1 − α paraE[Y0/x0] = xt

0 · β es:

xt0 · β ± tn−k

(1− α

2

)· σ ·

√xt0 (X

tX)−1 x0,

donde tn−k

(1− α

2

)es el punto de una distribucion t de Student con n − k

grados de libertad que deja a su izquierda una probabilidad 1− α2 .

Contraste de Permanencia Estructural

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Prediccion PuntualOptima

Prediccion porintervalo

Contraste dePermanenciaEstructural

Ejemplos

Master TCGE Introduccion a la Econometrıa: regresion multiple – 38 / 68

Al explotar el modelo mediante la prediccion se esta presuponiendo que la relacionestimada se mantiene para la informacion no presente en la muestra observada.Para confirmar este aspecto, calcularemos el intervalo de confianza para Y dadox0, de forma que si la nueva informacion pertenece a dicho intervalo, la estructuradel modelo estimado permanecera.

Partiendo de que

Y0 − Y0 = u0 − xt0

(β − β

)∼ N

(0, σ2 ·

(1 + xt

0

(XtX

)−1x0

)),

se llega de forma analoga a la anterior a la distribucion

Y0 − Y0

σ ·√1 + xt

0 (XtX)

−1x0

∼ tn−k,

donde Y0 = xt0 · β. Por tanto, el intervalo de confianza al nivel 1−α para Y0 es:

xt0 · β ± tn−k

(1− α

2

)· σ ·

√1 + xt

0 (XtX)

−1x0.

Page 30: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplos

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 39 / 68

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 40 / 68

A continuacion vamos a realizar un analisis exhaustivo del modelo

Yt = β1 + β2 ·Xt2 + β3 ·Xt3 + ut,

a partir de las siguiente informacion muestral:

Observacion Yt Xt2 Xt3

1 16 1 12 26 3 23 30 5 -14 44 7 35 56 8 -26 64 10 07 68 10 18 72 12 4

En primer lugar calcularemos la estimacion por mınimos cuadrados ordinarios delos coeficientes de las variables a partir de la expresion

β =(XtX

)−1Xty. (3)

Page 31: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 41 / 68

A partir de la informacion muestral anterior es claro que:

y =

1626304456646872

, X =

1 1 11 3 21 5 −11 7 31 8 −21 10 01 10 11 12 4

,

de forma que:

XtX =

8 56 856 492 658 65 36

, Xty =

3763184414

,

y entonces a partir de la formula (3):

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 42 / 68

β =

8 56 856 492 658 65 36

−1

·

3763184414

=

0′62 −0′0688 −0′0136−0′0688 0′0103 −0′0033−0′0136 −0′0033 0′0368

·

3763184414

=

8′51895′5587−0′4296

.

Es decir, β1 = 8′5189, β2 = 5′5587 y β3 = −0′4296. Lo cual se traduce en lasiguiente estimacion del modelo considerado:

Yt = 8′5189 + 5′5587Xt2 − 0′4296Xt3.

Page 32: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 43 / 68

A partir de estas estimaciones es sencillo obtener las estimaciones de Y :

y = Xβ =

1 1 11 3 21 5 −11 7 31 8 −21 10 01 10 11 12 4

·

8′51895′5587−0′4296

=

13′648024′335836′742046′141053′847764′105963′676373′5049

,

y los residuos del modelo:

e = y − y =

1626304456646872

13′648024′335836′742046′141053′847764′105963′676373′5049

=

2′35201′6642−6′7420−2′14102′1523−0′10594′3237−1′5049

.

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 44 / 68

Desde un punto de vista teorico, dichos residuos han de sumar cero, si bien eneste caso la suma del vector anterior es igual a −0′0016. De igual forma, a partirde dichos residuos se puede obtener facilmente la estimacion de la varianza de laperturbacion aleatoria, ya que por definicion:

σ2 =ete

n− k, (4)

donde ete es la suma de los cuadrados de los residuos, n el numero de obser-vaciones del modelo y k el numero de variables presentes en el mismo. En estecaso:

σ2 =83′84728− 3

= 16′76944.

Otra forma equivalente de obtener la estimacion anterior es:

σ2 =yty − βtXty

n− k. (5)

Page 33: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 45 / 68

Puesto que

yty = 20808, βtXty = (8′5189 5′5587 − 0′4296)

3763184414

= 20724′1528,

es claro que

σ2 =20808− 20724′1528

8− 3=

83′84725

= 16′76944.

Y a partir de esta estimacion se puede obtener la estimacion de la matriz de

varianzas-covarianzas de β mediante:

V ar

(β)

= σ2 ·(XtX

)−1= 16′7694 ·

0′62 −0′0688 −0′0136−0′0688 0′0103 −0′0033−0′0136 −0′0033 0′0368

=

10′3976 −1′1533 −0′2282−1′1533 0′1727 −0′0555−0′2282 −0′0555 0′6168

, (6)

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 46 / 68

que sera usada para calcular la region de rechazo de los contrastes de significa-cion individual ası como para los intervalos de confianza de cada coeficiente de laregresion.Para medir la bondad del ajuste realizado mediante la estimacion anterior calcu-laremos el coeficiente de determinacion:

R2 =βtXty − nY

yty − nY= 1− yty − βtXty

yty − nY. (7)

Para la primera expresion de (7), teniendo en cuenta que:

βtXty−nY = 20724′1528− 8 · 472 = 20724′1528− 17672 = 3052′1528,

yty − nY = 20808− 17672 = 3136,

se tiene que

R2 =3052′1528

3136= 0′97326301.

Ademas, en tal caso: R2= 1− (1− 0′97326301) · 7

5 = 0′9625682.

Page 34: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 47 / 68

Mientras que para la segunda expresion:

R2 = 1− 83′84723136

= 1− 0′02673699 = 0′97326301.

A partir de este coeficiente podemos afirmar que el ajuste realizado permite expli-car un 97′326301% de la variabilidad de la variable dependiente, que si bien seencuentra muy proximo al 100%, mas adelante comprobaremos si es significativoy, por tanto, si es suficiente para validar el modelo.Una vez estimadas las cantidades constantes del modelo, a continuacion se estu-diara la validez del mismo a partir de:

contrastes de significacion individual.contraste de significacion conjunta.significacion del coeficiente de determinacion.

Para abordar los contrastes de significacion individual tendremos en cuenta quese rechaza H0 : βi = 0 si

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 48 / 68

texp =

∣∣∣∣∣βi

σ · √wi

∣∣∣∣∣ > tn−k

(1− α

2

), ∀i,

donde wi es el elemento (i, i) de la matriz (XtX)−1

o, lo que es lo mismo,

σ · √wi es la raız cuadrada del elemento (i, i) de la matriz σ2 · (XtX)−1

=

V ar(β)

.

Observando (6) es claro que σ · √w2 =√0′1727 = 0′4156 y σ · √w3 =√

0′6168 = 0′7854. Teniendo en cuenta que tn−k

(1− α

2

)= t5(0

′975) =2′57, se obtiene que:

rechazo H0 : β2 = 0 si texp = 5′55870′4156 = 13′376 > 2′57.

rechazo H0 : β3 = 0 si texp =∣∣∣−0′4296

0′7854

∣∣∣ = 0′547 > 2′57.

Como es evidente, rechazamos H0 : β2 = 0 y no rechazamos H0 : β3 = 0,es decir, la variable Xt2 influye en Yt, mientras que la Xt3 no lo hace. En talsituacion se dice que la segunda variable es significativa y que la tercera no essignificativa.

Page 35: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 49 / 68

Para el contraste de significacion conjunta, H0 : β2 = β3 = 0, se rechaza lahipotesis nula si

Fexp =SCE/k − 1

SCR/n− k> Fk−1,n−k(1− α),

donde Fk−1,n−k(1 − α) es el punto de una F de Snedecor con k − 1 y n − kgrados de libertad que deja a su izquierda una probabilidad 1− α, SCE denotaa la suma de cuadrados explicada y SCR a la suma de los cuadrados de losresiduos (cantidades que ya han sido calculadas con anterioridad al obtener elcoeficiente de determinacion).En este caso, para calcular la region de rechazo recurriremos a la tabla ANOVA:

Fuentes de variacion Sumas de cuadrados Grados de libertad Medias

Explicada SCE = 3052′1528 k − 1 = 2 1526′0764Residual SCR = 83′8472 n− k = 8− 3 = 5 16′76944

Total SCT = 3136

Luego Fexp = 1526′076416′76944 = 91′00342.

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 50 / 68

Y como Fk−1,n−k(1− α) = F2,5(0′95) = 5′78, es evidente que se rechaza la

hipotesis nula. Esto es, existe al menos un coeficiente que es no nulo de maneraque entonces se puede afirmar que hay algun tipo de asociacion (que no se debeal azar) entre las variables independientes y la dependiente.Para terminar con la validacion del modelo, estuadiaremos si el coeficiente dedeterminacion obtenido con anterioridad es significativo o no. Teniendo en cuentaque:

SCE/k − 1

SCR/n− k=

R2/k − 1

(1−R2)/n− k,

la region de rechazo anterior se puede expresar como:

R2/k − 1

(1−R2)/n− k> Fk−1,n−k(1− α),

y sin mas que despejar el coeficiente de determinacion, se obtiene que el modeloes significativo si

R2 >k−1n−k

· Fk−1,n−k(1− α)

1 + k−1n−k

· Fk−1,n−k(1− α)= R2

sig.

Page 36: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 51 / 68

Esto es, se tiene una cota, R2sig , a partir de la cual el coeficiente de determinacion

es significativo.Puesto que en este caso:

k−1n−k

= 25

= 0′4Fk−1,n−k(1 − α) = F2,5(0

′95) = 5′78

}→

k − 1

n − k· Fk−1,n−k(1 − α) = 0

′4 · 5′78 = 2

′312

→ R2sig =

2′3123′312

= 0′6981.

Recordemos que R2 = 0′97326301, que claramente es significativo al ser su-perior a la cota inferior de significacion R2

sig = 0′6981. Esto es, el coeficiente dedeterminacion obtenido implica que el modelo es explicativo.Por todo lo anterior, parece claro que el modelo es valido y, por tanto, apto para laprediccion.Supongamos ahora que se tiene nueva informacion para las variables indepen-dientes (X02 = 2 y X03 = 3) y que se desea obtener una prediccion puntual ypor intervalo a partir de ella para la variable dependiente.

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 52 / 68

A partir de dicha informacion, la prediccion puntual optima sera

xt0β = (1 2 3) ·

8′51895′5587−0′4296

= 18′3475.

Mientras que para la prediccion por intervalo sera necesario calcular:

xt0

(XtX

)−1x0 = (1 2 3)·

0′62 −0′0688 −0′0136−0′0688 0′0103 −0′0033−0′0136 −0′0033 0′0368

123

= 0′596,

de forma que el intervalo de confianza para el valor esperado de Y sera:

xt0β ± tn−k

(1− α

2

)· σ ·

√xt0 (X

tX)−1 x0

= 18′3475± 2′57 · 4′095051 ·√0′596 = (10′221, 26′4742).

y el intervalo de confianza para Y sera:

Page 37: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 53 / 68

xt0β ± tn−k

(1− α

2

)· σ ·

√1 + xt

0 (XtX)−1 x0

= 18′3475± 2′57 · 4′095051 ·√1′596 = (5′04887, 31′64613).

Ademas, a partir de este ultimo intervalo (conocido como permanencia estructu-ral), si se sabe que acompanando a x0 se tiene Y0 = 6, puesto que este valorpertenece al intervalo calculado, se puede afirmar (al nivel de confianza conside-rado) que la relacion estimada para las variables se sigue verificando (permanecela estructura) para la nueva informacion.Por ultimo, con el objetivo de aplicar la estimacion con informacion a priori al mo-delo considerado vamos contrastar la hipotesis nula H0 : β2 + β3 = 5. Ası,en el caso de no rechazarla obtendremos el estimador por mınimos cuadradosrestringidos.Como es sabido, se rechazara la hipotesis nula si

Fexp =(Rβ − r

)t

·

[R (XtX)

−1Rt

]−1

q · σ2·(Rβ − r

)> Fq,n−k(1− α),

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 54 / 68

donde Fq,n−k(1 − α) es el punto de una F de Snedecor con q y n − k gradosde libertad que deja a su izquierda una probabilidad 1− α.A partir de β2 + β3 = 5 se obtiene que q = 1, r = 5 y R = (0 1 1), de formaque

Rβ − r = (0 1 1) ·

8′51895′5587−0′4296

− 5 = 5′5587− 0′4296− 5 = 0′1291,

R(XtX

)−1Rt = (0 1 1)·

0′62 −0′0688 −0′0136−0′0688 0′0103 −0′0033−0′0136 −0′0033 0′0368

·

011

= 0′0405.

Y en tal caso:

Fexp =0′12912

0′0405 · 16′76944 = 0′02454025,

donde recordemos que σ2 = 16′76944.

Page 38: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 55 / 68

Por otro lado, puesto que Fq,n−k(1−α) = F1,5(0′95) = 6′61, es evidente que

no se rechaza la hipotesis nula, es decir, no rechazo que los coeficientes de lasvariables verifiquen la relacion β2 + β3 = 5.En tal caso, habra que incorporar dicha informacion al modelo con el fin de obtenerun mejor estimador (cuando se dispone de informacion a priori el estimador pormınimos cuadrados ordinarios ya no es optimo). En esta situacion el estimadorinsesgado con mınima varianza es el de mınimos cuadrados restringidos, el cualresponde a la siguiente expresion:

βR = β +(XtX

)−1Rt

[R(XtX

)−1Rt

]−1 (r −Rβ

). (8)

De la expresion anterior se conoce:

β =

8′51895′5587−0′4296

,

[R(XtX

)−1Rt

]−1

=1

0′0405, r−Rβ = −0′1291,

faltando calcular

Ejemplo 1

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 56 / 68

(XtX

)−1Rt =

0′62 −0′0688 −0′0136−0′0688 0′0103 −0′0033−0′0136 −0′0033 0′0368

·

011

=

=

−0′08240′0070′0335

.

Entonces, a partir de (8) se obtiene que:

βR =

8′51895′5587−0′4296

− 0′1291

0′0405·

−0′08240′0070′0335

=

8′7815635′536386

−0′5363864

.

A partir de esta estimacion es facil comprobar que se obtiene:

etReR = 84′35455, R2R = 0′9731012, σ2

R = 14′05909,

verificandose, como es sabido, que etReR > ete y R2R < R2.

Page 39: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 57 / 68

Dado el modelo

Yt = β1 + β2Xt2 + β3Xt3 + β4Xt4 + ut, (9)

donde:

Y es el consumo familiar mensual (medido en miles de euros).X2 es la renta familiar mensual (medida en miles de euros).X3 es una variable ficticia que toma el valor 1 si la familia correspondientetiene una deuda en forma de un prestamo para la compra de una vivienda ocoche, y el valor 0 en caso contrario.X4 es el numero de hijos de una familia.

Se pide analizar el modelo sabiendo que para 22 familias se ha obtenido que:

yty = 131′13, Xty =

48′5204′4537′969′3

,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 58 / 68

(XtX

)−1=

0′3342 −0′0506 −0′1626 0′0041−0′0506 0′0173 0′0051 −0′0114−0′1626 0′0051 0′249 −0′03170′0041 −0′0114 −0′0317 0′0514

.

En primer lugar obtendremos la estimacion de las cantidades constantes del mo-delo, es decir, de β y σ2:

β =

0′3342 −0′0506 −0′1626 0′0041−0′0506 0′0173 0′0051 −0′0114−0′1626 0′0051 0′249 −0′03170′0041 −0′0114 −0′0317 0′0514

·

48′5204′4537′969′3

=

−0′01490′48620′39690′2287

, (10)

σ2 =yty − βtXty

n− k=

131′13− 129′564322− 4

=1′565718

= 0′087, (11)

Page 40: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 59 / 68

donde se ha usado que

βtXty = (−0′0149 0′4862 0′3969 0′2287) ·

48′5204′4537′969′3

= 129′5643,

y se deduce que σ = 0′2949 y

Yt = −0′0149 + 0′4862 ·X2t + 0′3969 ·X3t + 0′2287 ·X4t.

Ademas, a partir de la estimacion de σ2 se obtiene una estimacion para la matriz

de varianzas-covarianzas de β:

V ar

(β)= σ2 (XtX

)−1=

0′0291 −0′0044 −0′0141 0′0004−0′0044 0′0015 0′0004 −0′001−0′0141 0′0004 0′0217 −0′00280′0004 −0′001 −0′0028 0′0045

.

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 60 / 68

Esta matriz tiene importancia de cara a los contrastes de significacion individualya que entonces se usaran sus elementos de la diagonal principal.Pasamos a continuacion a calcular la bondad del ajuste realizado, es decir, elcoeficiente de determinacion:

R2 = 1− SCR

SCT.

Como SCR = 1′5657 ya ha sido calculada en la estimacion de la varianza de laperturbacion aleatoria, tan solo hay que calcular:

SCT = yty−nY2= 131′13−22 ·2′20452 = 131′13−106′916 = 24′214,

donde se ha usado que a partir del primer elemento de Xty, esto es,22∑i=1

Yt =

48′5, se obtiene que Y = 48′522 = 2′2045. En tal caso:

R2 = 1− 1′565724′214

= 1− 0′0647 = 0′9353,

Page 41: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 61 / 68

esto es, la estimacion realizada explica un 93’53 % de la variabilidad de Y .Ahora bien, como es sabido, cuanto mas cercano al 100 % mejor sera el coefi-ciente de determinacion y, por tanto, la estimacion realizada. ¿Esta en este casosuficientemente cerca del 100 % como para que la estimacion realizada sea sig-nificativa?Como respuesta afirmativa a esta pregunta, el coeficiente de determinacion ha deser superior a la siguiente cota:

k−1n−k · Fk−1,n−k(1− α)

1 + k−1n−k · Fk−1,n−k(1− α)

=318 · 3′15991

1 + 318 · 3′15991 =

0′52671′5267

= 0′345,

donde se ha usado que F3,18(0′95) = 3′15991. Puesto que el R2 obtenido es

superior a dicha cota inferior podemos afirmar que el coeficiente de determinaciones significativo, es decir, valida al modelo.Esta validacion del modelo se puede establecer tambien a partir del contraste designificacion conjunta. Bajo el supuesto de normalidad en el modelo rechazare-mos H0 : β2 = β3 = β4 = 0 si

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 62 / 68

SCEk−1SCRn−k

> Fk−1,n−k(1− α).

Para calcular la region de rechazo y tomar una decision en este contraste plan-teamos la tabla ANOVA:

Fuentes de variacion Sumas de cuadrados Grados de libertad Medias

Explicada SCE = 22′6483 k − 1 = 3 SCEk−1

= 7′5494No explicada SCR = 1′5657 n− k = 18 SCR

n−k= 0′087

Total SCT = 24′214

El unico elemento no calculado hasta el momento de la tabla anterior es SCE =SCT − SCR = 24′214 − 1′5657 = 22′6483. En tal caso, se tiene para laregion de rechazo que:

86′7747 > 3′15991,

de forma que es evidente que se rechaza la hipotesis nula de que todos los coefi-cientes pueden ser nulos de forma simultanea. Por tanto, se tiene que la relacionexistente entre las variables independientes y la dependiente no se debe al azar,validando el modelo.

Page 42: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 63 / 68

Para finalizar estudiaremos los contrastes de significacion individual. Como essabido se rechazara la hipotesis H0 : βi = 0 si

∣∣∣∣∣βi

σ√wii

∣∣∣∣∣ > tn−k

(1− α

2

),

donde σ√wii es la raız cuadrada del elemento (i, i) de la matriz

V ar

(β)

y

tn−k

(1− α

2

)= t18(0

′975) = 2′10092.

H0 : β2 = 0

β2 = 0′4862σ√w22 =

√0′0015 = 0′0387

}=⇒ β2

σ√w22

= 12′5633 > 2′10092.

H0 : β3 = 0

β3 = 0′3969σ√w33 =

√0′0217 = 0′1473

}=⇒ β3

σ√w33

= 2′6945 > 2′10092.

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 64 / 68

H0 : β4 = 0

β4 = 0′2287σ√w44 =

√0′0045 = 0′0671

}=⇒ β4

σ√w44

= 3′4083 > 2′10092.

En todos los casos se rechaza la hipotesis nula, lo que se interpreta como que lasvariables X2, X3 y X4 son significativas.Como es sabido, para llegar a estas conclusiones tambien se podrıan haber obte-nido los intervalos de confianza de cada coeficiente:

βi ± tn−k

(1− α

2

)· σ · √wii, i = 1, 2, 3, 4.

Ası por ejemplo, para el ultimo coeficiente se tiene que el intervalo de confianzaal 95 % es:

0′2287± 2′10092 · 0′0671 = (0′08772827, 0′3696717).

Como el cero no pertenece a dicho intervalo se concluira que el coeficiente co-rrespondiente sera distinto de cero.

Page 43: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 65 / 68

El intervalo de confianza al 95 % para el segundo coeficiente es:

0′4862± 2′10092 · 0′0387 = (0′4048944, 0′5675056).

Al igual que antes se concluira que el coeficiente correspondiente sera distinto decero.Para finalizar con el calculo de intervalos de confianza, obtendremos a continua-cion el intervalo para la varianza de la perturbacion aleatoria:

[(n− k) · σ2

χ2n−k

(1− α

2

) , (n− k) · σ2

χ2n−k

(α2

)]=

[SCR

χ2n−k

(1− α

2

) , SCR

χ2n−k

(α2

)].

Puesto que SCR = 1′56574, χ2n−k

(1− α

2

)= χ2

18(0′975) = 31′526 y

χ2n−k

(α2

)= χ2

18(0′025) = 8′231 es claro que el intervalo para σ2 es:

(1′5657431′526

,1′565748′231

)= (0′04966504, 0′1902248) .

Ejemplo 2

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 66 / 68

Por todo lo expuesto hasta ahora se tiene que el modelo estimado es valido y quelas variables de renta familiar, deuda y numero de hijos influyen positivamenteen el consumo de las familias. Es decir, a mayor renta, deuda y numero de hijosmayor consumo familiar. Ademas, al ser la variable correspondiente a la deudauna variable ficticia, habremos estimado la diferencia esperada en el consumofamiliar entre familias con deuda y sin deuda con el mismo nivel de renta y numerode hijos. En este caso se obtiene que dicha estimacion es positiva, por lo queaquellas familias que tienen algun tipo de deuda consumen mas que aquellas queno la tienen.

Page 44: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Lecturas recomendadas

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 67 / 68

[1] Presentacion de la edicion espanola de Johnston, J. (1989). Metodos deEconometrıa. Ed. Vicens-Vives por A.G. Barbancho.

[2] Gomez, S. y Salmeron, R. (2011). Influencia del entorno institucional en eldesarrollo del emprendimiento espanol. Un analisis empırico. Revista Vene-zolana de Gerencia, Volumen 16, Numero 54, Paginas 191-208.

[3] Novales, A. (1993). Econometrıa. McGraw Hill. Capıtulo 1 (repaso matrices).

[4] Portillo, F. (2006). Introduccion a la Econometrıa. Logrono: autoedicion.

[5] Salmeron, R. y Tamayo, J. (2010). Tecnicas cuantitativas aplicadas al anali-sis de la flexibilidad en la produccion, la explotacion y la exploracion en lasempresas. Revista Estadıstica Espanola, Volumen 52, Numero 175, Paginas529-567.

[6] Salmeron, R. y Gomez, S. (2012). Relacion entre los factores instituciona-les y el emprendimiento: analisis mediante tecnicas cuantitativas. Revista deMetodos Cuantitativos para la Economıa y la Empresa, Numero 13, Paginas54-72.

Bibliografia

Contenidos

Introduccion

Especificacion delmodelo

Estimacion del modelo

Validacion del modelo

Explotacion del modelo

Ejemplos

Ejemplo 1

Ejemplo 2

Master TCGE Introduccion a la Econometrıa: regresion multiple – 68 / 68

[1] Esteban, M.V., Moral, M.P., Orbe, S., Regulez, M., Zarraga, A. y Zubia, M.(2009). Econometrıa basica aplicada con Gretl. Sarriko-On, Universidad delPaıs Vasco.

[2] Gujarati, D. (1997). Econometrıa. Ed. McGraw Hill.

[3] Johnston, J. (1989). Metodos de Econometrıa. Ed. Vicens-Vives.

[4] Matilla, M., Perez, P. y Sanz, B. (2013). Econometrıa y prediccion. Ed. Mac-Graw Hill.

[5] Novales, A. (1993). Econometrıa. McGraw Hill.

[6] Uriel, E., Contreras, D., Molto, M.L. y Peiro, A. (1990). Econometrıa. El Mo-delo Lineal. Ed. AC.

[7] Wooldridge, J.M. (2005). Introduccion a la Econometrıa: Un enfoque mo-derno. Ed. Thomson.

Page 45: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

El Modelo LinealRoman Salmeron

http://www.ugr.es/ romansg/[email protected]

1. Especificacion del Modelo Lineal

Estudio de una variable dependiente a partir de k variables independientes (con constante) a partir de n observaciones.

yn×1 = Xn×k · βk×1 + un×1

E[un×1] = 0n×1 ( ya que E[ut] = 0 ∀t )V ar(un×1) = σ2 · Idn×n

↪→ V ar(ut) = σ2 ∀t, Cov(ut, us) = 0, ∀t 6= sX no aleatoria con rg(X) = k

↪→ Xi, i = 1, . . . , k, linealmente independientesX y u incorrelados

y =

Y1Y2...Yn

, X =

1 X12 X13 · · · X1k1 X22 X23 · · · X2k... ... ... ...1 Xn2 Xn3 · · · Xnk

= (i X2 · · ·Xk) , β =

β1β2...βk

, u =

u1u2...un

.

2. Estimacion del Modelo Lineal

Estimacion de las cantidades constantes del modelo.] β =

(XtX

)−1Xty estimador por MCO de β

� Ta Gauss-Markov: β es un estimador lineal, insesgado y optimo (mınima varianza)� V ar(β) = σ2 ·

(XtX

)−1

� Consecuencias estimacion MCO: it · e =n∑t=1

et = 0, Xt · e = 0, Y = Y , yt · e = 0.

] σ2 = eten−k estimador insesgado de σ2 (ete es la SCR)⇒ V ar(β) = σ2 ·

(XtX

)−1

� σ2 = yty−βtX tyn−k

3. Validacion del Modelo Lineal

Herramientas para determinar si la estimacion realizada es o no valida.] Coeficiente de determinacion (R2): porcentaje de variabilidad explicada por el ajuste (estimacion) realizado del modelo.

� R2 = SCESCT = 1− SCR

SCT ⇒ R2 = βtX ty−nY 2

yty−nY 2 = 1− yty−βtX ty

yty−nY 2

� Siempre que el modelo tenga constante: 0 ≤ R2 ≤ 1.� Cuanto mas proximo a 1 mejor sera el ajuste.� El coeficiente de determinacion sera significativo (es decir, validara el modelo) siempre que sea superior a la siguiente cota:

k−1n−k · Fk−1,n−k(1− α)

1 + k−1n−k · Fk−1,n−k(1− α)

.

� Coeficiente de determinacion corregido: R2= 1− (1−R2) · n−1n−k.

] Distribuciones:

β ∼ N(β, σ2 ·

(XtX

)−1) →(Rβ −Rβ

)t·[R ·(XtX

)−1 ·Rt]−1·(Rβ −Rβ

)∼ χ2q

↓(n−k)·σ2

σ2∼ χ2n−k →

(Rβ −Rβ

)t·[R·(X tX)

−1·Rt]−1

q·σ2 ·(Rβ −Rβ

)∼ Fq,n−k

] Contrastes de hipotesis:

� Rechazo H0 : Rβ = r si(Rβ − r

)t·[R·(X tX)

−1·Rt]−1

q·σ2 ·(Rβ − r

)> Fq,n−k(1− α).

� Rechazo H0 : βi = bi si∣∣∣∣βi−biσ√wi

∣∣∣∣ > tn−k(1− α

2

), wi elemento (i, i) de

(XtX

)−1.] Analisis de la varianza (ANOVA):

� Rechazo H0 : β2 = β3 = · · · = βk = 0 siSCEk−1SCRn−k

=R2

k−11−R2

n−k> Fk−1,n−k(1− α).

] Intervalos de confianza:

� Para Rβ:(Rβ − r

)t·[R ·(XtX

)−1 ·Rt]−1·(Rβ − r

)≤ q · σ2 · Fq,n−k(1− α).

� Para βi: βi ± tn−k(1− α

2

)· σ · √wi.

� Para σ2:[

(n−k)·σ2χ2n−k(1−α

2),(n−k)·σ2χ2n−k(

α2)

]=

[SCR

χ2n−k(1−α

2), SCRχ2n−k(

α2)

].

4. Explotacion del Modelo Lineal

¿Que ocurre para nueva informacion recogida en x0?] Predictor puntual: p0 = xt0 · β.

↪→ lineal, insesgado (E[p0] = xt0 · β) y optimo (mınima varianza).] Predictor por intervalo:

� Para el valor esperado: xt0 · β ± tn−k(1− α

2

)· σ ·

√xt0 · (XtX)−1 · x0.

� Para la permanencia estructural: xt0 · β ± tn−k(1− α

2

)· σ ·

√1 + xt0 · (XtX)−1 · x0.

5. Estimacion con informacion a priori

¿Como estimar β sabiendo que verifica que R · β = r (q restricciones)?] Mınimos Cuadrados Restringidos

� βR = β +(Xt ·X

)−1 ·Rt ·[R ·(Xt ·X

)−1 ·Rt]−1·(r −R · β

).

↪→ insesgado (siempre que r = R · β) y optimo(V ar

(βR

)≤ V ar

(β))

.] Consecuencias:� R2

R ≤ R2.� SCR = ete ≤ etReR = SCRR.

� σ2R =etReRn−k+q.

� Rechazamos H0 : R · β = r si (etReR−ete)/qete/(n−k) > Fq,n−k(1− α).

El Modelo Lineal Econometrıa

Page 46: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,
Page 47: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejercicios propuestos

Roman Salmeron Gomez

1. En la siguiente tabla se tienen los datos de los 6 primeros clasificados de la primera division de futbolespanola:

Equipo P PG PE PP GF GCReal Madrid 100 32 4 2 121 32

Barcelona 91 28 7 3 114 29Valencia 61 17 10 11 59 44Malaga 58 17 7 14 54 53

Atletico de Madrid 56 15 11 12 53 46Levante 55 16 7 15 54 50

donde P son los puntos conseguidos, PG, PE y PP los partidos ganados, empatados y perdidos y,finalmente, GF y GC son los goles a favor y en contra recibidos.

Dado el modelo Pt = β1 + β2GFt + β3GCt + ut, se pide:

a) Obtener la estimacion de los coeficientes de las variables del modelo.

b) Estimar la varianza de la perturbacion aleatoria.

c) Interpretar los coeficientes de las variables significativas.

d) Obtener el coeficiente de determinacion y estudiar si el modelo es significativo globalmente a partirdel mismo.

e) Comprueba que la hipotesis β2−3β3 = 0 es cierta. ¿Que deberıas hacer con esta nueva informacion?

2. Teniendo en cuenta los datos del ejercicio anterior y el siguiente modelo econometrico:

Pt = β1 + β2DPt + β3DGt + ut,

donde DP = PG− PP y DG = GF −GC, se pide:

a) Obtener la estimacion de los parametros desconocidos del modelo.

b) ¿Influye la diferencia de goles en los puntos obtenidos? (usa un intervalo de confianza para respondera esta pregunta).

c) Interpretar el coeficiente de la variable DP .

d) Obtener el coeficiente de determinacion corregido.

e) Estudiar si el modelo es conjuntamente significativo.

f) ¿Que puntuacion obtendrıa un equipo con DP = 15 y DG = 6? Con dichos datos, ¿a que intervalopertenecerıa la puntuacion esperada?

3. En la asignatura Econometrıa de LADE del curso academico 2011/2012 se realizo un examen final enel que el alumno debıa anotar la calificacion que esperaba obtener y podıa elegir antre dos opciones. Enla siguiente tabla se tiene la informacion de 8 alumnos correspondiente a las variables CO, calificacionobtenida, CE, calificacion esperada y OE, opcion elegida (1 opcion A y 0 opcion B):

1

Page 48: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Alumno CO CE OEAbelardo 8’55 9’5 1

Sergio 7’5 8’5 1Sonia 7’475 7’5 0

Rodolfo 7’45 7 0Sofia 2’8 4’5 1

Gertrudis 6’125 6 1Javier 6’7 3’7 0Elena 7’425 6’5 1

Dado el modelo COt = β1 + β2CEt + β3OEt + ut, se pide:

a) Obtener la estimacion de los parametros desconocidos del modelo.

b) Obtener un intervalo de confianza para la variable CE y para la perturbacion aleatoria.

c) Estudiar si el modelo es significativo de forma conjunta.

d) Obtener el coeficiente de determinacion y estudiar si el modelo es significativo globalmente a partirdel mismo.

e) Obtener el coeficiente de determinacion corregido.

f) Obtener el intervalo de prediccion para la calificacion obtenida de un alumno con una calificacionesperada de 7 y que haya elegido la opcion A. ¿Cual serıa el intervalo para la calificacion obtenidamedia?

g) Contrasta la hipotesis H0 : β1 − β3 = 1.

h) ¿Es cierto que 2β2 − β3 = 0?

4. En la siguiente tabla se tiene el numero de unidades (en miles) de ciclomotores producidos, UP , en losanos 2006 al 2011 ası como el valor de la produccion (en millones de euros) de cada ano, V :

Ano V UP2006 168’8 111’42007 169’9 111’82008 138’8 97’92009 81’6 54’92010 67’9 52’52011 50’4 38’6

Considerando el modelo Vt = β1 + β2UPt + ut, se pide:

a) Obtener la estimacion de los parametros desconocidos del modelo.

b) Realizar los contrastes de significacion individual (de la variable UP ) y conjunta. ¿Que ocurre alexistir una unica variable independiente?

c) Obtener el coeficiente de determinacion y estudiar si el modelo es significativo globalmente a partirdel mismo.

d) Obtener los intervalos de confianza para los parametros desconocidos del modelo.

5. Consideremos el modelo PGt = β1 + β2PBBt + ut, donde PG es el precio del gasoil (en euros/litro) yPBB es el precio del barril de Brent (en dolares/barril) para los meses de enero a julio del ano 2012.A partir de los siguientes datos:

2

Page 49: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Mes PG PBBEnero 1’334 111

Febrero 1’364 119’71Marzo 1’399 128’14Abril 1’372 118Mayo 1’35 110’52Junio 1’3 95’59Julio 1’378 103’57

Se pide:

a) Obtener la estimacion de los coeficientes de las variables del modelo.

b) Estimar la varianza de la perturbacion aleatoria.

c) Interpretar el coeficiente de la variable PBB.

d) Obtener el coeficiente de determinacion corregido.

e) Estudiar la significacion conjunta del modelo.

f) ¿Entre que valores se encontrara el precio del gasoil si PBB = 100? ¿Y el precio esperado?.

6. El gerente de cierta empresa que se dedica a la venta de vino tiene delegaciones en 6 provincias del nortede Espana. Puesto que se esta planteando ampliar mercado abriendo nuevas delegaciones ha recabadola siguiente informacion:

Provincia AV C PLeon 100 4 0

Cantabria 120 5 0Madrid 135 5 0Segovia 98 3 1Zamora 80 2 1La Rioja 120 4 1

donde AV es el numero de artıculos (botellas de vino) vendidas (en miles), C es el numero de comercialesde los que dispone la delegacion y P es una variable que toma el valor 1 si se ha realizado campanapublicitaria en dicha provincia y el valor 0 en caso contrario.

Considerando el modelo AVt = β1 + β2Ct + β3Pt + ut, se pide:

a) Obtener la estimacion de las cantidades desconocidas del modelo.

b) ¿Influye el numero de comerciales en el numero de artıculos vendidos? ¿Y el haber realizado o nopublicidad?

c) Interpretar el coeficiente de las variables.

d) Estudiar la significacion conjunta del modelo.

e) Contrastar H0 : β2 − β3 = 4.

f) ¿Entre que valores maximos y mınimos se encontrarıa el numero de artıculos vendidos si en la nuevadelegacion se disponen de 4 comerciales y se realiza campana publicitaria?

3

Page 50: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Soluciones

1. a) β =

9′72250′67440′2196

.

b) (1’5692, 67’9788).

c) texp = 7′3398 > 3′1824 = t3(0′975) → la variable GF es significativa (es decir, sus variacionesinfluyen en los puntos conseguidos).

texp = 0′7175 6> 3′1824 = t3(0′975)→ la variable GC no es significativa (es decir, sus variaciones noinfluyen en los puntos conseguidos).

Si aumentan los goles a favor aumentan los puntos conseguidos, mas concretamente, por cada gol afavor los puntos conseguidos aumentan en 0’6744.

d) R2 = 0′9926 > 0′8642 = R2sig → el modelo es significativo conjuntamente.

e) Fexp = 0′00034 6> 10′1279 = F1,3(0′95)→ no rechazo la hipotesis nula (por lo que deberıa incorporarlanueva informacion al modelo mediante los mınimos cuadrados restringidos).

2. a) β =

52′22531′7603−0′059

y σ2 = 1′3193.

b) (−0′3875, 0′2675) → como el cero pertenece al intervalo de confianza del coeficiente de DG, dichavariable no influye en los puntos obtenidos.

c) Conforme aumenta la diferencia de partidos aumentan los puntos obtenidos, mas concretamente,por cada unidad que aumenta la diferencia de partidos los puntos obtenidos lo hacen en 1’7603).

d) R2

= 0′9966.

e) Fexp = 751′4578 > 9′5521 = F2,3(0′95)→ el modelo es significativo comjuntamente.

f) PLIO = 78′27058, (65’2588, 91’2823).

3. a) β =

2′85530′7175−1′398

y σ2 = 1′529508.

b) CE ∈ (0′07558, 1′3594) y σ2 ∈ (0′5959, 9′2004).

c) texp = 1′7049 6> 2′5705 = t5(0′975)→ termino independiente no significativo.

texp = 2′87327 6> 2′5705 = t5(0′975) → la variable CE es significativa (es decir, conforme aumentala calificacion esperada lo hace la obtenida, mas concretamente, por cada punto que aumenta CE,CO lo hace en 0’7175).

texp = 1′4987 6> 2′5705 = t5(0′975)→ variable OE no significativa (lo cual es bueno?).

d) Fexp = 4′4529 < 5′7861 = F2,5(0′95)→ el modelo no es significativo.

e) R2 = 0′6404 6> 0′6982 = R2sig → el modelo no es significativo conjuntamente.

f) R2

= 0′4966.

g) (2’9974, 9’9625) y (5’058, 7’9017).

h) Fexp = 2′6537 6> 6′6078 = F1,5(0′95)→ no rechazo la hipotesis nula.

i) Fexp = 5′9351 6> 6′6078 = F1,5(0′95)→ no rechazo la hipotesis nula.

4. a) β =

(−11′7898

1′6008

)y σ2 = 24′3672.

4

Page 51: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

b) texp = 23′8086 > 2′7764 = t4(0′975)→ variable UP es significativa.

Fexp = 566′852 > 7′086 = F1,4(0′95)→ el modelo es significativo conjuntamente.

En este caso los dos contrastes realizados coinciden, tienen la misma hipotesis nula y alternativa.

c) R2 = 0′9929 > 0′6583 = R2sig → el modelo es significativo conjuntamente.

d) β1 ∈ (−27′3625, 3′78304), β2 ∈ (1′4141, 1′7874) y β3 ∈ (8′7468, 201′2082).

5. a) β =

(1′0970′0023

).

b) (0’0002006, 0’00309).

c) texp = 11′3265 6> 2′5705 = t5(0′975) → el termino independiente es significativo (si el precio delbarril de Brent fuese de 0 dolares, el gasoil tendrıa un precio de 1’097 euros por litro).

texp = 2′6912 6> 2′5705 = t5(0′975)→ la variable PBB es significativa (es decir, conforme aumentael precio del barril de Brent lo hace el precio del gasoil).

d) Un aumento de un dolar en el precio del barril de Brent supone un aumento de 0’0023 euros en elprecio del gasoil.

e) R2

= 0′5099.

f) Fexp = 7′2428 > 6′6078 = F1,5(0′95)→ el modelo es significativo conjuntamente.

g) (1’26007, 1’3962) y (1’29306, 1’3632).

6. a) β =

16′2521′87517′4583

y σ2 = 47′7638.

b) texp = 5′1687 > 3′1824 = t3(0′975) → la variable C es significativa, luego influye en el numero debotellas vendidas.

texp = 1′9327 6> 3′1824 = t5(0′975)→ la variable P no es significativa, luego no influye en el numerode botellas vendidas

c) Al aumentar el numero de comerciales tambien lo hace el numero de botellas de vino vendidas, masconcretamente, por cada comercial nuevo en la plantilla se venden 21875 botellas mas.

d) Fexp = 19′0263 > 9′55209 = F2,3(0′95)→ el modelo es significativo conjuntamente.

e) Fexp = 0′0043 6> 10′1279 = F2,3(0′95)→ no se rechaza la hipotesis nula.

f) (92’46102, 149’9556).

Nota: todos los contrastes de hipotesis e intervalos de confianza han sido realizados, segun corresponda,a un 5 % de significacion o a un 95 % de confianza.

5

Page 52: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,
Page 53: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejercicios de ordenador con Gretl

Roman Salmeron Gomez

Realiza un analisis econometrico completo de los siguientes modelos.

1. En el archivo Ejercicio1.gdt se tienen los datos correspondientes a la clasificacion historica de la primeradivision del futbol espanol. Para los 59 equipos que han participado en ella hasta ahora, analiza elsiguiente modelo econometrico:

Pt = β1 + β2PGt + β3PEt + β4PPt + β5GFt + β6GCt + ut,

donde P son los puntos conseguidos por temporada de cada equipo, PG, PE y PP los partidos ganados,empatados y perdidos por temporada y, finalmente, GF y GC son los goles a favor y en contra recibidospor temporada de cada equipo.

¿Tiene sentido que haya termino independiente en este modelo?

2. En el archivo Ejercicio2.gdt se tienen datos correspondientes a 47 alumnos que cursaron la asignaturaTecnicas Cuantitativas 2 en el curso academico 2011/2012. Para dichos alumnos se dispone de lassiguientes variables:

CO es la calificacion obtenida en el examen final de la asignatura.

NE es la calificacion esperada en el examen tras realizar el mismo.

OE es la opcion elegida en el examen final. Puesto que el examen estaba formado por dos modelos,se ha codificado con 1 al modelo A y con 0 al modelo B.

G toma el valor 1 si el alumno en cuestion pertenece al doble grado en ADE-Derecho y 0 sipertenece al de Economıa.

Se pide analizar el modelo COt = β1 + β2NEt + β3OEt + β4Gt + ut.

3. En el archivo Ejercicio3.gdt se tienen datos correspondientes a 47 alumnos que cursaron la asignaturaTecnicas Cuantitativas 2 en el curso academico 2011/2012. En dicho curso academico se realizo unaevaluacion continua en el que el 30 % de la calificacion final estaba formado por un ejercicio a resolveren pizarra, otro en ordenador y distintos examenes tipo test al final de cada tema. Por tanto, se disponede las siguientes variables:

CO es la calificacion obtenida en el examen final de la asignatura.

EC es la calificacion obtenida en el ejercicio realizado en clase.

EO es la calificacion obtenida en el ejercicio realizado con ordenador.

TT es la calificacion obtenida en los examenes tipo test realizados.

Se pide analizar el modelo COt = β1 + β2ECt + β3EOt + β4TTt + ut.

4. En el archivo Ejercicio4.gdt se tiene el numero de unidades de turismos fabricados, UF , en Espanadesde 1994 hasta 2011 y el valor de la produccion anual, V P (en miles de euros). Se pide analizar elmodelo V Pt = β1 + β2UFt + ut.

1

Page 54: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

5. En el archivo Ejercicio5.gdt se tienen los datos (desde hasta) correpondientes al precio del gasoleo (eneuros/litro), G, y del barril de Brent (en dolares/barril), BB . Se pide analizar el modelo que analizael precio del gasoleo a partir del precio del barril de Brent.

6. En el archivo Ejercicio6.gdt se tienen los datos sobre renta, R, y consumo, C, mensual de 22 familias.Tambien se dispone de informacion sobre el numero de hijos de cada familia, H, y de si las familiastienen algun prestamo con cuantıa superior a los 400 euros mensuales, D. Esta variable tomara el valor1 en caso afirmativo y 0 en el negativo. Se pide analizar el modelo Ct = β1 + β2Rt + β3Dt + β4Ht + ut.

7. En el archivo Ejercicio7.gdt se tienen los salarios de un grupo de 177 individuos en el ano 1990. Paracada uno de ellos se tiene informacion de su salario anual, S (medido en miles de dolares), de las ventasde la empresa en la que trabaja, V , y beneficios, B (medidos ambos en millones de dolares), y de losanos que lleva trabajando en la empresa, A. Se pide analizar el modelo St = β1+β2Vt+β3Bt+β4At+ut.

8. En el archivo Ejercicio8.gdt se tienen datos anuales, desde 1976 a 2009, relativos al conjunto de impor-taciones de Espana, al producto interior bruto y a la inversion. Se pide analizar el modelo que explicael comportamiento de las importaciones como funcion del producto interior bruto y de la inversion.

9. En el archivo Ejercicio9.gdt se tienen series (desde 1970 hasta 2010) sobre el consumo de energıaper capita de la economıa espanola, C, la renta per capita, R, y la temperatura media para el anocorrespondiente, T . Se pide analizar el modelo Ct = β1 + β2Rt + β3Tt + ut.

10. En el archivo Ejercicio10.gdt se tienen los dividendos, D, repartidos por un conjunto de 100 empresas deun mismo sector, el ratio de endeudamiento a corto plazo, EC, el ratio de endeudamiento a largo plazo,EL, y las ventas medias diarias, V . Se pide analizar el modelo Dt = β1 + β2ECt + β3ELt + β4Vt + ut.

11. En el archivo Ejercicio11.gdt se tiene la siguiente informacion sobre 935 personas:

S es el salario mensual (en euros).

E es la edad (en anos).

R es la raza (0 blanco, 1 no blanco).

H es el numero de horas de trabajo semanales.

C es el esatdo civil (1 casado, 0 caso contrario).

Se pide analizar el modelo St = β1 + β2Et + β3Rt + β4Ht + +β5Ct + ut.

12. En el archivo Ejercicio12.gdt se tiene informacion sobre el numero total de hipotecas concedidas portrimestres en Espana, H, sobre la tasa de desempleo promedio en cada trimestre y del euribor promediotrimestral (desde el primer trimestre del ano 2003 al segundo trimestre del ano 2011). Se pide analizarel modelo que trata de explicar el numero total de hipotecas concedidas a partir de la tasa de desempleoy el euribor.

13. En el archivo Ejercicio13.gdt se tiene, desde el primer trimestre del ano 2003 al segundo trimestre delano 2011, la tasa de desempleo, P , y de ocupacion hotelera, O, trimestral. Se pide analizar el modeloque analiza la tasa de ocupacion hotelera apartir de la tasa de paro.

Nota: los archivos de Gretl quı referenciados los puedes encontrar en la direccion webhttp://www.ugr.es/local/romansg/material/WebEco/index.html

2

Page 55: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

El Modelo Lineal General mediante GRETL

Estimacion y validacion de un modelo uniecuacional multiple

Roman Salmeron Gomez

Indice

1. Introduccion 1

2. Algunas cuestiones basicas de Gretl 3

2.1. Descarga e instalacion de Gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2. Introduccion de datos en Gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2.1. Introduccion de los datos directamente . . . . . . . . . . . . . . . . . . . . . . . 4

2.2.2. Recuperar los datos de otros formatos . . . . . . . . . . . . . . . . . . . . . . . 7

3. Estimacion y validacion de un modelo uniecuacional multiple 11

3.1. Estimacion de las cantidades constantes del modelo. Bondad del ajuste realizado . . . 11

3.2. Analisis de los errores/residuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3. Contrastes de significacion de los parametros . . . . . . . . . . . . . . . . . . . . . . . 20

3.4. Analisis de la varianza: ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.5. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.6. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1. Introduccion

En las siguientes lıneas abordaremos como realizar la estimacion y validacion de un modelo unie-cuacional multiple mediante el software econometrico Gretl. Para conseguir dicho objetivo, el presentedocumento se estructura de la siguiente forma:

1. Algunas cuestiones basicas de Gretl.

a) Descarga e instalacion de Gretl.

b) Introduccion de datos en Gretl.

2. Estimacion y validacion de un modelo uniecuacional multiple.

a) Estimacion de las cantidades constantes del modelo. Bondad del ajuste realizado.

b) Analisis de los errores/residuos.

c) Contrastes de significacion de los parametros.

d) Analisis de la varianza: ANOVA.

e) Intervalos de confianza.

1

Page 56: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Cuadro 1: Observaciones para 22 familiasFamilia Consumo Renta Deuda Hijos

1 1’3 1’5 1 12 2’5 3’2 1 23 1 2’2 0 04 2’7 4’1 1 25 1’8 1’7 1 16 1’1 2’3 0 07 2 2’8 1 38 1’2 1’8 1 09 1’6 2’5 1 110 2 3 0 311 1’5 2’7 0 012 1’7 2’6 1 013 3 5 0 114 1’4 2 1 015 4 8 1 216 4 6’6 1 117 2 5 0 018 1’5 3 1 019 2’3 2’7 1 120 5’1 7 1 321 1’6 2’5 1 222 3’2 4 1 2

Los contenidos aquı mostrados hacen referencia a la version 1.8.0 de Gretl, por lo que podrıa haberpequenas diferencias con respecto a versiones posteriores.

Por otro lado, destacar que no se pretende realizar un manual de manejo de Gretl, sino simple-mente mostrar aquellas herramientas de dicho software que permiten realizar el analisis de un modelouniecuacional multiple. Para mas informacion sobre Gretl de la aquı presentada se recomienda recurrira la ayuda del propio programa (menu Ayuda de la parte superior derecha) o realizar una busquedapor internet sin mas que escribir “manual de Gretl” en cualquier buscador (por ejemplo, Google).

Finalmente, cada uno de los apartados tendra una parte practica para facilitar su comprension.Por este motivo, se procedera a resolver paso a paso el siguiente ejercicio:

EJERCICIO 1

Supongamos que el consumo familar (Ct, medido en miles de euros) esta relacionado conla renta (Rt, medida en miles de euros), la deuda de las familias (Dt, que toma el valor 1si la familia tiene algun tipo de deuda y 0 en caso contrario) y el numero de hijos (Ht).

Se pide analizar el modelo uniecuacional multiple anterior a partir de las observaciones dela tabla del cuadro 1.

Finalmente destacar que en la pagina web de Gretl (http://gretl.sourceforge.net/win32/index es.html)es posible obtener diversos ejemplos presentes en los libros de Wooldridge (Introductory Econome-trics), Gujarati (Basic Econometrics), Stock y Watson (Introduction to Econometrics) y Davidson yMackinnon (Econometric Theory and Methods), entre otros.

2

Page 57: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 1: Pagina web oficial de Gretl

Figura 2: Descarga de Gretl

2. Algunas cuestiones basicas de Gretl

En este capıtulo veremos donde se puede descargar el programa y como instalarlo para que puedaser usado, ası como la introduccion de datos para su analisis.

2.1. Descarga e instalacion de Gretl

La descarga del software econometrico Gretl se realiza directamente a partir de su pagina webhttp://gretl.sourceforge.net/gretl espanol.html (figura 1), sin mas que pinchar sobre el enlace gretlpara Windows (si es que somos usuarios de dicha plataforma) situado en el margen superior izquier-do. En la nueva pagina a la que debemos ser dirigidos (figura 2) podremos descargarnos el ficheroejecutable auto-instalable de gretl (gretl-1.8.0.exe, en el momento de la creacion de este documento)ası como diversas opciones extras que complementan al software (como pueden ser conjuntos de datosdisponibles).

Por ahora solo estamos interesados en la instalacion del software, ası que pincharemos sobre elejecutable, gretl-1.8.0.exe. En tal caso, nos redireccionaran a un mirror donde podremos descargar elejecutable (si la descarga no inicia de forma automatica pichar sobre direct link).

Una vez descargado el archivo ejecutable en el disco duro del ordenador, hay que realizar dobleclick sobre el mismo para comenzar con el proceso de instalacion. El cual es muy sencillo (siguiente,siguiente, siguiente, instalar, finalizar) ya que dejaremos las opciones que vienen por defecto. De estaforma, en el menu de inicio, seleccionando todos los programas (figura 3), tendremos un acceso directoal software sin mas que pinchar sobre el.

3

Page 58: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 3: Acceso directo en el menu Inicio de windows

2.2. Introduccion de datos en Gretl

Una vez instalado el programa, el primer paso para abordar el analisis de un modelo es la intro-duccion de los datos del mismo. Esta tarea se puede realizar desde dos puntos de vista: realizando laintroduccion manual directa en Gretl o recuperando la informacion de otros formatos (excel, spss, txt,etc. . . ).

2.2.1. Introduccion de los datos directamente

Tras ejecutar el programa (accediendo a el mediante el anterior acceso directo), seleccionaremosla opcion Nuevo conjunto de datos (Ctrl+N) del menu Archivo en la parte superior izquierda delprograma (ver figura 4). Nos pedira el numero de observaciones, la estructura del conjunto de datos(seleccionaremos seccion cruzada1 o de serie temporal segun la naturaleza de los datos) y la confirma-cion de la estructura de los datos, para a continuacion, sin mas que seleccionar empezar a introducirlos valores de los datos, comenzar con el proceso.

En primer lugar pide el nombre de la variable, de manera que tras introducirlo, podremos anadirlos datos como en cualquier hoja de calculo (figura 5). Para anadir una nueva variable seleccionarAnadir en el menu Variable de la parte superior de la ventana y al finalizar de introducir variablespulsar sobre Cerrar. Tambien esta la opcion de Definir nueva variable. . . del menu Anadir en la partesuperior central del programa (figura 6).

Ası, para el ejercicio considerado, habra que indicar que el numero de observaciones es 22 e intro-ducir las variables C, R, D y H, como en cualquier hoja de calculo. Adviertase que en el nombre de lasvariables no se pueden escribir caracteres extranos (por ejemplo, tildes) y deben ser cortos. Ademas, ala hora de introducir los datos el delimitador decimal es la coma, si bien, si se usa el punto el programalo modifica automaticamente. Tambien cabe destacar que el programa genera de forma automatica laconstante del modelo, por lo que no es necesario introducirla. Como resultado final debemos tener lafigura 7, de forma que si seleccionamos todas las variables y pulsamos enter se mostraran todos losdatos (figura 8).

En la nueva ventana donde se muestran los datos podemos (gracias al menu de la parte superiorizquierda) guardar los mismos separados por tabuladores, por comas o por texto plano (muy util sideseamos usarlos para trabajor con otro programa, ya que recuperarlos a partir de dichos formatos

1En el ejemplo que vamos a considerar tenemos datos de seccion cruzada, es decir, se miden unas series de variablespara un conjunto de entidades (en este caso familias) en un instante de tiempo.

4

Page 59: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 4: Introduccion de un nuevo conjunto de datos

Figura 5: Introduccion de los datos

5

Page 60: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 6: Anadir los datos de una nueva variale

Figura 7: Variables introducidas

6

Page 61: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 8: Menu mostrar datos

suele ser facil). Tambien se pueden imprimir y copiar, modificar el numero de decimales y realizarcualquier tipo de busqueda.

Finalmente, si se selecciona una variable y se pulsa el boton derecho del raton surge un menu (figura9) que permite mostrar los valores de la variable, calcular sus principales estadısticos descriptivos,representar su grafico de frecuencias y de cajas, editar sus atributos, editar valores (es decir, modificarlas observaciones de la variable en cuestion o anadir nuevas), copiar al cortapapeles, borrar la variabley definir una nueva.

Destacar que en la opcion de editar atributos se puede anadir un nombre largo (etiqueta descriptiva)para cada variable de forma que sean faciles de identificar a partir del mismo, el nombre que deseamosque aparezca en las graficas y si se trata de una variable discreta. Ası, por ejemplo, en nuestro casopara la variable C introduciremos Consumo familiar (medido en miles de euros), para R Rentafamiliar (medida en miles de euros), para D Deuda familiar (1 si la hay, 0 si no la hay) ypara H Numero de hijos en cada familia (ver figura 10).

2.2.2. Recuperar los datos de otros formatos

Es habitual disponer de los datos en otros formatos (excel, texto plano, spss, etc.), por lo quedisponer de una herramienta para poder importarlos puede suponer una buena ayuda para evitar latediosa tarea de introducir los datos directamente.

Por suerte, Gretl permite importar datos desde formatos muy diversos: csv, ascii, octave, ex-cel, eviews, stata o spss, por ejemplo. Simplemente hay que seleccionar el formato en cuestion delmenu desplegado tras seleccionar la secuencia Archivo -> Abrir datos -> Importar (ver figura 11).

Como reglas generales tener en cuenta que:

7

Page 62: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 9: Opciones sobre cada variable

Figura 10: Modificacion de los atributos de una variable

8

Page 63: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 11: Importar datos en otros formatos

La primera fila del fichero deberıa contener los nombres de las variables.

La primera columna puede, opcionalmente, contener cadenas de fechas u otros ’marcadores’: enese caso, la entrada de la fila 1 deberıa estar en blanco, o deberıa contener las expresiones ’obs’o ’date’.

El resto del fichero debe ser una formacion de datos rectangular.

Destacar que al seleccionar el archivo a importar, si el proceso se realiza con exito, se nos preguntael tipo de formato a dar a los datos. Puesto que por defecto se consideran los datos de seccion cruzaday se nos pregunta si se desean cambiar a datos de series temporales o de panel, debemos respondera la pregunta que nos realizan y, en tal caso, habremos terminado con el proceso de importacion dedatos.

En el caso de importar un fichero tipo ascii (figura 12), hay que tener en cuenta que aunque ellimitador decimal sea la coma, si se utiliza esta obtendremos un fallo en la importacion de los datosya que la coma sera considerada como delimitador entre datos. Este problema se resuelve cambiandolas comas por puntos, ya que en este caso este caracter no indica ningun tipo de delimitacion entredatos y sera automaticamente cambiado por el programa de forma conveniente.

En la figura 13 se presentan los datos en formato de Excel. En este caso se nos pide la columna yfila a partir de la que empezar a importar y la hoja de Excel en la que se encuentran los datos. Eneste caso se seleccionarıa la hoja 1 y se indicarıa importar a partir de la primera columna y segundafila, si no queremos importar los nombres de las variables que se encuentran en la primera fila, y apartir de la primera fila y primera columna si se quiere conservar los nombres de las variables.

Finalmente, una vez introducidos los datos serıa conveniente guardarlos en el formato propio deGretl (.gdt) para poder disponer de ellos en un futuro. Con tal objetivo seleccionamos la opcionGuardar datos (Ctrl+S) del menu Archivo (figura 14). En la ventana que emerge tenemos que escribirel nombre que queremos para el archivo e indicar el lugar donde guardarlo. Una vez guardados losdatos podremos salir del programa sin mas que seleccionar la opcion Salir (Ctrl+X) del menu Archivo.

9

Page 64: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 12: Datos en formato ascii

Figura 13: Datos en formato de Excel

10

Page 65: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 14: Guardar datos

3. Estimacion y validacion de un modelo uniecuacional multiple

A continuacion vamos a analizar el modelo uniecuacional multiple correspondiente al ejercicio, estoes:

Ct = β0 + β1 ·Rt + β2 ·Dt + β3 ·Ht + ut.

Por tanto, entre otras cosas, estimaremos las cantidades constantes del mismo, calcularemos elcoeficiente de determinacion y los contrastes de significacion individual y conjunta. Todo esto serealizara tanto a partir de la informacion proporcionada por el programa directamente como a partirde la teorıa desarrollada en clase interpretando los resultados obtenidos.

3.1. Estimacion de las cantidades constantes del modelo. Bondad del ajuste rea-lizado

Ya que acabamos de cerrar la aplicacion, lo primero que tenemos que hacer es inicializarla yrecuperar los datos. Puesto que los tenemos salvados en el formato propio de Gretl, para recuperarlostenemos que seleccionar la opcion Archivos de ususario. . . (Ctrl+O) del menu Abrir datos de Archivo(ver figura 15) y buscamos allı donde guardamos los datos. Observar tambien que disponemos deuna lista de los ultimos archivos usados, por lo que si no han sido reubicados o borrados, podremosrecuperarlos rapidamente.

Para estimar las cantidades constantes del modelo vamos a aplicar el metodo de mınimos cuadradosordinarios (MCO). En Gretl existen dos formas distintas de acceder a dicho metodo. Una formarapida, seleccionando el penultimo icono de la parte inferior del programa, o seleccionando la opcionde Mınimos cuadrados ordinarios. . . del menu Modelo en la parte superior derecha (figura 16).

En ambos casos obtendremos el cuadro de dialogo correspondiente al metodo de MCO (figura 17),donde se puede introducir la variable dependiente y las independientes sin mas que seleccionarlas yanadirlas o quitarlas. En nuestro caso introduciremos la variable C como dependiente y el resto comoindependientes, ademas de considerar constante en el modelo. Y entonces, simplemente con pulsarAceptar obtendremos la estimacion por MCO del modelo indicado (figura 18). Se obtiene, por tanto,

11

Page 66: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 15: Abrir datos en formato de Gretl

Figura 16: Acceso al metodo de MCO

12

Page 67: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 17: Cuadro de dialogo del metodo de MCO

la siguiente estimacion de los coeficientes de las variables: termino independiente -0’00832655; R0’481571; D 0’388973 y H 0’230557.

Para terminar de estimar las cantidades constantes del modelo faltarıa la varianza de la perturba-cion aleatoria, cuya estimacion se obtiene dividiendo la suma de los cuadrados de los residuos entrela diferencia de observaciones y el numero de regresores. Por tanto, en este caso, la estimacion de lavarianza de la perturbacion aleatoria se obtiene dividiendo 2’357020 entre 22-4, esto es, 0’1309456.Adviertase que justo al lado de la suma de los cuadrados de los residuos aparece la desviacion tıpicade la regresion, 0’361864, es decir, la raız cuadrada de la estimacion anterior.

Por otro lado, de entre toda la informacion disponible, ahora mismo destacaremos la bondad delajuste realizado, es decir, el coeficiente de determinacion. Que en este caso es de un 0’902641 (un0’886414 para el R-cuadrado corregido). Puesto que esta cercano al 1 podemos indicar que el modeloajustado es adecuado y que explica un 90’2641 % de la variabilidad de la variable dependiente.

Si en la columna correspondiente a Coeficiente se tienen las estimaciones de los coeficientes delmodelo lineal uniecuacional multiple anteriormente comentadas, en la siguiente columna, Desv. Tıpi-ca, se tienen las desviaciones tıpicas estimadas de cada coeficiente estimado2. Esto es, en la segundacolumna se tienen las raıces cuadradas de los elementos de la diagonal principal de la matriz de va-

rianzas covarianzas

V ar(β)

. Atendiendo a esta informacion tradicionalmente se resume la estimacion

realizada como:

Ct = -0’00832655 + 0’481571 ·Rt + 0’388973 ·Dt + 0’230557 ·Ht R2 = 0′902641(0’209189) (0’0475691) (0’180558) (0’08207849)

Finalmente, hay que destacar que en la nueva ventana donde se presentan los resultados tenemosdistintos menus con opciones interesantes. Destacaremos las que nos resultan utiles en este momento:

Archivo: nos permite salvar los resultados en formato de texto plano, rtf o tex e imprimirlos.

2Para mas detalle ver la seccion de intervalos de confianza.

13

Page 68: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 18: Resultados de la estimacion por MCO

Editar: nos permite copiar los resultados y modificar el modelo considerado (en este caso se abrela ventana de la figura 17, es decir, el cuadro de dialogo del metodo de MCO para realizar lasmodificaciones oportunas).

Guardar: permite guardar como nuevas variables los valores estimados, los residuos o los residuosal cuadrado, entre otros.

Graficos: nos permite representar graficos de residuos y de la variable estimada y observada.

Analizar: permite, por ejemplo, mostrar de forma conjunta la variable observada, la estimada ylos residuos.

Ası por ejemplo, a partir del menu Graficos (figura 19) podemos representar de forma conjuntalos valores observados y estimados de la variable dependiente (figura 20). Adviertase que pulsandoel boton derecho del raton sobre la imagen en cuestion (figura 21) podemos, entre otras acciones,guardar la imagen en distintos formatos, imprimirla o editarla. Este ultimo aspecto permite cambiarla apariencia de la representacion grafica: tıtulos, escala, colores, etc. Por ejemplo, en la figura 22 semodifica la representacion de puntos por lıneas.

3.2. Analisis de los errores/residuos

Destinaremos este apartado a analizar los residuos. Basicamente comprobaremos que tienen mediacero y son normales. En un futuro se estudiaran las hipotesis de incorrelacion y heteroscedasticidad.

En primer lugar, pinchando en Mostrar variable observada, estimada y residuos del menu Analisisde la ventana de resultados se nos presentan de forma conjunta la variable estimada, observada ylos residuos (figura 23). Si bien, para poder almacenar los residuos como una nueva variable hay queseleccionar Residuos del menu Guardar (figura 24). Habra que indicar en este caso el nombre de lavariable (por ejemplo, e) y su descripcion (por ejemplo, residuos del modelo).

De forma exploratoria podemos representar los residuos por numero de observacion pinchandoen Por numero de observacion del menu Grafico residuos de Graficos (figura 25). En el grafico quese obtiene (figura 26), se observa como los residuos se situan alrededor del cero (la que tiene queser su media). Si bien, este aspecto lo confirmaremos calculando (nos situamos sobre la variable

14

Page 69: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 19: Opcion Grafico de variable estimada y observada del menu Graficos

Figura 20: Representacion conjunta de la variable dependiente estimada y observada

15

Page 70: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 21: Opciones sobre un grafico en Gretl

Figura 22: Aspectos que se pueden modificar en un grafico

16

Page 71: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 23: Valores observados, estimados y residuos

Figura 24: Guardar residuos como nueva variable

17

Page 72: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 25: Obtener grafico de los residuos

Figura 26: Grafico de los residuos frente al numero de observacion

correspondiente a los residuos, pulsamos el boton derecho del raton y seleccionamos la opcion deEstadısticos descriptivos) los estadısticos descriptivos de los residuos (figura 27).

Como es sabido la gran riqueza del modelo lineal se obtiene cuando se introduce la hipotesis denormalidad en el mismo, por lo que comprobar la suposicion de normalidad en los residuos parececrucial. Pinchando sobre Normalidad residuos del menu Contrastes se obtiene la distribucion de fre-cuencias de los residuos y la correspondiente prueba de la Chi-cuadrado sobre la normalidad (figura28). Tambien se obtiene un histograma de los residuos con la curva normal (figura 29) donde tambienaparece la prueba Chi-cuadrado. En este caso, puesto que el p-valor, mınimo valor a partir del cualse rechaza la hipotesis nula, es 0’0936175, no rechazaremos la hipotesis nula de normalidad (ya que esmayor que 0.05).

Finalmente, aunque no tenga que ver con los residuos, podemos plantearnos contrastar si se verificala hipotesis de linealidad, es decir, contrastar si la relacion existente entre la variable dependiente, lasvariables independientes y la peturbacion aleatoria es lineal. Con tal objetivo seleccionaremos, en laventana donde tenemos la estimacion por MCO, la opcion No linealidad (cuadrados) o No linealidad(logs) del menu Contrastes. En ambos casos se trata de un contraste que tiene por hipotesis nula quela relacion es lineal. Puesto que para los dos contrastes el p-valor es mayor que 0.05 (ver figura 30),se decide no rechazar la hipotesis nula, luego en este caso no rechazamos que la relacion existente sea

18

Page 73: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 27: Estadısticos descriptivos de los residuos del modelo

Figura 28: Prueba de normalidad de los residuos

19

Page 74: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 29: Histograma de los residuos con curva normal

lineal.

3.3. Contrastes de significacion de los parametros

En el presente apartado estudiaremos los distintos contrastes de hipotesis que permite realizarGretl.

Observando la figura 18 (que corresponde a la salida dada por el programa en la estimacionpor mınimos cuarados ordinarios), vemos que automaticamente Gretl proporciona los contrastes designificacion individual, es decir, aquellos en los que la hipotesis nula afirma que βi = 0, para i=0,1,2,3.Para estos contrastes hay que fijarse en la ultima columna de la tabla que hay, es decir, en aquellaque tiene por tıtulo Valor p. En dicha columna tenemos el p-valor correspondiente a cada uno de loscontrastes de significacion individual. Si recordamos que el p-valor es el mınimo valor a partir del cual serechaza la hipotesis nula, en aquellos casos en los que el p-valor se mayor que 0.05 (nivel de significacional que trabajamos) no rechazaremos la hipotesis nula. Luego no podemos rechazar que la constante seaigual a cero, al mismo tiempo se tiene que los coeficientes β1, β2 y β3 son significativamente distintosde cero. Ademas, atendiendo al signo de la estimacion obtenida, las variables R, D y H influyenpositivamente sobre la variable dependiente (puesto que la constante no es significativamente distintade cero no podemos realizar ningun tipo de comentario similar).

Ası por ejemplo, la estimacion de β3 es 0’230557 (ver primera columna de la tabla de la figura 18).Dicha estimacion nos podrıa hacer pensar que el valor de dicho parametro pueda ser cero. Sin embargo,observando el p-valor, 0’0116, asociado al contraste de significacion individual (hipotesis nula β3 = 0)nos indica que dicho parametro es significativamente distinto de cero, ya que es menor que 0.05 y, portanto, en dicho caso se rechaza la hipotesis nula del contraste planteado. Por otro lado, la estimaciondel termino independiente es -0’00832655. De igual forma dicha estimacion me puede hacer pensar queel valor del paramtero es cero, cuestion que se confirma en esta ocasion al comprobar que el p-valor,0’9687, es mayor que el nivel de significacion considerado, 0.05, por lo que no se rechazara la hipotesisnula de que el parametro sea cero.

Adviertase que en la tabla de la figura 18 viene tambien el valor experimental de la t-Student(columna correspondiente a Estadıstico t) con el que se realiza el contraste de significacion indivi-dual, dicho valor se obtiene, como es sabido, a partir de la estimacion de cada coeficiente (columnaCoeficiente) y la desviacion tıpica estimada de cada coeficiente estimado, es decir, la raız cuadradade los elementos de la diagonal principal de la estimacion de la matriz de varianzas-covarianzas de

20

Page 75: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 30: Contrastes de linealidad

la estimacion de beta (colummna correspondiente a Desv. Tıpica). Ası, por ejemplo, para el segun-do parametro, 0’481571/0’0475691 = 10’12. Por tanto, tambien es posible tomar una decision parael contraste a partir de la region de rechazo, sin mas que comparar este valor con el valor teoricocorrespondiente de la t-Student.

¿Como se obtiene dicho valor teorico? Evidentemente hay que usar las tablas de la t-Studentque tienen recogidos dichos valores, si bien, en nuestro caso podemos recurrir tambien a Gretl paraobtener dicho valor. Seleccionando Tablas estadısiticas del menu Herramientas nos aparece una nuevaventana donde podemos calcular el valor teorico de distintas distribuciones (por ejemplo, normal,t-Student, Chi-Cuadrado, F-Snedecor, Binomial, poisson), entonces seleccionando en este caso la t-Student tendremos que introducir los grados de libertad y la probabilidad que queda a la derecha (verfigura 31).

En nuestro caso, los grados de libertad se obtienen a partir de n − k = 22 − 4 = 18, donde nrepresenta el numero de observaciones que se disponen y k el numero de variables independientespresentes en el modelo (informacion que se obtiene a partir de la figura 18 sin mayores problemas).Mientras que la probabilidad de la cola derecha corresponde a 0.025, ya que trabajamos a un 5 % designificacion y la t-Student es una distribucion simetrica. Por tanto, el valor teorico de la t-Student con18 grados de libertad que deja a la derecha una cola con probabilidad 0.025 que se obtiene es 2’10092(figura 32). Luego como el valor experimental, 10’12, es mayor que el teorico se decide rechazar lahipotesis nula, es decir, el parametro es significativamente distinto de cero.

Finalmente, Gretl tambien permite plantear y resolver contrastes lineales sobre los parametros delas variables. Algunos ejemplos de restricciones lineales pueden ser:

b[1] - 2*b[2] + 3*b[0] = 0

b[2] - b[3] = 0

b[2] + 2*b[3] = 1

Ası, para tomar una decision sobre la hipotesis nula de que b[2] + 2*b[3] = 1, en la ventana dondetenemos las estimaciones de los parametros (figura 18), seleccionamos la opcion Restricciones linealesdel menu Contrastes (figura 33). En la nueva ventana que emerge hay que especificar la restriccion

21

Page 76: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 31: Valores de las tablas estadısticas

Figura 32: Valor teorico de la t-Student con 18 grados de libertad que deja a la derecha una cola conprobabilidad 0.025

22

Page 77: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 33: Restricciones lineales

anterior (figura 34) y sin mas que pulsar en aceptar se realizara el contraste. Si se pulsa sobre elboton de Ayuda, Gretl nos indica como introducir las restricciones lineales (por ejemplo, se puedenintroducir mas de una de forma simultanea). Finalmente, obtendremos los resultados del contraste enuna nueva ventana (figura 35). Se nos proporciona el valor experimental de la F y el p-valor asociado,luego al igual que antes, tenemos dos opciones para tomar una decision en el contraste: mediantela region de rechazo y mediante el p-valor. La primera opcion se resuelve exactamente igual que enel caso del ANOVA: buscando el valor teorico y comparandolo con el experimental (que veremos acontinuacion), mientras que para la segunda opcion solo tenemos que comparar el p-valor con 0.05(nivel de significacion considerado). Puesto que en este caso p-valor = 0’489543 > 0.05 = nivel designificacion, no se rechaza la hipotesis nula de que los coeficientes cumplen la relacion lineal planteada.En tal caso habra que tener en cuenta la nueva estimacion de los coeficientes bajo la suposicion deque la restriccion anterior es cierta (mınimos cuarados restringidos):

Ct = 0’086029 + 0’474688 ·Rt + 0’262656 ·Dt + 0’249346 ·Ht

(0’158707) (0’0459383) (0’0229691) (0’0766041)

Evidentemente hay que tener en cuenta las mismas en el caso de que no se rechace la hipotesisnula.

A modo de resumen, cuando se resuelva un contraste a partir del p-valor, hay que tener en cuentala siguiente regla que se deduce a partir de la definicion del mismo:

si p-valor es mayor que 0.05 no se rechaza la hipotesis nula del contraste

siempre y cuando se trabaje al 5 % de significacion (si es al 1 % el valor de comparacion sera 0.01).

3.4. Analisis de la varianza: ANOVA

En el presente apartado estudiaremos el contraste de significacion conjunta, es decir, aquel en elque la hipotesis nula afirma que β1 = β2 = β3 = 0. En tal caso, tenemos que fijarnos en la cuarta filade los resultados que aparecen despues de la tabla que contiene las estimaciones (ver figura 18). Eneste caso se nos proporciona el valor experimental de la F-Snedecor, 55’62750, y su p-valor asociado,

23

Page 78: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 34: Especificacion de las restricciones lineales

Figura 35: Resultado del contraste de restricciones lineales sobre los parametros

24

Page 79: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 36: Valor teorico de la F de Snedecor con 3 y 18 grados de libertad que deja a la derecha unacola con probabilidad 0.05

0’00000000265. Atendiendo al p-valor, puesto que es claramente menor que 0.05 se rechaza la hipotesisnula de que los coeficientes son nulos de forma simultanea.

Al mismo tiempo tambien es posible plantear la region de rechazo en este caso. Ya tenemos elvalor experimental, luego solo faltarıa calcular el teorico. Para ello, en el mismo menu de antes (figura36) hay que seleccionar los valores crıticos de F y especificar los grados de libertad del numeradory del denominador (3 y 18, respectivamente) y la probabilidad en la cola derecha, 0.05 (puesto quetrabajamos a un 5 % de significacion). Adviertase que los grados de libertad nos los proporciona elprograma cuando nos da el valor de la F experimental. Puesto que el valor experimental, 55’62750, esclaramente mayor que el teorico, 3’15991, se rechaza la hipotesis nula de que los coeficientes son nulosde forma simultanea.

¿Se puede obtener el valorexperimental de la F a partir de la informacion mostrada en la salidade la figura 18?

Teniendo en cuenta que SCT = n · V ar(Y ) donde Y es la variable dependiente, ya que en dichafigura se tiene que la desviacion tıpica de la variable dependiente es 1’073702, es claro que SCT =22·1′0737022 = 25′36239. Por otro lado se tiene que SCR = 2′357020, por lo que SCE = SCT−SCR =25′36239 − 2′357020 = 23′00537. Entonces se tiene que:

Fexp =SCE/(k − 1)

SCR/(n− k)=

23′00537/3

2′357020/18=

7′668457

0′1309456= 58′56216.

Otra opcion para obtener dicho valor es usar la expresion equivalente:

Fexp =R2/(k − 1)

(1 −R2)/(n− k)

0′902641/3

0′097359/18=

0′3008803

0′005408833= 55′62758.

¿Por que no salen iguales? Gretl, al igual que practicamente todos los paquetes estadısticos, trabajacon la cuasivarianza muestral en lugar de con la varianza muestral, ya que el primero es un estimadorinsesgado y el segundo no. Por tanto para calcular la SCT hay que multiplicar por n − 1 en lugarde por n. Si se repiten las cuentas partiendo de SCT = 21 · 1′0737022 = 24′20956 llegaremos a queFexp = 55′6275.

Destacar que este contraste es de suma importancia ya que mide el poder explicativo global detodas las variables, es decir, al rechazar la hipotesis nula rechazamos que la variabilidad observada en

25

Page 80: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 37: Opcion ANOVA

Figura 38: Tabla ANOVA

la variable dependiente sea explicable por el azar. ¿Y quien mide mide la variabilidad de la variableindependiente? Se esta afirmando pues que el coeficiente de determinacion o R cuadrado es significa-tivo y, por tanto, admitimos que hay algun tipo de asociacion entre las variables dependientes y lasindependientes.

Ademas, mediante el menu Analisis de la ventana de la figura 18, seleccionando ANOVA (figura37), obtenemos la conocida como tabla ANOVA (figura 38). A partir de dicha tabla es facil obtenerel coeficiente de determinacion (mediante su expresion en funcion de las sumas de cuadrados) y elvalor experimental anterior de la F.

3.5. Intervalos de confianza

En este apartado calcularemos los distintos intervalos de confianza que se pueden hacer en elmodelo lineal. Ası, seleccionando Intervalos de confianza para los coeficientes del menu Analisis de laventana de la estimacion por MCO (figura 39) obtenemos automaticamente los intervalos de confianza,al nivel de confianza del 95 %, para cada uno de los coeficientes de las variables del modelo (figura40). Adviertase que tambien se nos proporciona el valor teorico de la distribucion t-Student utilizado.

En dicho menu tambien es posible seleccionar Elipse de confianza... (ver figura 39) que nos permitecalcular la region de confianza conjunta para cualquier par de coeficientes de las variables del modelo.Ası por ejemplo, en la figura 41 se tiene la ventana para indicar los coeficientes para los que se quierecalcular dicha region de confianza (donde tambien se puede modificar el nivel de confianza al que

26

Page 81: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 39: Menu de intervalos de confianza para los coeficientes

Figura 40: Intervalos de confianza para los coeficientes

27

Page 82: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 41: Seleccion del elipse de confianza para los coeficientes de Renta e Hijos

Figura 42: Elipse de confianza para los coeficientes de Renta e Hijos

calcular la elipse) y en la figura 42 los resultados obtenidos. Vemos como el centro de la elipse es(0’482, 0’231) y se puede comprobar graficamente como, por ejemplo, el punto (0’3, 0’1) no pertenecea dicha region o como (0’5, 0’1) si lo hace.

Por otro lado, no se puede obtener el intervalo de confianza para la varianza de la perturbacionaleatoria de forma directa, si bien, con la informacion de la figura 18 se puede calcular este sinmayores problemas, ya que nos proporciona la suma de los cuadrados de los residuos, 2’357020, que esla cantidad necesaria para calcular dicho intervalo. Para completar la informacion necesaria solo faltanlos puntos (que se pueden obtener como es sabido mediante Gretl) de una chi-cuadrado con 18 gradosde libertad (n− k donde n es el numero de observaciones y k el numero de variables dependientes delmodelo) que dejan a su izquierda una probabilidad de 0.025 y 0.975 (estamos calculando un intervaloal 5 % de nivel de confianza). Dichos puntos son, respectivamente, 8’23075 y 31’5264 (ver figura 43).Por tanto, el intervalo de confianza al nivel de confianza del 5 % para la varianza de la perturbacionaleatoria es (2’357020/31’5264, 2’357020/8’23075) = (0’07476337, 0’2863676).

Pero es que ademas, la figura 18 tambien proporciona la informacion necesaria para calcular losintervalos de confianza para cada uno de los coeficientes de las variables sin mas que tener en cuenta

28

Page 83: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 43: Puntos de una chi-cuadrado con 18 grados de libertad que dejan a su izquierda una proba-bilidad de 0.025 y 0.975

29

Page 84: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Figura 44: Valor teorico de la distribucion t-Student con 18 grados de libertad que deja a su izquierdauna probabilidad de 0.975

que estos se construyen a partir de (coeficiente - valor t teorico * Desv. Tıpica, coeficiente - valor tteorico * Desv. Tıpica). Es decir:

para constante: (-0’00832655 - 2’10092 * 0’209189, -0’00832655 + 2’10092 * 0’209189) = (-0’447817,0’431164).

para R: (0’481571 - 2’10092 * 0’0475691, 0’481571 + 2’10092 * 0’0475691) = (0’381632, 0’581510).

para D: (0’388973 - 2’10092 * 0’180558, 0’388973 + 2’10092 * 0’180558) = (0’00963404, 0’768311).

para H: (0’230557 - 2’10092 * 0’0820784, 0’230557 + 2’10092 * 0’0820784) = (0’0581163, 0’402997).

Donde el valor teorico de la distribucion t-Student se obtiene al igual que antes (para la chi-cuadrado) a partir del menu Herramientas seleccionando Tablas estadısticas (ver figura 44).

Finalmente, destacar que mediante los intervalos de confianza calculados se puede dar respuestaa los contrastes de hipotesis con hipotesis nula βi = bi o σ2 = σ0, sin mas que comprobar si bi o σ0pertenecen al correspondiente intervalo de confianza. Es decir, si pertenecen al intervalo de confianzano se rechaza la hipotesis nula y si no lo hacen se rechazara la hipotesis nula. Ası por ejemplo, para loscontrastes con hipotesis nula β2 = 0, β3 = 0′3, β0 = 2 o σ2 = 1 se rechazarıa, no rechazarıa, rechazarıay rechazarıa, respectivamente, dicha hipotesis nula al nivel de significacion del 5 % (ya que el 0, el 2 yel 1 no pertenecen a los correspondientes intervalos de confianza, mientras que el 0’3 sı).

3.6. Conclusion

Por todo lo expuesto hasta ahora se tiene que el modelo estimado es valido y que las variables derenta familiar, deuda y numero de hijos influyen positivamente en el consumo de las familias. Es decir,a mayor renta, deuda y numero de hijos mayor consumo familiar. Ademas, al ser la variable corres-pondiente a la deuda una variable ficticia, habremos estimado la diferencia esperada en el consumofamiliar entre familias con deuda y sin deuda con el mismo nivel de renta y numero de hijos. En estecaso se obtiene que dicha estimacion es positiva, por lo que aquellas familias que tienen algun tipo dedeuda consumen mas que aquellas que no la tienen.

Adviertase que las conclusiones anteriores se basan en los supuestos basicos realizados sobre laperturbacion aleatoria, por tanto, se debe verificar que se cumplen dichas hipotesis.

30

Page 85: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Econometrıa y el entorno de programacion R: funcionMUM

Roman Salmeron Gomez

Para afrontar un primer analisis de un modelo econometrico usando el entorno de progra-macion R, los alumnos contaran con la ayuda de la siguiente informacion sobre la funcionMenuMUM. Destacar que se trata de una funcion creada por el profesor en la que se vancalculando paso a paso cada uno de los conceptos explicados en clase.

Pasos a seguir:

Descarga e instalacion de R.Enlace: http://www.ugr.es/local/romansg/material/softlibre/r1 es.html).¡¡Ojo!! Asegurarse que se asocian los archivos .RData con R.

Descargar la funcion MenuMUM: MenuMUM.RData.Enlace: http://www.ugr.es/local/romansg/material/WebEco/MenuMUM.RData).

Ejecutar el archivo anterior. Si has instalado bien el programa apararecera la siguientepantalla donde podemos observar que nos avisan de que se ha cargado un espacio detrabajo ya creado:

Y finalmente, sin mas que escribir MenuMUM(), podremos empezar a trabajar!!!!.

1

Page 86: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Ejemplo

Como ejemplo analicemos un modelo en el que el consumo familiar mensual (en miles deeuros) es explicado a partir de la renta mensual familiar (tambien medida en miles de euros).Los datos de los que se disponen son los siguientes para el consumo:

1,32,512,71,81,121,21,621,51,731,44421,52,35,11,63,2,

mientras que para la renta:

1,53,22,24,11,72,32,81,82,532,72,65286,6532,772,54.

Al ejecutar MenuMUM() introduciremos los datos tal y como aparece en la siguienteimagen:

Adviertase que el programa considera que el modelo tiene termino independiente (por loque no hay que incluirlo) y que, en este caso, no se ha querido realizar prediccion ni contrastealguno sobre combinaciones lineales de los parametros.

Al finalizar, se mostraran en pantalla la representacion grafica de los valores observadospara el consumo junto a su estimacion y la grafica de los residuos. Ademas, tambien apareceranlos siguientes resultados:

$‘X^{t}X‘

[,1] [,2]

[1,] 22.0 76.2

[2,] 76.2 331.8

$‘X^{t}Y‘

[,1]

[1,] 48.50

[2,] 204.45

$‘Estimacion de los coeficientes de las variables‘

2

Page 87: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

[,1]

[1,] 0.3437073

[2,] 0.5372499

$‘Estimacion de la varianza de la perturbacion aleatoria‘

[,1]

[1,] 0.2309731

$‘Estimacion de la matriz de varianzas-covarianzas de beta estimada‘

[,1] [,2]

[1,] 0.05132529 -0.011787183

[2,] -0.01178718 0.003403124

$‘Estimacion de la variable dependiente‘

[,1]

[1,] 1.149582

[2,] 2.062907

[3,] 1.525657

[4,] 2.546432

[5,] 1.257032

[6,] 1.579382

[7,] 1.848007

[8,] 1.310757

[9,] 1.686832

[10,] 1.955457

[11,] 1.794282

[12,] 1.740557

[13,] 3.029957

[14,] 1.418207

[15,] 4.641706

[16,] 3.889556

[17,] 3.029957

[18,] 1.955457

[19,] 1.794282

[20,] 4.104456

[21,] 1.686832

[22,] 2.492707

$‘Residuos del modelo‘

[,1]

[1,] 0.15041791

[2,] 0.43709314

[3,] -0.52565700

[4,] 0.15356827

[5,] 0.54296793

[6,] -0.47938198

[7,] 0.15199309

[8,] -0.11075705

[9,] -0.08683195

[10,] 0.04454312

3

Page 88: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

[11,] -0.29428193

[12,] -0.04055694

[13,] -0.02995660

[14,] -0.01820702

[15,] -0.64170618

[16,] 0.11044362

[17,] -1.02995660

[18,] -0.45545688

[19,] 0.50571807

[20,] 0.99554368

[21,] -0.08683195

[22,] 0.70729326

$‘Sumas de cuadrados: SCT, SCE, SCR‘

[1] 24.209545 19.590084 4.619462

$‘Coeficiente de determinacion‘

[,1]

[1,] 0.8091884

$‘Coeficiente de determinacion corregido‘

[,1]

[1,] 0.7996478

$‘Seleccion de modelos‘

$‘Seleccion de modelos‘$‘Criterio de informacion de Akaike‘

[,1]

[1,] 32.09648

$‘Seleccion de modelos‘$‘Criterio de informacion bayesiano de Schwarz‘

[,1]

[1,] 34.27857

$‘Seleccion de modelos‘$‘Criterio de informacion de Hannan-Qinn‘

[,1]

[1,] 32.61052

$‘Matriz de varianzas-covarianzas de las variables dependientes‘

[,1]

[1,] 3.231948

$‘Matriz de correlaciones de las variables dependientes‘

[,1]

[1,] 1

$‘Contrastes de significacion individual‘

$‘Contrastes de significacion individual‘$‘Valores experimentales de cada contraste‘

[,1] [,2]

[1,] 1.517131 9.20953

4

Page 89: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

$‘Contrastes de significacion individual‘$‘Valor teorico de la t-Student‘

[1] 2.085963

$‘Contrastes de significacion individual‘$‘Decision de cada contraste‘

[,1] [,2]

[1,] "La variable 1 no es significativa" "La variable 2 es significativa"

$‘Contraste de significacion conjunta‘

$‘Contraste de significacion conjunta‘$‘Tabla ANOVA‘

[,1] [,2] [,3]

[1,] "Fuentes de variacion" "Sumas de cuadrados" "Grados de libertad"

[2,] "Estimada" "19.5900835080695" "1"

[3,] "Residual" "4.61946194647594" "20"

[4,] "Total" "24.2095454545454" ""

[,4]

[1,] "Medias"

[2,] "19.5900835080695"

[3,] "0.230973097323797"

[4,] "84.8154340702569"

$‘Contraste de significacion conjunta‘$‘Contraste ANOVA‘

[1] "Como la F experimental, 84.8154340702569 , es mayor que la teorica,

4.35124350332929 , se rechaza la hipotesis nula, es decir, existe

al menos un coeficiente no nulo"

$‘Significacion del coeficiente de determinacion‘

[1] "Puesto que el coeficiente de determinacion, 0.809188406484162 ,es mayor

que la cota inferior de significacion, 0.178686706604301 ,es significativo"

$‘Intervalos individuales para cada coeficiente‘

[,1] [,2]

[1,] -0.1288695 0.8162841

[2,] 0.4155625 0.6589372

$‘Intervalo de confianza para la varianza de la perturbacion aleatoria‘

[,1] [,2]

[1,] 0.1351921 0.4816567

Notas finales

R es un conjunto integrado de programas para manipulacion de datos, calculo y graficos,que puede definirse como una nueva implementacion del lenguaje S desarrollado en AT&T (porlo que muchos de los libros y manuales sobre S son utiles para R). El entorno de programacionR esta disponible como software libre con licencia GNU de la Fundacion de Software Libre.Sus principales caracterısticas son:

Almacenamiento y manipulacion efectiva de datos.

5

Page 90: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Operadores para el calculo sobre variables indexadas, en particular, matrices.

Una amplia, coherente e integrada coleccion de herramientas para analisis de datos.

Posibilidades graficas para analisis de datos, que funcionan directamente sobre pantallao impresora.

Un lenguaje de programacion bien desarrollado, simple y efectivo, que incluye condicio-nales, ciclos, funciones recursivas y posibilidad de entradas y salidas.

Mas informacion en su web oficial: http://www.r-project.org/.

Evidentemente se trata de un entorno de programacion muy contrastado que ya tiene im-plementado de manera eficiente el analisis de un modelo econometrico (mediante la funcionlm). ¿Por que no usar entonces la funcion que nos ofrece R para dicho analisis? Muy sencillo.Puesto que el fin final de estas lıneas es puramente docente y no investigador se ha optado porcrear una funcion donde los alumnos puedan identificar aquellas expresiones que se estudiana lo largo de la asignatura. Sin ninguna duda, la funcion lm del entorno R para el ajuste demodelos lineales es una herramienta mas potente que la aquı expuesta.

Puedes encontrar informacion sobre esta funcion facilmente escribiendo su nombre en cual-quier buscador de internet (por ejemplo, Google).

En el siguiente enlace tienes un ejemplo de su uso:

http://www.ugr.es/local/romansg/material/softlibre/r2 es.html

6

Page 91: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Regresion lineal multiple con Stata

Roman Salmeron Gomez

En el presente documento se aborda brevemente como estimar y validar un modelo linealde regresion multiple con Stata. Mas concretamente, se analizara el modelo

Ct = β1 + β2Rt + β3Dt + β4Ht + ut,

donde los datos de las variables consumo familiar, C, renta familiar, R, deuda, D, y numero dehijos, H, se encuentran en la tabla 1.

Cuadro 1: Observaciones para 22 familiasFamilia Consumo Renta Deuda Hijos

1 1’3 1’5 1 12 2’5 3’2 1 23 1 2’2 0 04 2’7 4’1 1 25 1’8 1’7 1 16 1’1 2’3 0 07 2 2’8 1 38 1’2 1’8 1 09 1’6 2’5 1 110 2 3 0 311 1’5 2’7 0 012 1’7 2’6 1 013 3 5 0 114 1’4 2 1 015 4 8 1 216 4 6’6 1 117 2 5 0 018 1’5 3 1 019 2’3 2’7 1 120 5’1 7 1 321 1’6 2’5 1 222 3’2 4 1 2

Los datos en Stata se introducen directamente pulsando el boton correspondiente a DataEditor (edit) o importandolos, por ejemplo desde Excel, sin mas que copiarlos en la hoja decalculo y pegandolos en la de Stata (si el nombre de las variables esta escrito en la primerafila de la hoja de calculo aparecera un mensaje preguntando si dicha fila ha de tratarla comolos nombres de las variables o como datos).

Una vez introducimos los datos, en primer lugar vamos a calcular los principales estadısti-cos descriptivos de las variables (excepto de la variable D por ser dicotomica). Usaremos loscomandos su y corr de Stata:

1

Page 92: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

. su consumo renta deuda hijos, detail

Consumo

-------------------------------------------------------------

Percentiles Smallest

1% 1 1

5% 1.1 1.1

10% 1.2 1.2 Obs 22

25% 1.5 1.3 Sum of Wgt. 22

50% 1.9 Mean 2.204545

Largest Std. Dev. 1.073702

75% 2.7 3.2

90% 4 4 Variance 1.152835

95% 4 4 Skewness 1.211082

99% 5.1 5.1 Kurtosis 3.718969

Renta

-------------------------------------------------------------

Percentiles Smallest

1% 1.5 1.5

5% 1.7 1.7

10% 1.8 1.8 Obs 22

25% 2.3 2 Sum of Wgt. 22

50% 2.75 Mean 3.463636

Largest Std. Dev. 1.797762

75% 4.1 5

90% 6.6 6.6 Variance 3.231948

95% 7 7 Skewness 1.240405

99% 8 8 Kurtosis 3.49813

Hijos

-------------------------------------------------------------

Percentiles Smallest

1% 0 0

5% 0 0

10% 0 0 Obs 22

25% 0 0 Sum of Wgt. 22

50% 1 Mean 1.136364

Largest Std. Dev. 1.082126

75% 2 2

90% 3 3 Variance 1.170996

95% 3 3 Skewness .4186488

99% 3 3 Kurtosis 1.903154

. corr consumo renta hijos

2

Page 93: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

| consumo renta hijos

-------------+---------------------------

consumo | 1.0000

renta | 0.8995 1.0000

hijos | 0.5814 0.3772 1.0000

A partir de las correlaciones podemos observar, por ejemplo, una alta correlacion positivaentre el consumo y la renta.

Para estimar y validar el modelo anterior usaremos el comando reg de Stata:

. reg consumo renta deuda hijos

Source | SS df MS Number of obs = 22

-------------+------------------------------ F( 3, 18) = 55.63

Model | 21.8525248 3 7.28417492 Prob > F = 0.0000

Residual | 2.35702018 18 .130945566 R-squared = 0.9026

-------------+------------------------------ Adj R-squared = 0.8864

Total | 24.2095449 21 1.15283547 Root MSE = .36186

------------------------------------------------------------------------------

consumo | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

renta | .4815709 .0475691 10.12 0.000 .3816319 .5815099

deuda | .3889727 .1805582 2.15 0.045 .0096341 .7683114

hijos | .2305566 .0820784 2.81 0.012 .0581163 .402997

_cons | -.0083266 .2091894 -0.04 0.969 -.4478172 .4311641

------------------------------------------------------------------------------

Dicho comando da como salida fundamentalmente la tabla ANOVA (contraste de signifi-cacion conjunta) junto a su p-valor asociado, el R2 (y su version corregida) y las estimacionesde los coeficientes junto a sus p-valores asociados (contrastes de significacion individual) eintervalos de confianza.

Podemos observar que todas las variables son significativas (p-valor inferior a 0.05) exceptoel termino independiente, es decir, la constante no es significativamente distinta de cero. Ahorabien, ¿tiene sentido que el modelo tenga termino independiente? Este termino se interpretacomo el consumo de una familia sin renta alguna, sin deudas y sin hijos. ¿Una familia sinrenta consumirıa? Parece por tanto que se puede prescindir del termino independiente desdeun principio.

Estimamos1 entonces el nuevo modelo que se obtiene sin mas que introducir noconstant alfinal de la orden:

. reg consumo renta deuda hijos, noconstant

1Hay que tener mucho cuidado cuando se trabaja con un modelo sin termino independiente ya que, porejemplo, el coeficiente de determinacion ya no tiene por que estar comprendido entre 0 y 1.

3

Page 94: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Source | SS df MS Number of obs = 22

-------------+------------------------------ F( 3, 19) = 345.98

Model | 128.772772 3 42.9242573 Prob > F = 0.0000

Residual | 2.35722765 19 .124064613 R-squared = 0.9820

-------------+------------------------------ Adj R-squared = 0.9792

Total | 131.129999 22 5.96045452 Root MSE = .35223

------------------------------------------------------------------------------

consumo | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

renta | .4803109 .0345606 13.90 0.000 .4079747 .5526471

deuda | .3849219 .145174 2.65 0.016 .0810693 .6887745

hijos | .2306591 .0798535 2.89 0.009 .0635237 .3977944

------------------------------------------------------------------------------

Observamos que el modelo es conjuntamente valido (se rechaza hipotesis nula en el contrastede significacion conjunta), tanto el coeficiente de determinacion como el ajustado son muyaltos (se explica alrededor de un 98 % de la variabilidad del consumo) y todas las variablesindependientes son significativas (se rechaza hipotesis nula en los contrastes de significacionindividual) con signo positivo, es decir, cuando aumentan tambien lo hace el consumo.

Los valores estimados se pueden obtener con el comando predict :

. predict est

. l est

+----------+

| est |

|----------|

1. | 1.336047 |

2. | 2.383235 |

3. | 1.056684 |

4. | 2.815515 |

5. | 1.432109 |

|----------|

6. | 1.104715 |

7. | 2.42177 |

8. | 1.249481 |

9. | 1.816358 |

10. | 2.13291 |

|----------|

11. | 1.296839 |

12. | 1.63373 |

13. | 2.632213 |

14. | 1.345544 |

15. | 4.688727 |

|----------|

16. | 3.785633 |

17. | 2.401554 |

18. | 1.825855 |

19. | 1.91242 |

4

Page 95: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

20. | 4.439075 |

|----------|

21. | 2.047017 |

22. | 2.767483 |

+----------+

. su consumo est

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

consumo | 22 2.204545 1.073702 1 5.1

est | 22 2.205678 1.017523 1.056684 4.688727

. gener familia = [_n]

. graph twoway line consumo est familia

Observese que se ha calculado tambien las medias, desviaciones tıpicas, mınimo y maximodel consumo y su estimacion y (finalmente) se han representado de forma conjunta (previantese ha creado una variable correspondiente al numero de familias).

Tambien se podrıan obtener los residuos del modelo, cuestion importante a la hora deverificar que se cumplen las hipotesis basicas del modelo lineal general (como es el caso de lanormalidad):

. predict resid, residuals

. l resid

+-----------+

| resid |

|-----------|

1. | -.0360473 |

2. | .1167651 |

3. | -.0566839 |

4. | -.1155145 |

5. | .3678904 |

|-----------|

6. | -.004715 |

7. | -.4217695 |

8. | -.0494814 |

9. | -.2163582 |

10. | -.1329098 |

|-----------|

11. | .2031606 |

12. | .0662699 |

13. | .3677866 |

14. | .0544563 |

15. | -.688727 |

|-----------|

16. | .2143673 |

17. | -.4015544 |

5

Page 96: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

18. | -.3258545 |

19. | .3875796 |

20. | .6609247 |

|-----------|

21. | -.4470172 |

22. | .4325165 |

+-----------+

.

. su resid

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

resid | 22 -.0011325 .3350337 -.688727 .6609247

.

. swilk resid

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z

-------------+--------------------------------------------------

resid | 22 0.98537 0.371 -2.012 0.97790

Finalmente destacar que anadiendo vce(robust) al final del comando reg obtenemos estima-dores robustos a los problemas de heteroscedasticidad y autorrelacion, es decir, si existen dichosproblemas los corrige directamente:

. reg consumo renta deuda hijos, noconstant vce(robust)

Linear regression Number of obs = 22

F( 3, 19) = 223.71

Prob > F = 0.0000

R-squared = 0.9820

Root MSE = .35223

------------------------------------------------------------------------------

| Robust

consumo | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

renta | .4803109 .0426546 11.26 0.000 .3910338 .569588

deuda | .3849219 .119373 3.22 0.004 .1350714 .6347725

hijos | .2306591 .0735052 3.14 0.005 .0768109 .3845073

------------------------------------------------------------------------------

Por tanto, una posible lınea de comandos a ejecutar para estimar de forma optima un modelode regresion lineal serıa:

reg consumo renta deuda hijos, noconstant vce(robust)

predict resid, residuals

swilk resid

6

Page 97: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

Apendice

Realizar inferencia es tambien muy facil en Stata usando el comando ttest ya sea paracomparar la media de una variable con un numero:

. ttest consumo = 2

One-sample t test

------------------------------------------------------------------------------

Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

---------+--------------------------------------------------------------------

consumo | 22 2.204545 .228914 1.073702 1.728493 2.680598

------------------------------------------------------------------------------

mean = mean(consumo) t = 0.8935

Ho: mean = 2 degrees of freedom = 21

Ha: mean < 2 Ha: mean != 2 Ha: mean > 2

Pr(T < t) = 0.8092 Pr(|T| > |t|) = 0.3817 Pr(T > t) = 0.1908

O para comparar la media de dos variables (ya sea suponiendo varianzas iguales o distintas):

. ttest consumo = renta, unpaired

Two-sample t test with equal variances

------------------------------------------------------------------------------

Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

---------+--------------------------------------------------------------------

consumo | 22 2.204545 .228914 1.073702 1.728493 2.680598

renta | 22 3.463636 .3832841 1.797762 2.666553 4.260719

---------+--------------------------------------------------------------------

combined | 44 2.834091 .2405935 1.595917 2.348888 3.319294

---------+--------------------------------------------------------------------

diff | -1.259091 .4464396 -2.160043 -.3581393

------------------------------------------------------------------------------

diff = mean(consumo) - mean(renta) t = -2.8203

Ho: diff = 0 degrees of freedom = 42

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Pr(T < t) = 0.0036 Pr(|T| > |t|) = 0.0073 Pr(T > t) = 0.9964

. ttest consumo = renta, unpaired unequal

Two-sample t test with unequal variances

------------------------------------------------------------------------------

Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

---------+--------------------------------------------------------------------

consumo | 22 2.204545 .228914 1.073702 1.728493 2.680598

renta | 22 3.463636 .3832841 1.797762 2.666553 4.260719

---------+--------------------------------------------------------------------

7

Page 98: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

combined | 44 2.834091 .2405935 1.595917 2.348888 3.319294

---------+--------------------------------------------------------------------

diff | -1.259091 .4464396 -2.166082 -.3520993

------------------------------------------------------------------------------

diff = mean(consumo) - mean(renta) t = -2.8203

Ho: diff = 0 Satterthwaite’s degrees of freedom = 34.2904

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Pr(T < t) = 0.0040 Pr(|T| > |t|) = 0.0079 Pr(T > t) = 0.9960

Para contrastar si las varianzas son iguales se tiene la orden sdtest :

. sdtest consumo=renta

Variance ratio test

------------------------------------------------------------------------------

Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

---------+--------------------------------------------------------------------

consumo | 22 2.204545 .228914 1.073702 1.728493 2.680598

renta | 22 3.463636 .3832841 1.797762 2.666553 4.260719

---------+--------------------------------------------------------------------

combined | 44 2.834091 .2405935 1.595917 2.348888 3.319294

------------------------------------------------------------------------------

ratio = sd(consumo) / sd(renta) f = 0.3567

Ho: ratio = 1 degrees of freedom = 21, 21

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1

Pr(F < f) = 0.0111 2*Pr(F < f) = 0.0223 Pr(F > f) = 0.9889

Adviertase que para poder aplicar estas herramientas se necesitan muestras procedentes deuna normal:

. swilk consumo renta

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z

-------------+--------------------------------------------------

consumo | 22 0.87679 3.121 2.308 0.01050

renta | 22 0.84221 3.997 2.810 0.00248

. by deuda, sort: swilk consumo renta

-> deuda = 0

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z

-------------+--------------------------------------------------

consumo | 6 0.89617 1.286 0.380 0.35180

8

Page 99: T ecnicas Econom etricas - Home | Universidad de …romansg/material/WebEco/master.pdf · econometrico. Con tal objetivo se realiza un breve bosquejo hist orico de la Econometr a,

renta | 6 0.89486 1.302 0.400 0.34443

-> deuda = 1

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z

-------------+--------------------------------------------------

consumo | 16 0.86521 2.731 1.996 0.02299

renta | 16 0.81655 3.717 2.608 0.00456

9