obtener las unidades de anlisis un modelo con slo

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: la tercera el 2 %. Si en lugar del método pasos sucesivos hubiéramos utilizado el método introducir, habríamos obtenido los resultados que muestran las tablas 18.23 y 18.24. Tabla 18.23. Resumen del modelo. Modelo 1 R ,902 R cuadrado ,813 R cuadrado corregida ,811 Error típ. de la estimación $7,437.80 Tabla 18.24. Coeficientes de regresión parcial. Modelo: 1 (Constante) Código de empleado Fecha de nacimiento Nivel educativo Salario inicial Experiencia previa Clasificación étnica Coeficientes no estandarizados B Error típ. -38768,134 18686,944 -12,426 2,526 3,275E-06 ,000 630,255 166,453 1,760 ,059 -7,703 5,596 -994,637 846,844 Coeficientes estandarizados Beta -,099 ,071 ,106 ,811 -,047 -,024 t -2,075 -4,920 2,091 3,786 29,826 -1,376 -1,175 Sig. ,039 ,000 ,037 ,000 ,000 ,169 ,241 Por un lado, la ganancia que obtenemos en R 2 utilizando las 5 variables en lugar de las tres seleccionadas con el método por pasos es extremadamente pequeña (0,813n0,802 = 0,011). No parece que tenga mucho sentido añadir dos variables para obtener una mejora de once milésimas en la proporción de varianza explicada. Es cierto que R 2 nunca disminuye cuando se van incorporando nuevas variables al modelo de regresión, sino que aumenta o se queda como está. Sin embargo, esto no significa, necesariamente, que la ecuación con más variables se ajuste mejor a los datos poblacionales. Generalmente, conforme va aumentando la calidad del modelo, va disminuyendo el error típico de los residuos (Error típ. de la estimación). Pero el incre- Capítulo 18. Análisis de regresión lineal 62 mento que se va produciendo en R 2 al ir añadiendo variables no se corresponde necesariamente con una disminución del error típico de los residuos. Con cada variable nueva que se incorpora al modelo, la suma de cuadrados de la regresión gana un grado de libertad y la suma de cuadrados de los residuos lo pierde. Por tanto, el error típico de los residuos puede aumentar cuando el descenso de la variación residual es demasiado pequeño para compensar la pérdida de un grado de libertad en la suma de cuadrados de los residuos. Estas consideraciones sugieren la conveniencia de utilizar modelos parsimoniosos, es decir, modelos con un número reducido de variables independientes. Por otro lado, las variables que tienen pesos significativos en la ecuación de regresión obtenida con el método pasos sucesivos no son las mismas que las que tienen pesos significativos en la ecuación obtenida con el método introducir. Esta diferencia entre métodos de selección de variables debe ser tenida muy en cuenta. ¿Cuáles son las variables buenas? Atendiendo a criterios puramente estadísticos, la ecuación de regresión con las tres variables seleccionadas por el método pasos sucesivos, es la mejor de las posibles con el mínimo número de variables. Pero en la práctica, la decisión sobre cuántas variables debe incluir la ecuación de regresión puede tomarse teniendo en cuenta, adem...
View Full Document

This document was uploaded on 03/30/2014 for the course COM 01 at University of Sevilla.

Ask a homework question - tutors are online