No obstante es muy aconsejable examinarlos por su

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ión). G DfBetas tipificadas. Es el cociente entre Dfbetas (párrafo anterior) y su error típico. Generalmente, un valor mayor que delata la presencia de un posible punto de influencia. El SPSS crea en el Editor de datos tantas variables nuevas como coeficientes beta tiene la ecuación de regresión. G Df Ajuste (diferencia en el ajuste). Mide el cambio que se produce en el pronóstico de un caso cuando ese caso es eliminado de la ecuación de regresión. G Df Ajuste tipificado. Es el cociente entre DfAjuste (párrafo anterior) y su error típico. En general, se consideran puntos de influencia los casos en los que DfAjuste tipificado es mayor que , siendo p el número de variables independientes y n el tamaño de la muestra. Capítulo 18. Análisis de regresión lineal 48 G Razón entre las covarianzas (RV). Indica en qué medida la matriz de productos cruzados (base del análisis de regresión) cambia con la eliminación de cada caso. Se considera que un caso es un punto de influencia si el valor absoluto de RVn1 es mayor que 3+p/n. Además de crear las variables correspondientes a cada una de estas opciones, el SPSS ofrece una tabla resumen (ver tabla 18.17) que incluye, para todos los estadísticos del recuadro Distancias (ver figura 18.12), el valor mínimo, el máximo, la media, la desviación típica y el número de casos. La tabla también recoge información sobre los pronósticos y los residuos. Tabla 18.17. Estadísticos sobre los residuos. Valor pronosticado Valor pronosticado tip. Error típico del valor pronosticado Valor pronosticado corregido Residual Residuo tip. Residuo estud. Residuo eliminado Residuo eliminado estud. Dist. de Mahalanobis Distancia de Cook Valor de influencia centrada Mínimo $12,382.90 -1,442 $375.76 $12,275.05 -$28,852.99 -3,781 -3,898 -$30,675.46 -3,959 ,149 ,000 ,000 Máximo $146,851.63 7,355 $3,186.70 $149,354.23 $48,701.20 6,381 6,401 $48,999.29 6,692 81,468 ,240 ,172 Media $34,419.57 ,000 $645.15 $34,425.49 $.00 ,000 ,000 -$5.92 ,002 2,994 ,003 ,006 Desviación típ. $15,287.30 1,000 $274.71 $15,356.14 $7,607.68 ,997 1,003 $7,704.67 1,015 5,172 ,015 ,011 N 474 474 474 474 474 474 474 474 474 474 474 474 Conviene señalar que los puntos de influencia no tienen por qué tener residuos particularmente grandes, por lo que el problema que plantean no es precisamente de falta de ajuste. No obstante, es muy aconsejable examinarlos por su desproporcionada influencia sobre la ecuación de regresión. Puesto que estos puntos son distintos de los de demás, conviene precisar en qué son distintos. Una vez identificados y examinados, podríamos eliminarlos del análisis simplemente porque entorpecen el ajuste, o porque su presencia nos está haciendo obtener medidas de ajuste infladas. También podríamos eliminar los casos muy atípicos simplemente argumentando que nuestro objetivo es construir una ecuación para entender lo que ocurre con los casos típicos, corrientes, no con los casos atípicos. Este argumento es más convincente si los casos atípicos Capítulo...
View Full Document

This document was uploaded on 03/30/2014 for the course COM 01 at University of Sevilla.

Ask a homework question - tutors are online