TEMA(4)

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ara detectar la presencia de puntos de influencia. Para obtenerlas: | Pulsar el botón Guardar... del cuadro de diálogo Regresión lineal (ver figura 18.4) para acceder al subcuadro de diálogo Regresión lineal: Guardar variables que muestra la figura 18.12. | Marcar todas las opciones de los recuadros Distancias y Estadísticos de influencia (todas estas opciones crean variables nuevas en el archivo de datos). Capítulo 18. Análisis de regresión lineal 46 Figura 18.12. Subcuadro de diálogo Regresión lineal: Guardar nuevas variables. Distancias. Este recuadro recoge tres medidas que expresan el grado en que cada caso se aleja de los demás: G Mahalanobis. La distancia de Mahalanobis mide el grado de distanciamiento de cada caso respecto de los promedios del conjunto de variables independientes. En regresión simple, esta distancia se obtiene simplemente elevando al cuadrado la puntuación típica de cada caso en la variable independiente. En regresión múltiple se obtiene multiplicando por nn1 el valor de influencia de cada caso (ver más abajo). G Cook. La distancia de Cook (1977) mide el cambio que se produce en las estimaciones de los coeficientes de regresión al ir eliminando cada caso de la ecuación de regresión. Una distancia de Cook grande indica que ese caso tiene un peso considerable en la estimación de los coeficientes de regresión. Para evaluar estas distancias puede utilizarse la distribución F con p+1 y nnpn1 grados de libertad (p se refiere al número de varia- Capítulo 18. Análisis de regresión lineal 47 bles independientes y n al tamaño de la muestra). En general, un caso con una distancia de Cook superior a 1 debe ser revisado. G Valores de influencia. Representan una medida de la influencia potencial de cada caso. Referido a las variables independientes, un valor de influencia es una medida normalizada del grado de distanciamiento de un punto respecto del centro de su distribución. Los puntos muy alejados pueden influir de forma muy importante en la ecuación de regresión, pero no necesariamente tienen por qué hacerlo. Con más de 6 variables y al menos 20 casos, se considera que un valor de influencia debe ser revisado si es mayor que 3p/n, siendo p el número de variables y n el tamaño de la muestra. Los valores de influencia tienen un máximo de (nn1)/n. Como regla general para orientar nuestras decisiones, los valores menores que 0,2 se consideran poco problemáticos; los valores comprendidos entre 0,2 y 0,5 se consideran arriesgados; y los valores mayores que 0,5 deberían evitarse. Estadísticos de influencia. Este recuadro contiene varios estadísticos que contribuyen a precisar la posible presencia de puntos de influencia: G DfBetas (diferencia en las betas). Mide el cambio que se produce en los coeficientes de regresión estandarizados (betas) como consecuencia de ir eliminando cada caso de la ecuación de regresión. El SPSS crea en el Editor de datos tantas variables nuevas como coeficientes beta tiene la ecuación de regresión (es decir, tantos como variables independientes más uno, el correspondiente a la constante de la ecuac...
View Full Document

This document was uploaded on 03/30/2014 for the course COM 01 at University of Sevilla.

Ask a homework question - tutors are online