As pues aunque siempre resulta posible cualquiera que

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: n el diagrama de la figura 18.3, en el que la recta consigue un ajuste bastante más pobre que en el caso de la figura 18.2. Ahora hemos representado el porcentaje de alcohol de las cervezas (eje horizontal) y el precio de las mismas (eje vertical). Y no parece existir la misma pauta de asociación detectada entre las variables de la situación anterior. Así pues, aunque siempre resulta posible, cualquiera que sea la nube de puntos, obtener la recta mínimo-cuadrática, necesitamos información adicional para determinar el grado de fidelidad con que esa recta describe la pauta de relación existente en los datos. Figura 18.3. Diagrama de dispersión, recta de regresión y ajuste (% de alcohol por precio). ¿Cómo podemos cuantificar ese mejor o peor ajuste de la recta? Hay muchas formas de resumir el grado en el que una recta se ajusta a una nube de puntos. Podríamos utilizar la media de los residuos, o la media de los residuos en valor absoluto, o las medianas de alguna de esas medidas, o alguna función ponderada de esas medidas, etc. Una medida de ajuste que ha recibido gran aceptación en el contexto del análisis de regresión es el coeficiente de determinación R 2: el cuadrado del coeficiente de correlación Capítulo 18. Análisis de regresión lineal 7 múltiple. Se trata de una medida estandarizada que toma valores entre 0 y 1 (0 cuando las variables son independientes y 1 cuando entre ellas existe relación perfecta). Este coeficiente posee una interpretación muy intuitiva: representa el grado de ganancia que podemos obtener al predecir una variable basándonos en el conocimiento que tenemos de otra u otras variables. Si queremos, por ejemplo, pronosticar el número de calorías de una cerveza sin el conocimiento de otras variables, utilizaríamos la media del número de calorías. Pero si tenemos información sobre otra variable y del grado de relación entre ambas, es posible mejorar nuestro pronóstico. El valor R 2 del diagrama de la figura 18.2 vale 0,83, lo que indica que si conocemos el porcentaje de alcohol de una cerveza, podemos mejorar en un 83 % nuestros pronósticos sobre su número de calorías si, en lugar de utilizar como pronóstico el número medio de calorías, basamos nuestro pronóstico en el porcentaje de alcohol. Comparando este resultado con el correspondiente al diagrama de la figura 18.3 (donde R 2 vale 0,06) comprenderemos el valor informativo de R 2: en este segundo caso, el conocimiento del contenido de alcohol de una cerveza sólo nos permite mejorar nuestros pronósticos del precio en un 6 %, lo cual nos está indicando, además de que nuestros pronósticos no mejoran de forma importante, que existe un mal ajuste de la recta a la nube de puntos. Parece evidente, sin tener todavía otro tipo de información, que el porcentaje de alcohol de las cervezas está mas relacionado con el número de calorías que con su precio. Capítulo 18. Análisis de regresión lineal 8 Resumen En este primer apartado introductorio hemos aprendido que el análisis de regresión lineal es una técnica estadística que permite estudiar...
View Full Document

This document was uploaded on 03/30/2014 for the course COM 01 at University of Sevilla.

Ask a homework question - tutors are online