La frmula de la recta aparece a la derecha del

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: % de alcohol por nº de calorías). 200 180 nº calorías (por tercio de litro) 160 Yi = n33,77 + 37,65 Xi 140 120 100 80 60 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 Porcentaje de alcohol Vemos que, en general, la recta hace un seguimiento bastante bueno de los datos. La fórmula de la recta aparece a la derecha del diagrama. La pendiente de la recta (B1) indica que, en promedio, a cada incremento de una unidad en el porcentaje de alcohol (Xi) le corresponde un incremento de 37,65 calorías (Yi). El origen de la recta (B0) sugiere que una cerveza sin alcohol (grado de alcohol cero) podría contener –33,77 calorías. Y esto, obviamente, no parece posible. Al examinar la nube de puntos vemos que la muestra no contiene cervezas con menos de un 2 % de alcohol. Así, aunque el origen de la recta aporta información sobre lo que podría ocurrir si extrapolamos hacia abajo la pauta observada en los datos hasta llegar a una cerveza con grado de alcohol cero, al hacer esto estaríamos efectuando pronósticos en un rango de valores que va más allá de lo que abarcan los datos disponibles, y eso es algo extremadamente arriesgado en el contexto del análisis de regresión*. * Debemos aprender una lección de esto: la primera cosa razonable que podríamos hacer es añadir en nuestro estudio alguna cerveza con porcentaje de alcohol cero; probablemente así obtendríamos una recta con un origen más realista. Capítulo 18. Análisis de regresión lineal 5 La mejor recta de regresión En una situación ideal (e irreal) en la que todos los puntos de un diagrama de dispersión se encontraran en una línea recta, no tendríamos que preocuparnos de encontrar la recta que mejor resume los puntos del diagrama. Simplemente uniendo los puntos entre sí obtendríamos la recta con mejor ajuste a la nube de puntos. Pero en una nube de puntos más realista (como la de las figuras 18.1 y 18.2) es posible trazar muchas rectas diferentes. Obviamente, no todas ellas se ajustarán igualmente bien a la nube de puntos. Se trata de encontrar la recta capaz de convertirse en el mejor representante del conjunto total de puntos. Existen diferentes procedimientos para ajustar una función simple, cada uno de los cuales intenta minimizar una medida diferente del grado de ajuste. La elección preferida ha sido, tradicionalmente, la recta que hace mínima la suma de los cuadrados de las distancias verticales entre cada punto y la recta. Esto significa que, de todas las rectas posibles, existe una y sólo una que consigue que las distancias verticales entre cada punto y la recta sean mínimas (las distancias se elevan al cuadrado porque, de lo contrario, al ser unas positivas y otras negativas, se anularían unas con otras al sumarlas). Capítulo 18. Análisis de regresión lineal 6 Bondad de ajuste Además de acompañar la recta con su fórmula, podría resultar útil disponer de alguna indicación precisa del grado en el que la recta se ajusta a la nube de puntos. De hecho, la mejor recta posible no tiene por qué ser buena. Imaginemos una situación como la presentada e...
View Full Document

This document was uploaded on 03/30/2014 for the course COM 01 at University of Sevilla.

Ask a homework question - tutors are online