pagina161 - Artculo de Educacin rboles de Clasificacin y...

Info iconThis preview shows pages 1–2. Sign up to view the full content.

View Full Document Right Arrow Icon
Árboles de Clasificación y Regresión: Modelos Cart CLASSIFICATION AND REGRESSION TREES: CART MODELS INTRODUCCIÓN Desde hace muchos años los investigadores en numerosas áreas han buscado describir relaciones estructurales más complejas que las que se pueden describir usando modelos de regresión lineal múltiple. En muchas áreas de aplicación de la Estadística los individuos (unidades de observación) están caracterizados por información sobre múltiples características cuantitativas y/o cualitativas: formalmente representamos cada uno de esos indi- viduos como un VECTOR de dimensión p; por otra parte tenemos una RESPUESTA (resultado, output) individual, en algunos casos cuantitativa, en otros cualitativa. Suele ocurrir que los valores más interesantes de esa respuesta se observan en individuos, en algún sentido, peculiares; identificar los perfiles o vectores que describen a esos individuos es de interés central pero la búsqueda para hallarlos no es simplemente lineal sino más bien es compa- rable a una trayectoria de divisiones sucesivas: una estructura arbórea. Los modelos subyacentes no son tan simples como un modelo de regresión lineal múltiple, pero tienen una ventaja que podríamos llamar plasticidad o flexibilidad, que posibilita identi- ficar con relativa facilidad las combinaciones, nichos ecológicos o perfiles de predictores asociados a valores particulares de la respuesta de interés. Obviamente estas ideas no son novedosas, han sido sistemati- zadas por diversos autores y las propuestas metodológicas se han ido multiplicando y perfeccionando de la mano del desarrollo computacional. Sin pretender un listado exhaustivo, debemos mencionar el método Computer Automatic Interaction Detection (CAID) de Somers y Morgan (1960), ampliado a Chi Square Automatic Interaction Detection (CHAID) de Kass (Kass 1980). En las últimas dos décadas, los trabajos de Friedman, Breiman y colegas han fructificado en métodos multivariantes similares a los mencionados, con uso óptimo del recurso computacional actual; de ellos comentaremos: en este artículo Classification And Regression Trees (CART) (Breiman et al. 1984) y en un futuro cercano Multivariate Adaptive Regression Splines (MARS) (Friedman 1991). Correspondencia / Correspondence Claudio Silva Z. Escuela de Salud Pública, Facultad de Medicina, Universidad de Chile Tel: (56 2) 9786539 • Fax: (56 2) 7774163 e-mail: [email protected] Recibido: 12 de noviembre de 2008 / Aceptado: 01 de diciembre de 2008. Ciencia Trabajo | AÑO 10 | NÚMERO 30 | OCTUBRE / DICIEMBRE 2008 | www.cienciaytrabajo.cl | 161/166 161 Irene Schiattino Lemus 1 , Claudio Silva Zamora 2 1. M.Sc. en Bioestadística, Escuela de Salud Pública, Facultad de Medicina, Universidad de Chile. 2. Ph.D. en Bioestadística, Escuela de Salud Pública, Facultad de Medicina, Universidad de Chile.
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 2
This is the end of the preview. Sign up to access the rest of the document.

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Page1 / 6

pagina161 - Artculo de Educacin rboles de Clasificacin y...

This preview shows document pages 1 - 2. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online