0046352d564af2f09f000000.pdf - Anu00e1lisis de componentes...

This preview shows page 1 - 3 out of 11 pages.

Análisis de componentes principales aplicado a la representación de datos multidimensionales Ricard Boqué y Joan Ferré Grupo de Quimiometría y Cualimetría Universitat Rovira i Virgili Pl. Imperial Tàrraco, 1 43005-Tarragona Técnicas de representación en Química. ¿Por qué surgen? Las personas tenemos una gran capacidad para reconocer modelos. Baste como ejemplo la inspección de las caras de la Figura 1. Figura 1 . Las personas tenemos gran capacidad para reconocer modelos. De un solo vistazo hemos reconocido que se trata de chicos y chicas jóvenes de distintas partes del mundo. Si alguien nos pidiera que los ordenásemos en base a características comunes, seguramente el resultado, con pequeñas variaciones puesto que el orden de depende de la subjetividad de cada lector, sería parecido a lo que muestra la Figura 2: chicas a un lado y chicos al otro, y jóvenes de piel oscura arriba y de piel clara abajo. Aparte de estos grupos claramente diferenciados, se observan también tendencia s, como es una gradación en el color de la piel, y jóvenes ligeramente discrepantes del resto. Sería el caso del chico con barba o de la chica con rasgos orientales. 1
Figura 2 . Agrupación por tendencias de los modelos de la Figura 1. La separación en función del sexo y de la raza la hemos hecho fácilmente. ¿En qué nos hemos fijado para hacer este análisis visual de forma tan rápida? Sin duda en cientos de variables al mismo tiempo: forma y color del pelo, tamaño y color de los ojos, forma y tamaño de la nariz, mentón, barbilla, labios, orejas, cejas, pestañas y un largo etcétera. Pero cada rasgo por sí solo (por ejemplo, el color de los ojos o del pelo) no es suficiente para identificar a una persona por su sexo y raza. Es cierta combinación de estas variables directamente observables (ojos rasgados, orejas pequeñas,...) lo que permite diferenciar a las personas. Por ello, sexo y raza son lo que denominamos variables latentes , es decir, variables no observables directamente pero deducibles a partir de una combinación de variables observadas. Y nuestra capacidad para reconocer imágenes ha encontrado esta combinación sin demasiado esfuerzo. Si pudiésemos asignar valores numéricos a cada rasgo 1 , en lugar de un conjunto de imágenes tendríamos una tabla ( matriz ) de datos como la mostrada en la Figura 3. Cada fila corresponde a una persona (una muestra o un objeto en lenguaje quimiométrico) y cada columna corresponde a una variable observada. Vemos que si nos presentan la tabla de números tenemos mucha más dificultad para reconocer pautas (o modelos), es decir, semejanzas o diferencias. Por eso, siempre que podemos, intentamos utilizar gráficos. Pero sólo podemos representar al mismo tiempo dos variables (o tres intentando dar perspectiva). Entonces, ¿cómo podemos visualizar muestras cuando están caracterizadas por más de tres variables?

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture