03-Exploracion - Universidad Nacional Agraria La Molina...

Info iconThis preview shows pages 1–8. Sign up to view the full content.

View Full Document Right Arrow Icon
Introducción a la Minería de Datos La Fase de Exploración Enver G. Tarazona [email protected] Universidad Nacional Agraria La Molina Dpto. de Estadística e Informática
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
2 La Fase de Exploración Etapas: Análisis exploratorio y gráfico de los datos. Comprobación de los supuestos subyacentes en los métodos multivariantes para la minería de datos Normalidad Linealidad Homocedasticidad Multicolinealidad. Correlacion entre las variables
Background image of page 2
3 Análisis Exploratorio Permite analizar la información exhaustivamente y detectar las posibles anomalías. Exploración visual : uso de gráficos para visualizar la estructura de los datos. Exploración formal: Uso de estadísticos robustos (resistentes) Mediana Cuantiles
Background image of page 3

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
4 Herramientas de Exploración Visual Histograma de Frecuencias Diagrama de tallo y hojas Gráfico de cajas y bigotes (Boxplots) Gráfico múltiple de cajas y bigotes Gráfico de simetría Gráfico de dispersión Gráficos para variables cualitativas Gráfica de barras o rectángulos Diagrama de sectores Pictogramas
Background image of page 4
5 Medidas de Tendencia Central Media (medida algebr aica) (muestra vs. población) : Media aritmética ponderada Trimedia: Eliminando valores extremos Mediana : Una medida holística Valor central, cuando existe un número impar de observaciones, o el promedio de los dos valores centrales en los otros casos. Estimada por interpolación (para datos agrupados): Moda Valor que ocurre más frecuentemente en los datos Unimodal, bimodal, trimodal Fórmula empírica: = = n i i x n x 1 1 = = = n i i n i i i w x w x 1 1 mod 3 ( ) media a media mediana - = - N x = μ
Background image of page 5

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
6 Simetría vs. Asimetría Mediana, media y moda de distribuciones simétricas y asimétricas positivas y negativas.
Background image of page 6
7 Medidas de Dispersión Cuantiles, outliers y boxplots Cuartiles : Q 1 (percentil 25), Q 3 (percentil 75) Rango intercuartílico : IQR = Q 3 Q 1 Cinco números de resumen
Background image of page 7

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 8
This is the end of the preview. Sign up to access the rest of the document.

This note was uploaded on 05/12/2010 for the course APPLIED ST 2010 taught by Professor Various during the Spring '10 term at Universidad Nacional Agraria La Molina.

Page1 / 25

03-Exploracion - Universidad Nacional Agraria La Molina...

This preview shows document pages 1 - 8. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online