Estad\u00edstica Aplicada B\u00e1sica - David S. Moore - 2da Edici\u00f3n.pdf - www.elsolucionario.org www.elsolucionario.org www.elsolucionario.org

Estadística Aplicada Básica - David S. Moore - 2da Edición.pdf

This preview shows page 1 out of 880 pages.

You've reached the end of your free preview.

Want to read all 880 pages?

Unformatted text preview: Í NDICE DE CONTENIDO Prólogo Razonamiento estadístico XVII XXVII PARTE I: C OMPRENSIÓN DE LOS DATOS 1 1 Análisis de distribuciones 1.1 Introducción 1.2 Gráficos de distribuciones 1.2.1 Variables categóricas: diagramas de barras y diagramas de sectores 1.2.2 Variables cuantitativas: histogramas 1.2.3 Interpretación de los histogramas 1.2.4 Variables cuantitativas: diagramas de tallos 1.2.5 Gráficos temporales Resumen de la sección 1.2 Ejercicios de la sección 1.2 1.3 Descripción de las distribuciones con números 1.3.1 Una medida de centro: la media 1.3.2 Una medida de centro: la mediana 1.3.3 Comparación entre la media y la mediana 1.3.4 Una medida de dispersión: los cuartiles 1.3.5 Los cinco números resumen y los diagramas de caja 1.3.6 Una medida de dispersión: la desviación típica 1.3.7 Elección de medidas de centro y de dispersión 3 4 6 7 9 13 17 21 23 24 32 33 34 36 38 40 44 47 VIII / E STADÍSTICA APLICADA BÁSICA Resumen de la sección 1.3 Ejercicios de la sección 1.3 1.4 Distribuciones normales 1.4.1 Curvas de densidad 1.4.2 Mediana y media de una curva de densidad 1.4.3 Distribuciones normales 1.4.4 Regla del 68-95-99,7 1.4.5 Distribución normal estandarizada 1.4.6 Cálculos con distribuciones normales 1.4.7 Cómo hallar un valor dada una proporción Resumen de la sección 1.4 Ejercicios de la sección 1.4 Repaso del capítulo 1 Ejercicios de repaso del capítulo 1 2 Análisis de relaciones 2.1 Introducción 2.2 Diagramas de dispersión 2.2.1 Interpretación de los diagramas de dispersión 2.2.2 Inclusión de variables categóricas en los diagramas de dispersión Resumen de la sección 2.2 Ejercicios de la sección 2.2 2.3 Correlación 2.3.1 Correlación r 2.3.2 Características de la correlación Resumen de la sección 2.3 Ejercicios de la sección 2.3 2.4 Regresión mínimo-cuadrática 2.4.1 Recta de regresión mínimo-cuadrática 2.4.2 Características de la regresión mínimo-cuadrática 2.4.3 Residuos 2.4.4 Observaciones influyentes Resumen de la sección 2.4 Ejercicios de la sección 2.4 2.5 Precauciones con la correlación y la regresión 2.5.1 Extrapolación 49 50 54 55 59 61 64 67 69 75 78 79 82 85 97 98 101 105 109 112 113 120 122 123 127 128 132 133 139 144 148 153 154 162 162 Índice de contenido / IX 2.5.2 Utilización de medias 2.5.3 Variables latentes 2.5.4 Asociación no implica causalidad Resumen de la sección 2.5 Ejercicios de la sección 2.5 2.6 Relaciones entre variables categóricas 2.6.1 Distribuciones marginales 2.6.2 Descripción de relaciones 2.6.3 Distribuciones condicionales 2.6.4 Paradoja de Simpson Resumen de la sección 2.6 Ejercicios de la sección 2.6 Repaso del capítulo 2 Ejercicios de repaso del capítulo 2 3 Obtención de datos 3.1 Introducción 3.2 Diseño de muestras 3.2.1 Muestra aleatoria simple 3.2.2 Otros diseños muestrales 3.2.3 Muestreo en etapas múltiples 3.2.4 Precauciones con las encuestas 3.2.5 Inferencia sobre la población Resumen de la sección 3.2 Ejercicios de la sección 3.2 3.3 Diseño de experimentos 3.3.1 Experimentos comparativos 3.3.2 Experimentos completamente aleatorizados 3.3.3 Experimentos completamente aleatorizados 3.3.4 Lógica de los diseños comparativos aleatorizados 3.3.5 Precauciones con los experimentos 3.3.6 Diseños por pares 3.3.7 Diseño en bloques Resumen de la sección 3.3 Ejercicios de la sección 3.3 Repaso del capítulo 3 Ejercicios de repaso del capítulo 3 163 164 166 170 171 173 174 177 179 183 186 187 192 195 205 206 209 212 217 219 221 226 227 228 233 237 238 240 243 246 248 249 253 254 258 260 X / E STADÍSTICA APLICADA BÁSICA PARTE II: C OMPRENSIÓN DE LA INFERENCIA 267 4 Distribuciones muestrales y probabilidad 4.1 Introducción 4.2 Aleatoriedad 4.2.1 Concepto de probabilidad 4.2.2 Pensando en la aleatoriedad Resumen de la sección 4.2 Ejercicios de la sección 4.2 4.3 Modelos de probabilidad 4.3.1 Reglas de la probabilidad 4.3.2 Asignación de probabilidades: número finito de resultados 4.3.3 Asignación de probabilidades: intervalos de resultados 4.3.4 Distribuciones normales de probabilidad Resumen de la sección 4.3 Ejercicios de la sección 4.3 4.4 Distribución de la media muestral 4.4.1 La estimación estadística y la ley de los grandes números 4.4.2 Distribuciones muestrales 4.4.3 Media y desviación típica de x¯ 4.4.4 Teorema del límite central Resumen de la sección 4.4 Ejercicios de la sección 4.4 4.5 Gráficos de control 4.5.1 Gráficos de medias 4.5.2 Control estadístico de procesos 4.5.3 Utilización de gráficos de control 4.5.4 El mundo real: gráficos de medias y desviaciones Resumen de la sección 4.5 Ejercicios de la sección 4.5 Repaso del capítulo 4 Ejercicios de repaso del capítulo 4 269 270 270 272 275 276 276 278 281 285 288 291 293 294 298 298 302 305 308 313 314 317 318 322 323 325 331 331 333 336 5 Teoría de probabilidad 5.1 Introducción 5.2 Reglas generales de la probabilidad 5.2.1 La independencia y la regla de la multiplicación 343 344 344 344 Índice de contenido / XI 5.2.2 Aplicación de la regla de la multiplicación 5.2.3 Regla general de la suma Resumen de la sección 5.2 Ejercicios de la sección 5.2 5.3 Distribuciones binomiales 5.3.1 Situación binomial 5.3.2 Probabilidades binomiales 5.3.3 Media y desviación típica binomiales 5.3.4 Aproximación normal a distribuciones binomiales Resumen de la sección 5.3 Ejercicios de la sección 5.3 5.4 Probabilidad condicional 5.4.1 Generalización de la regla de la multiplicación 5.4.2 Probabilidad condicional y independencia Resumen de la sección 5.4 Ejercicios de la sección 5.4 Repaso del capítulo 5 Ejercicios de repaso del capítulo 5 349 352 355 356 359 359 362 366 368 372 373 376 380 381 383 384 387 388 6 Introducción a la inferencia estadística 6.1 Introducción 6.2 Estimación con confianza 6.2.1 Confianza estadística 6.2.2 Intervalos de confianza para la media µ 6.2.3 Comportamiento de los intervalos de confianza 6.2.4 Elección del tamaño de la muestra 6.2.5 Algunas precauciones Resumen de la sección 6.2 Ejercicios de la sección 6.2 6.3 Pruebas de significación 6.3.1 Razonamientos de las pruebas de significación 6.3.2 Terminología de las pruebas de significación 6.3.3 Más detalles: planteamiento de las hipótesis 6.3.4 Más detalles: valores P y significación estadística 6.3.5 Pruebas de significación para una media poblacional 6.3.6 Pruebas con un nivel de significación predeterminado 6.3.7 Pruebas derivadas de los intervalos de confianza 393 394 395 397 402 408 410 412 416 417 421 422 423 428 431 434 442 447 XII / E STADÍSTICA APLICADA BÁSICA 7 Resumen de la sección 6.3 Ejercicios de la sección 6.3 6.4 Utilización de las pruebas de significación 6.4.1 ¿Cuál tiene que ser el valor P? 6.4.2 Significación estadística y significación práctica 6.4.3 La inferencia estadística no es válida para cualquier conjunto de datos 6.4.4 Cuidado con los análisis múltiples Resumen de la sección 6.4 Ejercicios de la sección 6.4 6.5 Tipos de error y potencia 6.5.1 Errores tipo I y errores tipo II 6.5.2 Probabilidades de error 6.5.3 Potencia Resumen de la sección 6.5 Ejercicios de la sección 6.5 Repaso del capítulo 6 Ejercicios de repaso del capítulo 6 449 449 454 454 456 Inferencia para medias y desviaciones típicas 7.1 Introducción 7.2 Inferencia para la media de una población 7.2.1 Distribuciones t 7.2.2 Intervalos y pruebas t 7.2.3 Utilización de procedimientos t de una muestra 7.2.4 Procedimientos t para diseños por pares 7.2.5 Robustez de los procedimientos t Resumen de la sección 7.2 Ejercicios de la sección 7.2 7.3 Comparación de dos medias 7.3.1 Problemas de dos muestras 7.3.2 Comparación de dos medias poblacionales 7.3.3 Procedimientos t de dos muestras 7.3.4 Ejemplos de procedimientos t de dos muestras 7.3.5 Otra vez la robustez 7.3.6 Procedimientos t de dos muestras más precisos 7.3.7 Procedimientos t de dos muestras con varianza comn 481 482 482 483 486 490 493 499 505 506 513 513 515 518 522 528 530 534 457 459 461 461 462 463 464 469 472 472 475 477 Índice de contenido / XIII Resumen de la sección 7.3 Ejercicios de la sección 7.3 7.4 Inferencia para la dispersión poblacional 7.4.1 Evita la inferencia sobre desviaciones típicas 7.4.2 Prueba F para comparar dos desviaciones típicas Resumen de la sección 7.4 Ejercicios de la sección 7.4 Repaso del capítulo 7 Ejercicios de repaso del capítulo 7 535 536 543 544 545 548 549 550 552 8 Inferencia para proporciones 8.1 Introducción 8.2 Inferencia para una proporción poblacional 8.2.1 Distribución de pˆ 8.2.2 Supuestos para la inferencia 8.2.3 Procedimientos z 8.2.4 Elección del tamaño de la muestra Resumen de la sección 8.2 Ejercicios de la sección 8.2 8.3 Comparación de dos proporciones 8.3.1 Distribución de pˆ 1 − pˆ 2 8.3.2 Intervalos de confianza para p1 − p2 8.3.3 Pruebas de significación para p1 − p2 Resumen de la sección 8.3 Ejercicios de la sección 8.3 Repaso del capítulo 8 Ejercicios de repaso del capítulo 8 563 564 566 566 570 574 579 582 583 586 588 589 593 598 599 605 607 PARTE III: T EMAS RELACIONADOS CON LA INFERENCIA 611 9 Inferencia para tablas de contingencia 9.1 Introducción 9.1.1 El problema de las comparaciones múltiples 9.2 Tablas de contingencia 9.2.1 Recuentos esperados 613 614 615 616 617 XIV / E STADÍSTICA APLICADA BÁSICA 9.3 Prueba Ji cuadrado 9.3.1 Distribuciones Ji cuadrado 9.3.2 Más aplicaciones de la prueba Ji cuadrado 9.3.3 Recuentos exigidos en las celdas para la prueba Ji cuadrado 9.3.4 Prueba Ji cuadrado y prueba z Resumen de la sección 9.3 Repaso del capítulo 9 Ejercicios de repaso del capítulo 9 621 625 628 633 634 637 638 639 10 Análisis de la varianza de un factor: comparación de varias medias 10.1 Introducción 10.1.1 El problema de las comparaciones múltiples 10.2 Prueba F del análisis de la varianza 10.2.1 La idea del análisis de la varianza 10.2.2 Supuestos del ANOVA 10.3 Algunos detalles sobre el ANOVA* Resumen Repaso del capítulo 10 Ejercicios de repaso del capítulo 10 651 652 654 655 660 666 673 679 679 680 11 Inferencia para regresión 11.1 Introducción 11.1.1 Modelo de la regresión 11.2 Inferencia para el modelo 11.2.1 Intervalos de confianza para la pendiente de la regresión 11.2.2 Contraste de hipótesis para una relación no lineal 11.3 Inferencia para la predicción 11.4 Comprobación de los supuestos de la regresión Resumen Repaso del capítulo 11 Ejercicios de repaso del capítulo 11 687 688 690 692 696 700 705 709 715 715 717 12 Pruebas no paramétricas 12.1 Introducción 12.2 Prueba de Wilcoxon de suma de rangos 12.2.1 Rangos 727 728 730 731 Índice de contenido / XV 12.2.2 Prueba de Wilcoxon de suma de rangos 12.2.3 Aproximación normal 12.2.4 ¿Qué hipótesis plantea la prueba de Wilcoxon? 12.2.5 Empates 12.2.6 Limitaciones de las pruebas no paramétricas Resumen de la sección 12.2 Ejercicios de la sección 12.2 12.3 Prueba de Wilcoxon de suma de rangos de diferencias 12.3.1 Aproximación normal 12.3.2 Empates Resumen de la sección 12.3 Ejercicios de la sección 12.3 12.4 Prueba de Kruskal-Wallis 12.4.1 Supuestos e hipótesis 12.4.2 Prueba de Kruskal-Wallis Resumen de la sección 12.4 Ejercicios de la sección 12.4 Repaso del capítulo 12 Ejercicios de repaso del capítulo 12 733 737 740 741 746 747 747 752 757 759 762 762 766 767 768 771 772 775 777 Repaso del pensamiento estadístico 781 Apéndice Tabla A: Probabilidades normales estandarizadas Tabla B: Dígitos aleatorios Tabla C: Valores críticos de la distribución t Tabla D: Valores críticos de la distribución F Tabla E: Valores críticos de la distribución Ji cuadrado 785 786 788 789 790 794 Soluciones de ejercicios seleccionados Índice analítico 795 831 P RÓLOGO Estadística aplicada básica (versión en castellano de The Basic Practice of Statistics) es una introducción a la estadística para estudiantes universitarios que enfatiza el trabajo con datos y las ideas estadísticas. En este prólogo describo el contenido del libro con el objeto de ayudar a los profesores a juzgar si este libro es adecuado para sus alumnos. Principios básicos Hasta ahora, los cursos de introducción a la estadística se centraban en la probabilidad y en la inferencia. Estadística aplicada básica refleja una nueva corriente en la enseñanza de la estadística en la que el análisis de datos y el diseño de métodos para su obtención constituyen, junto con los métodos de inferencia basados en la probabilidad, los temas principales. Los estadísticos han llegado a un amplio consenso sobre los contenidos de cursos universitarios de introducción a la estadística. Tal como dice Richard Schaffer: “con relación al contenido de un curso de introducción a la estadística, los estadísticos están mucho más de acuerdo ahora que cuando yo empecé a trabajar”.1 La figura 1 es un esquema de este consenso de acuerdo con la Sociedad Americana de Estadística (ASA) y la Asociación Americana de Matemáticas (MAA).2 Como miembro que fui del comité conjunto de la ASA/MAA, estoy de acuerdo con sus conclusiones: aunque el trabajo con datos puede suponer una ayuda, fomentar el aprendizaje activo es tarea del profesor. Por ello, las dos primeras recomendaciones son los principios directores de este texto. Si bien el libro es 1 D. S. Moore et al., “New pedagogy and new content: the case of statistics”, International Statistical Review, 65, 1997, págs. 123-165. El comentario de Richard Scheaffer aparece en la página 156. 2 George Cobb, “Teaching statistics” en L. A. Steen (ed.), Heeding the Call for Change: Suggestions for Curricular Action, Mathematical Association of America, Washington, D.C., 1990, págs. 3-43. XVIII / E STADÍSTICA APLICADA BÁSICA elemental con relación al nivel de matemáticas exigido y a los procedimientos estadísticos que se presentan, aspira a facilitar a los estudiantes tanto la comprensión de las principales ideas de la estadística como la adquisición de una serie de habilidades útiles para trabajar con datos. Los ejemplos y los ejercicios que se presentan, aunque están pensados para principiantes, utilizan datos reales y dan una información general que permite a los estudiantes comprender el significado de sus cálculos. A menudo pido a los alumnos conclusiones que son algo más que un número (o “rechazar H0 ”). Aparte de hacer cálculos y sacar conclusiones correctas o erróneas, algunos ejercicios exigen hacer valoraciones. Espero que los profesores fomenten en clase un amplio debate sobre los resultados de los ejercicios. 1. Ayudar a pensar como estadísticos: (a) (b) (c) (d) La necesidad de tener datos. La importancia de la obtención de datos. La omnipresencia de la variabilidad. La medición y calibración de la variabilidad. 2. Ofrecer más datos y conceptos, y menos teoría y fórmulas. Siempre que sea posible automatiza los cálculos y las representaciones gráficas. Un curso introductorio debe: (a) Confiar plenamente en datos reales (no que solamente lo parezcan). (b) Enfatizar los conceptos estadísticos; por ejemplo, causalidad frente a asociación, experimental versus observacional. (c) Apoyarse más en los ordenadores que en las fórmulas de cálculo. (d) No dar demasiada importancia a las demostraciones matemáticas. 3. Fomentar la enseñanza activa, a través de las siguientes alternativas al estudio individual: (a) (b) (c) (d) (e) Discutir y resolver problemas en grupo. Hacer ejercicios con ordenadores. Trabajar con datos obtenidos en clase. Presentar ejercicios por escrito y exponerlos en el aula. Diseñar proyectos estadísticos de forma individual y en grupo. Figura 1. Recomendaciones de la Sociedad Americana de Estadística (ASA) y de la Asociación Americana de Matemáticas (MAA). Prólogo / XIX Los capítulos 1 y 2 presentan los métodos y las ideas que unifican el análisis de datos. Los estudiantes agradecen la utilidad del análisis de datos, y el hecho de que realmente puedan hacerlo alivia un poco su inquietud sobre la estadística. Espero que los estudiantes se acostumbren a examinar los datos y que sigan realizando este análisis aun cuando el objetivo principal del análisis sea dar respuesta a una pregunta concreta mediante inferencia. El capítulo 3 trata sobre el muestreo aleatorio y los experimentos comparativos aleatorizados. Éstos, pese a encontrarse entre las ideas más importantes de la estadística, suelen omitirse injustamente al iniciar su enseñanza. El capítulo 4 se basa en las ideas del capítulo 3 y en las herramientas del análisis de datos del capítulo 1 para presentar el concepto de distribución muestral y, de una manera informal, el lenguaje de la probabilidad. El capítulo 5, que es opcional, presenta material adicional para cursos que exijan presentar la probabilidad de una manera más formal. El capítulo 6, que describe los razonamientos en los que se basa la inferencia estadística, es la piedra angular del resto del libro. Los restantes capítulos presentan métodos de inferencia aplicables a diversas situaciones, dando especial énfasis a los aspectos prácticos de la utilización de dichos métodos. Los capítulos 7 y 8 presentan los procedimientos básicos para hacer inferencia a partir de una y de dos muestras. Los capítulos 9, 10 y 11 (que se pueden leer de forma independiente y en cualquier orden) ofrecen una selección de algunos temas más avanzados. El capítulo 12 es una introducción a los métodos inferenciales no paramétricos. Tecnología Los cálculos automáticos aumentan la capacidad de los estudiantes para resolver problemas, reducen su frustración y les ayudan a concentrarse en las ideas y en la identificación del problema más que en la mecánica de su resolución. Este libro exige de los estudiantes que dispongan de una calculadora que pueda hallar la correlación y la regresión lineal simple, así como la media y la desviación típica. Como los estudiantes tienen calculadoras, el texto no discute las fórmulas de cálculo de la desviación típica muestral o de la recta de regresión mínimo-cuadrática. Los programas estadísticos tienen considerables ventajas sobre las calculadoras: la introducción y la edición de los datos es más fácil, y los gráficos son mucho mejores. Animo al empleo de programas estadísticos siempre que los recursos y el tiempo disponible para desarrollar el curso lo permitan. Este libro, sin embargo, no da por supuesto que los estudiantes utilizarán estos programas. XX / E STADÍSTICA APLICADA BÁSICA En el texto aparecen resultados obtenidos utilizando diversas tecnologías como por ejemplo calculadoras avanzadas, hojas de cálculo o programas estadísticos como el Minitab. Utilizar diversas tecnologías se ha hecho deliberadamente: los estudiantes tienen que entender que los procedimientos estadísticos que aparecen en el libro son universales. Teniendo conocimientos básicos de estadística se pueden leer e interpretar muchos resultados independientemente de la tecnología utilizada. Texto accesible Estadística aplicada básica intenta ser un texto moderno y accesible. En comparación con Introduction to the Practice of Statistics (IPS)3 , Estadística aplicada básica guía más al lector, es más concreto y presenta menos material opcional. Aunque Estadística aplicada básica es de más fácil comprensión que IPS, sin embargo, los contenidos básicos son los mismos en ambos libros. Asimismo, en ambos libros se da mucha importancia tanto a trabajar con datos como a los problemas típicamente estadísticos. Los ejercicios que aparecen en las secciones “Aplica tus conocimientos” que aparecen situadas, después de la introducción de cada nuevo concepto, permiten valorar al propio alumno si ha asimilado el capítulo. Cada capítulo acaba con la sección “Repaso del capítulo”, un listado de sus contenidos básicos acompañado a menudo de un resumen gráfico de los principales conceptos. ¿Por qué lo hiciste de esta manera? No existe una sola manera de organizar los temas en un curso de estadística para principiantes. En este libro su organización no se ha hecho de forma caprichosa. He aquí la respuesta a una serie de preguntas sobre el orden del contenido de este libro que se me han formulado con cierta frecuencia. ¿Por qué razón la distinción entre población y muestra no aparece en los capítulos 1 y 2? La distinción entre población y ...
View Full Document

  • Fall '19
  • Aleatoriedad, Análisis de la varianza

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture