You've reached the end of your free preview.
Want to read all 880 pages?
Unformatted text preview: Í NDICE DE CONTENIDO Prólogo Razonamiento estadístico XVII XXVII PARTE I: C OMPRENSIÓN DE LOS DATOS 1 1 Análisis de distribuciones
1.1 Introducción
1.2 Gráficos de distribuciones
1.2.1 Variables categóricas: diagramas de barras y diagramas de
sectores
1.2.2 Variables cuantitativas: histogramas
1.2.3 Interpretación de los histogramas
1.2.4 Variables cuantitativas: diagramas de tallos
1.2.5 Gráficos temporales
Resumen de la sección 1.2
Ejercicios de la sección 1.2
1.3 Descripción de las distribuciones con números
1.3.1 Una medida de centro: la media
1.3.2 Una medida de centro: la mediana
1.3.3 Comparación entre la media y la mediana
1.3.4 Una medida de dispersión: los cuartiles
1.3.5 Los cinco números resumen y los diagramas de caja
1.3.6 Una medida de dispersión: la desviación típica
1.3.7 Elección de medidas de centro y de dispersión 3
4
6
7
9
13
17
21
23
24
32
33
34
36
38
40
44
47 VIII / E STADÍSTICA APLICADA BÁSICA Resumen de la sección 1.3
Ejercicios de la sección 1.3
1.4 Distribuciones normales
1.4.1 Curvas de densidad
1.4.2 Mediana y media de una curva de densidad
1.4.3 Distribuciones normales
1.4.4 Regla del 68-95-99,7
1.4.5 Distribución normal estandarizada
1.4.6 Cálculos con distribuciones normales
1.4.7 Cómo hallar un valor dada una proporción
Resumen de la sección 1.4
Ejercicios de la sección 1.4
Repaso del capítulo 1
Ejercicios de repaso del capítulo 1 2 Análisis de relaciones
2.1 Introducción
2.2 Diagramas de dispersión
2.2.1 Interpretación de los diagramas de dispersión
2.2.2 Inclusión de variables categóricas en los diagramas
de dispersión
Resumen de la sección 2.2
Ejercicios de la sección 2.2
2.3 Correlación
2.3.1 Correlación r
2.3.2 Características de la correlación
Resumen de la sección 2.3
Ejercicios de la sección 2.3
2.4 Regresión mínimo-cuadrática
2.4.1 Recta de regresión mínimo-cuadrática
2.4.2 Características de la regresión mínimo-cuadrática
2.4.3 Residuos
2.4.4 Observaciones influyentes
Resumen de la sección 2.4
Ejercicios de la sección 2.4
2.5 Precauciones con la correlación y la regresión
2.5.1 Extrapolación 49
50
54
55
59
61
64
67
69
75
78
79
82
85 97
98
101
105
109
112
113
120
122
123
127
128
132
133
139
144
148
153
154
162
162
Índice de contenido / IX
2.5.2 Utilización de medias
2.5.3 Variables latentes
2.5.4 Asociación no implica causalidad
Resumen de la sección 2.5
Ejercicios de la sección 2.5
2.6 Relaciones entre variables categóricas
2.6.1 Distribuciones marginales
2.6.2 Descripción de relaciones
2.6.3 Distribuciones condicionales
2.6.4 Paradoja de Simpson
Resumen de la sección 2.6
Ejercicios de la sección 2.6
Repaso del capítulo 2
Ejercicios de repaso del capítulo 2 3 Obtención de datos
3.1 Introducción
3.2 Diseño de muestras
3.2.1 Muestra aleatoria simple
3.2.2 Otros diseños muestrales
3.2.3 Muestreo en etapas múltiples
3.2.4 Precauciones con las encuestas
3.2.5 Inferencia sobre la población
Resumen de la sección 3.2
Ejercicios de la sección 3.2
3.3 Diseño de experimentos
3.3.1 Experimentos comparativos
3.3.2 Experimentos completamente aleatorizados
3.3.3 Experimentos completamente aleatorizados
3.3.4 Lógica de los diseños comparativos aleatorizados
3.3.5 Precauciones con los experimentos
3.3.6 Diseños por pares
3.3.7 Diseño en bloques
Resumen de la sección 3.3
Ejercicios de la sección 3.3
Repaso del capítulo 3
Ejercicios de repaso del capítulo 3 163
164
166
170
171
173
174
177
179
183
186
187
192
195 205
206
209
212
217
219
221
226
227
228
233
237
238
240
243
246
248
249
253
254
258
260 X / E STADÍSTICA APLICADA BÁSICA PARTE II: C OMPRENSIÓN DE LA INFERENCIA 267 4 Distribuciones muestrales y probabilidad
4.1 Introducción
4.2 Aleatoriedad
4.2.1 Concepto de probabilidad
4.2.2 Pensando en la aleatoriedad
Resumen de la sección 4.2
Ejercicios de la sección 4.2
4.3 Modelos de probabilidad
4.3.1 Reglas de la probabilidad
4.3.2 Asignación de probabilidades: número finito de resultados
4.3.3 Asignación de probabilidades: intervalos de resultados
4.3.4 Distribuciones normales de probabilidad
Resumen de la sección 4.3
Ejercicios de la sección 4.3
4.4 Distribución de la media muestral
4.4.1 La estimación estadística y la ley de los grandes números
4.4.2 Distribuciones muestrales
4.4.3 Media y desviación típica de x¯
4.4.4 Teorema del límite central
Resumen de la sección 4.4
Ejercicios de la sección 4.4
4.5 Gráficos de control
4.5.1 Gráficos de medias
4.5.2 Control estadístico de procesos
4.5.3 Utilización de gráficos de control
4.5.4 El mundo real: gráficos de medias y desviaciones
Resumen de la sección 4.5
Ejercicios de la sección 4.5
Repaso del capítulo 4
Ejercicios de repaso del capítulo 4 269
270
270
272
275
276
276
278
281
285
288
291
293
294
298
298
302
305
308
313
314
317
318
322
323
325
331
331
333
336 5 Teoría de probabilidad
5.1 Introducción
5.2 Reglas generales de la probabilidad
5.2.1 La independencia y la regla de la multiplicación 343
344
344
344 Índice de contenido / XI 5.2.2 Aplicación de la regla de la multiplicación
5.2.3 Regla general de la suma
Resumen de la sección 5.2
Ejercicios de la sección 5.2
5.3 Distribuciones binomiales
5.3.1 Situación binomial
5.3.2 Probabilidades binomiales
5.3.3 Media y desviación típica binomiales
5.3.4 Aproximación normal a distribuciones binomiales
Resumen de la sección 5.3
Ejercicios de la sección 5.3
5.4 Probabilidad condicional
5.4.1 Generalización de la regla de la multiplicación
5.4.2 Probabilidad condicional y independencia
Resumen de la sección 5.4
Ejercicios de la sección 5.4
Repaso del capítulo 5
Ejercicios de repaso del capítulo 5 349
352
355
356
359
359
362
366
368
372
373
376
380
381
383
384
387
388 6 Introducción a la inferencia estadística
6.1 Introducción
6.2 Estimación con confianza
6.2.1 Confianza estadística
6.2.2 Intervalos de confianza para la media µ
6.2.3 Comportamiento de los intervalos de confianza
6.2.4 Elección del tamaño de la muestra
6.2.5 Algunas precauciones
Resumen de la sección 6.2
Ejercicios de la sección 6.2
6.3 Pruebas de significación
6.3.1 Razonamientos de las pruebas de significación
6.3.2 Terminología de las pruebas de significación
6.3.3 Más detalles: planteamiento de las hipótesis
6.3.4 Más detalles: valores P y significación estadística
6.3.5 Pruebas de significación para una media poblacional
6.3.6 Pruebas con un nivel de significación predeterminado
6.3.7 Pruebas derivadas de los intervalos de confianza 393
394
395
397
402
408
410
412
416
417
421
422
423
428
431
434
442
447
XII / E STADÍSTICA APLICADA BÁSICA 7 Resumen de la sección 6.3
Ejercicios de la sección 6.3
6.4 Utilización de las pruebas de significación
6.4.1 ¿Cuál tiene que ser el valor P?
6.4.2 Significación estadística y significación práctica
6.4.3 La inferencia estadística no es válida para cualquier
conjunto de datos
6.4.4 Cuidado con los análisis múltiples
Resumen de la sección 6.4
Ejercicios de la sección 6.4
6.5 Tipos de error y potencia
6.5.1 Errores tipo I y errores tipo II
6.5.2 Probabilidades de error
6.5.3 Potencia
Resumen de la sección 6.5
Ejercicios de la sección 6.5
Repaso del capítulo 6
Ejercicios de repaso del capítulo 6 449
449
454
454
456 Inferencia para medias y desviaciones típicas
7.1 Introducción
7.2 Inferencia para la media de una población
7.2.1 Distribuciones t
7.2.2 Intervalos y pruebas t
7.2.3 Utilización de procedimientos t de una muestra
7.2.4 Procedimientos t para diseños por pares
7.2.5 Robustez de los procedimientos t
Resumen de la sección 7.2
Ejercicios de la sección 7.2
7.3 Comparación de dos medias
7.3.1 Problemas de dos muestras
7.3.2 Comparación de dos medias poblacionales
7.3.3 Procedimientos t de dos muestras
7.3.4 Ejemplos de procedimientos t de dos muestras
7.3.5 Otra vez la robustez
7.3.6 Procedimientos t de dos muestras más precisos
7.3.7 Procedimientos t de dos muestras con varianza comn 481
482
482
483
486
490
493
499
505
506
513
513
515
518
522
528
530
534 457
459
461
461
462
463
464
469
472
472
475
477 Índice de contenido / XIII Resumen de la sección 7.3
Ejercicios de la sección 7.3
7.4 Inferencia para la dispersión poblacional
7.4.1 Evita la inferencia sobre desviaciones típicas
7.4.2 Prueba F para comparar dos desviaciones típicas
Resumen de la sección 7.4
Ejercicios de la sección 7.4
Repaso del capítulo 7
Ejercicios de repaso del capítulo 7 535
536
543
544
545
548
549
550
552 8 Inferencia para proporciones
8.1 Introducción
8.2 Inferencia para una proporción poblacional
8.2.1 Distribución de pˆ
8.2.2 Supuestos para la inferencia
8.2.3 Procedimientos z
8.2.4 Elección del tamaño de la muestra
Resumen de la sección 8.2
Ejercicios de la sección 8.2
8.3 Comparación de dos proporciones
8.3.1 Distribución de pˆ 1 − pˆ 2
8.3.2 Intervalos de confianza para p1 − p2
8.3.3 Pruebas de significación para p1 − p2
Resumen de la sección 8.3
Ejercicios de la sección 8.3
Repaso del capítulo 8
Ejercicios de repaso del capítulo 8 563
564
566
566
570
574
579
582
583
586
588
589
593
598
599
605
607 PARTE III: T EMAS RELACIONADOS CON LA INFERENCIA 611 9 Inferencia para tablas de contingencia
9.1 Introducción
9.1.1 El problema de las comparaciones múltiples
9.2 Tablas de contingencia
9.2.1 Recuentos esperados 613
614
615
616
617 XIV / E STADÍSTICA APLICADA BÁSICA 9.3 Prueba Ji cuadrado
9.3.1 Distribuciones Ji cuadrado
9.3.2 Más aplicaciones de la prueba Ji cuadrado
9.3.3 Recuentos exigidos en las celdas para la prueba Ji cuadrado
9.3.4 Prueba Ji cuadrado y prueba z
Resumen de la sección 9.3
Repaso del capítulo 9
Ejercicios de repaso del capítulo 9 621
625
628
633
634
637
638
639 10 Análisis de la varianza de un factor: comparación de varias medias
10.1 Introducción
10.1.1 El problema de las comparaciones múltiples
10.2 Prueba F del análisis de la varianza
10.2.1 La idea del análisis de la varianza
10.2.2 Supuestos del ANOVA
10.3 Algunos detalles sobre el ANOVA*
Resumen
Repaso del capítulo 10
Ejercicios de repaso del capítulo 10 651
652
654
655
660
666
673
679
679
680 11 Inferencia para regresión
11.1 Introducción
11.1.1 Modelo de la regresión
11.2 Inferencia para el modelo
11.2.1 Intervalos de confianza para la pendiente de la regresión
11.2.2 Contraste de hipótesis para una relación no lineal
11.3 Inferencia para la predicción
11.4 Comprobación de los supuestos de la regresión
Resumen
Repaso del capítulo 11
Ejercicios de repaso del capítulo 11 687
688
690
692
696
700
705
709
715
715
717 12 Pruebas no paramétricas
12.1 Introducción
12.2 Prueba de Wilcoxon de suma de rangos
12.2.1 Rangos 727
728
730
731
Índice de contenido / XV 12.2.2 Prueba de Wilcoxon de suma de rangos
12.2.3 Aproximación normal
12.2.4 ¿Qué hipótesis plantea la prueba de Wilcoxon?
12.2.5 Empates
12.2.6 Limitaciones de las pruebas no paramétricas
Resumen de la sección 12.2
Ejercicios de la sección 12.2
12.3 Prueba de Wilcoxon de suma de rangos de diferencias
12.3.1 Aproximación normal
12.3.2 Empates
Resumen de la sección 12.3
Ejercicios de la sección 12.3
12.4 Prueba de Kruskal-Wallis
12.4.1 Supuestos e hipótesis
12.4.2 Prueba de Kruskal-Wallis
Resumen de la sección 12.4
Ejercicios de la sección 12.4
Repaso del capítulo 12
Ejercicios de repaso del capítulo 12 733
737
740
741
746
747
747
752
757
759
762
762
766
767
768
771
772
775
777 Repaso del pensamiento estadístico 781 Apéndice
Tabla A: Probabilidades normales estandarizadas
Tabla B: Dígitos aleatorios
Tabla C: Valores críticos de la distribución t
Tabla D: Valores críticos de la distribución F
Tabla E: Valores críticos de la distribución Ji cuadrado 785
786
788
789
790
794 Soluciones de ejercicios seleccionados
Índice analítico 795
831 P RÓLOGO Estadística aplicada básica (versión en castellano de The Basic Practice of Statistics)
es una introducción a la estadística para estudiantes universitarios que enfatiza
el trabajo con datos y las ideas estadísticas. En este prólogo describo el contenido
del libro con el objeto de ayudar a los profesores a juzgar si este libro es adecuado para sus alumnos. Principios básicos
Hasta ahora, los cursos de introducción a la estadística se centraban en la probabilidad y en la inferencia. Estadística aplicada básica refleja una nueva corriente en la
enseñanza de la estadística en la que el análisis de datos y el diseño de métodos
para su obtención constituyen, junto con los métodos de inferencia basados en
la probabilidad, los temas principales. Los estadísticos han llegado a un amplio
consenso sobre los contenidos de cursos universitarios de introducción a la estadística. Tal como dice Richard Schaffer: “con relación al contenido de un curso de
introducción a la estadística, los estadísticos están mucho más de acuerdo ahora
que cuando yo empecé a trabajar”.1 La figura 1 es un esquema de este consenso de acuerdo con la Sociedad Americana de Estadística (ASA) y la Asociación
Americana de Matemáticas (MAA).2
Como miembro que fui del comité conjunto de la ASA/MAA, estoy de acuerdo con sus conclusiones: aunque el trabajo con datos puede suponer una ayuda,
fomentar el aprendizaje activo es tarea del profesor. Por ello, las dos primeras
recomendaciones son los principios directores de este texto. Si bien el libro es 1 D. S. Moore et al., “New pedagogy and new content: the case of statistics”, International Statistical
Review, 65, 1997, págs. 123-165. El comentario de Richard Scheaffer aparece en la página 156.
2 George Cobb, “Teaching statistics” en L. A. Steen (ed.), Heeding the Call for Change: Suggestions for
Curricular Action, Mathematical Association of America, Washington, D.C., 1990, págs. 3-43.
XVIII / E STADÍSTICA APLICADA BÁSICA elemental con relación al nivel de matemáticas exigido y a los procedimientos estadísticos que se presentan, aspira a facilitar a los estudiantes tanto la comprensión de las principales ideas de la estadística como la adquisición de una serie de
habilidades útiles para trabajar con datos. Los ejemplos y los ejercicios que se presentan, aunque están pensados para principiantes, utilizan datos reales y dan una
información general que permite a los estudiantes comprender el significado de
sus cálculos. A menudo pido a los alumnos conclusiones que son algo más que un
número (o “rechazar H0 ”). Aparte de hacer cálculos y sacar conclusiones correctas
o erróneas, algunos ejercicios exigen hacer valoraciones. Espero que los profesores fomenten en clase un amplio debate sobre los resultados de los ejercicios. 1. Ayudar a pensar como estadísticos:
(a)
(b)
(c)
(d) La necesidad de tener datos.
La importancia de la obtención de datos.
La omnipresencia de la variabilidad.
La medición y calibración de la variabilidad. 2. Ofrecer más datos y conceptos, y menos teoría y fórmulas. Siempre que sea
posible automatiza los cálculos y las representaciones gráficas. Un curso
introductorio debe:
(a) Confiar plenamente en datos reales (no que solamente lo parezcan).
(b) Enfatizar los conceptos estadísticos; por ejemplo, causalidad frente a
asociación, experimental versus observacional.
(c) Apoyarse más en los ordenadores que en las fórmulas de cálculo.
(d) No dar demasiada importancia a las demostraciones matemáticas.
3. Fomentar la enseñanza activa, a través de las siguientes alternativas al estudio individual:
(a)
(b)
(c)
(d)
(e) Discutir y resolver problemas en grupo.
Hacer ejercicios con ordenadores.
Trabajar con datos obtenidos en clase.
Presentar ejercicios por escrito y exponerlos en el aula.
Diseñar proyectos estadísticos de forma individual y en grupo. Figura 1. Recomendaciones de la Sociedad Americana de Estadística
(ASA) y de la Asociación Americana de Matemáticas (MAA). Prólogo / XIX Los capítulos 1 y 2 presentan los métodos y las ideas que unifican el análisis
de datos. Los estudiantes agradecen la utilidad del análisis de datos, y el hecho de
que realmente puedan hacerlo alivia un poco su inquietud sobre la estadística. Espero que los estudiantes se acostumbren a examinar los datos y que sigan realizando este análisis aun cuando el objetivo principal del análisis sea dar respuesta
a una pregunta concreta mediante inferencia. El capítulo 3 trata sobre el muestreo
aleatorio y los experimentos comparativos aleatorizados. Éstos, pese a encontrarse entre las ideas más importantes de la estadística, suelen omitirse injustamente
al iniciar su enseñanza. El capítulo 4 se basa en las ideas del capítulo 3 y en las
herramientas del análisis de datos del capítulo 1 para presentar el concepto de
distribución muestral y, de una manera informal, el lenguaje de la probabilidad.
El capítulo 5, que es opcional, presenta material adicional para cursos que exijan
presentar la probabilidad de una manera más formal. El capítulo 6, que describe
los razonamientos en los que se basa la inferencia estadística, es la piedra angular
del resto del libro. Los restantes capítulos presentan métodos de inferencia aplicables a diversas situaciones, dando especial énfasis a los aspectos prácticos de la
utilización de dichos métodos. Los capítulos 7 y 8 presentan los procedimientos
básicos para hacer inferencia a partir de una y de dos muestras. Los capítulos 9,
10 y 11 (que se pueden leer de forma independiente y en cualquier orden) ofrecen
una selección de algunos temas más avanzados. El capítulo 12 es una introducción a los métodos inferenciales no paramétricos. Tecnología
Los cálculos automáticos aumentan la capacidad de los estudiantes para resolver problemas, reducen su frustración y les ayudan a concentrarse en las ideas
y en la identificación del problema más que en la mecánica de su resolución.
Este libro exige de los estudiantes que dispongan de una calculadora que pueda hallar la correlación y la regresión lineal simple, así como la media y la desviación típica. Como los estudiantes tienen calculadoras, el texto no discute las
fórmulas de cálculo de la desviación típica muestral o de la recta de regresión
mínimo-cuadrática. Los programas estadísticos tienen considerables ventajas sobre las calculadoras: la introducción y la edición de los datos es más fácil, y los
gráficos son mucho mejores. Animo al empleo de programas estadísticos siempre que los recursos y el tiempo disponible para desarrollar el curso lo permitan.
Este libro, sin embargo, no da por supuesto que los estudiantes utilizarán estos
programas. XX / E STADÍSTICA APLICADA BÁSICA En el texto aparecen resultados obtenidos utilizando diversas tecnologías como por ejemplo calculadoras avanzadas, hojas de cálculo o programas estadísticos como el Minitab. Utilizar diversas tecnologías se ha hecho deliberadamente:
los estudiantes tienen que entender que los procedimientos estadísticos que aparecen en el libro son universales. Teniendo conocimientos básicos de estadística
se pueden leer e interpretar muchos resultados independientemente de la tecnología utilizada. Texto accesible
Estadística aplicada básica intenta ser un texto moderno y accesible. En comparación con Introduction to the Practice of Statistics (IPS)3 , Estadística aplicada básica
guía más al lector, es más concreto y presenta menos material opcional. Aunque Estadística aplicada básica es de más fácil comprensión que IPS, sin embargo,
los contenidos básicos son los mismos en ambos libros. Asimismo, en ambos libros se da mucha importancia tanto a trabajar con datos como a los problemas
típicamente estadísticos. Los ejercicios que aparecen en las secciones “Aplica tus
conocimientos” que aparecen situadas, después de la introducción de cada nuevo concepto, permiten valorar al propio alumno si ha asimilado el capítulo. Cada
capítulo acaba con la sección “Repaso del capítulo”, un listado de sus contenidos
básicos acompañado a menudo de un resumen gráfico de los principales conceptos. ¿Por qué lo hiciste de esta manera?
No existe una sola manera de organizar los temas en un curso de estadística para
principiantes. En este libro su organización no se ha hecho de forma caprichosa.
He aquí la respuesta a una serie de preguntas sobre el orden del contenido de este
libro que se me han formulado con cierta frecuencia.
¿Por qué razón la distinción entre población y muestra no aparece en los
capítulos 1 y 2? La distinción entre población y ...
View
Full Document
- Fall '19
- Aleatoriedad, Análisis de la varianza