Statistic - An Introduction to Statistics Demetris Athienitis Department of Statistics University of Florida Contents Contents 1 I 4 Modules 1-2 1

Statistic - An Introduction to Statistics Demetris...

This preview shows page 1 - 7 out of 142 pages.

An Introduction to Statistics Demetris Athienitis Department of Statistics, University of Florida
Contents Contents 1 I Modules 1-2 4 1 Descriptive Statistics 5 1.1 Concept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Summary Statistics . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.1 Location . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.2 Spread . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.3 E ff ect of shifting and scaling measurements . . . . . . . 7 1.3 Graphical Summaries . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.1 Dot Plot . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.2 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.3 Box-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.3.4 Pie chart . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.5 Scatterplot . . . . . . . . . . . . . . . . . . . . . . . . 13 2 Probability and Random Variables 14 2.1 Sample Space and Events . . . . . . . . . . . . . . . . . . . . 14 2.1.1 Basic concepts . . . . . . . . . . . . . . . . . . . . . . . 14 2.1.2 Relating events . . . . . . . . . . . . . . . . . . . . . . 15 2.2 Probability . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3 Counting Methods . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.1 Permutations . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.2 Combinations . . . . . . . . . . . . . . . . . . . . . . . 19 2.4 Conditional Probability and Independence . . . . . . . . . . . 21 2.4.1 Independent Events . . . . . . . . . . . . . . . . . . . . 22 2.4.2 Law of Total Probability . . . . . . . . . . . . . . . . . 23 2.4.3 Bayes’ Rule . . . . . . . . . . . . . . . . . . . . . . . . 25 2.5 Random Variables and Probability Distributions . . . . . . . . 26 2.5.1 Expected Value And Variance . . . . . . . . . . . . . . 30 2.5.2 Population Percentiles . . . . . . . . . . . . . . . . . . 32 2.5.3 Chebyshev’s inequality . . . . . . . . . . . . . . . . . . 33 2.5.4 Jointly distributed random variables . . . . . . . . . . 33 1
2.5.5 Conditional distributions . . . . . . . . . . . . . . . . . 36 2.5.6 Independent random variables . . . . . . . . . . . . . . 37 2.5.7 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.5.8 Mean and variance of linear combinations . . . . . . . 40 2.5.9 Common Discrete Distributions . . . . . . . . . . . . . 41 2.5.10 Common Continuous Distributions . . . . . . . . . . . 45 2.6 Central Limit Theorem . . . . . . . . . . . . . . . . . . . . . . 49 2.7 Normal Probability Plot . . . . . . . . . . . . . . . . . . . . . 51 II Modules 3-4 53 3 Inference for One Population 54 3.1 Inference for Population Mean . . . . . . . . . . . . . . . . . . 54 3.1.1 Confidence intervals . . . . . . . . . . . . . . . . . . . 54 3.1.2 Hypothesis tests . . . . . . . . . . . . . . . . . . . . . . 59 3.2 Inference for Population Proportion . . . . . . . . . . . . . . . 65 3.2.1 Large sample confidence interval . . . . . . . . . . . . . 65 3.2.2 Large sample hypothesis test . . . . . . . . . . . . . . . 66 3.3 Inference for Population Variance . . . . . . . . . . . . . . . . 67 3.3.1 Confidence interval . . . . . . . . . . . . . . . . . . . . 67 3.3.2 Hypothesis test . . . . . . . . . . . . . . . . . . . . . . 69 3.4 Distribution Free Inference . . . . . . . . . . . . . . . . . . . . 70 3.4.1 Sign test . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.4.2 Wilcoxon signed-rank test . . . . . . . . . . . . . . . . 72 4 Inference for Two Populations 75 4.1 Inference for Population Means . . . . . . . . . . . . . . . . . 75 4.1.1 Confidence intervals . . . . . . . . . . . . . . . . . . . 75 4.1.2 Hypothesis tests . . . . . . . . . . . . . . . . . . . . . . 80 4.2 Inference for Population Variances . . . . . . . . . . . . . . . . 83 4.2.1 Confidence intervals . . . . . . . . . . . . . . . . . . . 83 4.2.2 Hypothesis tests . . . . . . . . . . . . . . . . . . . . . . 85 4.3 Distribution Free Inference . . . . . . . . . . . . . . . . . . . . 86 4.3.1 Wilcoxon rank-sum test . . . . . . . . . . . . . . . . . 86 4.3.2 Wilcoxon signed-rank test . . . . . . . . . . . . . . . . 87 4.3.3 Levene’s test for variances . . . . . . . . . . . . . . . . 89 4.4 Contingency Tables: Tests for Independence . . . . . . . . . . 91 III Modules 5-6 94 5 Regression 95 5.1 Simple Linear Regression . . . . . . . . . . . . . . . . . . . . . 95 5.1.1 Goodness of fit . . . . . . . . . . . . . . . . . . . . . . 98 5.1.2 Distribution of response and coe cients . . . . . . . . 100 2
5.1.3 Inference on slope coe cient . . . . . . . . . . . . . . . 101 5.1.4 Confidence interval on the mean response . . . . . . . . 102 5.1.5 Prediction interval . . . . . . . . . . . . . . . . . . . . 103 5.2 Checking Assumptions and Transforming Data . . . . . . . . . 104 5.2.1 Normality . . . . . . . . . . . . . . . . . . . . . . . . . 105 5.2.2 Independence . . . . . . . . . . . . . . . . . . . . . . . 106 5.2.3 Homogeneity of variance/Fit of model . . . . . . . . . 107 5.2.4 Box-Cox (Power) transformation . . . . . . . . . . . . 108 5.3 Multiple Regression . . . . . . . . . . . . . . . . . . . . . . . . 111 5.3.1 Model . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.3.2 Goodness of fit . . . . . . . . . . . . . . . . . . . . . . 112 5.3.3 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.4 Qualitative Predictors . . . . . . . . . . . . . . . . . . . . . . 120 6 Analysis of Variance 125 6.1 Completely Randomized Design . . . . . . . . . . . . . . . . . 125 6.1.1 Post-hoc comparisons . . . . . . . . . . . . . . . . . . . 129 6.1.2 Distribution free procedure . . . . . . . . . . . . . . . . 133 6.2 Randomized Block Design . . . . . . . . . . . . . . . . . . . . 135 6.2.1 Distribution free procedure . . . . . . . . . . . . . . . . 139 Bibliography 141 3
Part I Modules 1-2 4
Module 1 Descriptive Statistics 1.1 Concept Definition 1.1. Population parameters are a numerical summary concerning the complete collection of subjects, i.e. the population.

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture