stat231notes - STAT 231 STATISTICS Spring 2008 Contents 1...

Info iconThis preview shows pages 1–7. Sign up to view the full content.

View Full Document Right Arrow Icon
STAT 231: STATISTICS Spring 2008
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
Contents 1 Data Analysis 1 1.1 Review of probability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 Fundamentals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.2 Distributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.3 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.1 Data types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.2 Transformations on data . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.3 Statistical method – PPDAC . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.3.1 Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3.2 Populations, plans and attributes . . . . . . . . . . . . . . . . . . . . 10 1.3.3 Data quality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4 Data Summaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.4.1 Graphical data summaries I. . . . . . . . . . . . . . . . . . . . . . . 13 1.4.2 Algebraic methods: continuous data . . . . . . . . . . . . . . . . . . 20 1.4.3 Graphical data summaries II . . . . . . . . . . . . . . . . . . . . . . 24 1.5 More complex data types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.5.1 Bivariate plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.5.2 Measures of association . . . . . . . . . . . . . . . . . . . . . . . . . 29 1.5.3 Time series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.6.1 Mathematical prerequisites . . . . . . . . . . . . . . . . . . . . . . . 33 1.6.2 Statistical calculations and R . . . . . . . . . . . . . . . . . . . . . . 36 1.6.3 Terminology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1.6.4 Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2 Introduction to Statistical Science 41 2.1 Statistical science . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.2 Probability distributions and statistical models . . . . . . . . . . . . . . . . 42 2.3 Data analysis and statistical inference . . . . . . . . . . . . . . . . . . . . . 44 2.3.1 A smoking behaviour survey . . . . . . . . . . . . . . . . . . . . . . 45 i
Background image of page 2
ii CONTENTS 2.3.2 A soft drink bottle Fller study . . . . . . . . . . . . . . . . . . . . . 46 2.4 More detailed examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2.4.1 Risk and return in Fnancial markets . . . . . . . . . . . . . . . . . . 50 2.4.2 ClassiFcation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.5 Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.6.1 Terminology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.6.2 Execises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3 Models and the Likelihood function 61 3.1 Random variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.1.1 Realisations of random variables . . . . . . . . . . . . . . . . . . . . 61 3.2 Discrete models for binary variates . . . . . . . . . . . . . . . . . . . . . . . 63 3.2.1 Models for populations . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3.2.2 Simulating from the models . . . . . . . . . . . . . . . . . . . . . . . 64 3.3 Response models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3.1 Simulating from the models . . . . . . . . . . . . . . . . . . . . . . . 67 3.4 Regression models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.4.1 Simulating from regression models . . . . . . . . . . . . . . . . . . . 72 3.5 Model Ftting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.5.1 The likelihood function . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.6 Estimating regression models . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.7 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 3.7.1 Terminology & modelling . . . . . . . . . . . . . . . . . . . . . . . . 79 3.7.2 Simulation from R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.7.3 Mathematical details . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3.7.4 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4 Statistical Inference 87 4.1 Sample error and sampling distribution . . . . . . . . . . . . . . . . . . . . 87 4.2 Distribution theory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 4.2.1 Gaussian random variables . . . . . . . . . . . . . . . . . . . . . . . 90 4.2.2 χ 2 p distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 4.2.3 The t m distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.3 ConFdence intervals for parameters . . . . . . . . . . . . . . . . . . . . . . . 95 4.3.1 Coverage properties . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4.3.2 ConFdence interval for binomial probability π . . . . . . . . . . . . . 98 4.3.3 ConFdence interval for μ in response model . . . . . . . . . . . . . . 99 4.3.4 ConFdence interval for regression model . . . . . . . . . . . . . . . . 102 4.4 Testing statistical hypotheses . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.4.1 The t -test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.5 Inference with the likelihood function . . . . . . . . . . . . . . . . . . . . . . 111 4.5.1 Likelihood-based interval estimates . . . . . . . . . . . . . . . . . . . 111
Background image of page 3

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
CONTENTS iii 4.5.2 Likelihood based hypothesis tests . . . . . . . . . . . . . . . . . . . . 113 4.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4.6.1 Some worked examples . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4.6.2 Data analysis & simulation . . . . . . . . . . . . . . . . . . . . . . . 117 4.6.3 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 4.6.4 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 5 Model Assessment 121 5.1 Testing for association across categories . . . . . . . . . . . . . . . . . . . . 121 5.2 Model checking and assessment . . . . . . . . . . . . . . . . . . . . . . . . . 123 5.2.1 Independence and distributional assumptions . . . . . . . . . . . . . 123 5.2.2 Regression models . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 5.2.3 Warning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.3 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 5.3.1 Model Ftting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 6 Comparison, Causality and Prediction 131 6.1 Comparisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.1.1 Comparing two populations . . . . . . . . . . . . . . . . . . . . . . . 131 6.1.2 Blocking, matching and paired t -tests . . . . . . . . . . . . . . . . . 135 6.2 Causality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.2.1 Association is not causation . . . . . . . . . . . . . . . . . . . . . . . 139 6.2.2 Designing a causal investigation . . . . . . . . . . . . . . . . . . . . . 141 6.2.3 Observational plans and causation . . . . . . . . . . . . . . . . . . . 143 6.3 Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 6.3.1 Predictive intervals . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 6.3.2 Prediction in regression . . . . . . . . . . . . . . . . . . . . . . . . . 146 6.4 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 6.4.1 Terminology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 6.4.2 Data analysis and R . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 7 Exercises 153 8 Appendix: Statistical tables 167
Background image of page 4
iv CONTENTS
Background image of page 5

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
Preliminaries These notes These notes are relatively new, and probably contain mistakes. If you Fnd any typos/mistakes
Background image of page 6
Image of page 7
This is the end of the preview. Sign up to access the rest of the document.

{[ snackBarMessage ]}

Page1 / 181

stat231notes - STAT 231 STATISTICS Spring 2008 Contents 1...

This preview shows document pages 1 - 7. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online