09第8ç«  假设检é&ord

09第8ç«  假设检é&ord

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: 8.2.2 总体比例的检验(z-test) 问题: H0: π =π 0 H0 : π ≥ π 0 H1: π ≠π 0 H1 : π < π 0 • H0 : π ≤ π 0 H1 : π >π 0 假定条件: 当np ≥ 5且n(1 − p) ≥ 5 1 总体比例的检验 假设 双侧检验 左侧检验 右侧检验 假设形式 H0: π =π 0 H1: π ≠π 0 H 0 : π ≥π 0 H 1 : π <π 0 H 0 : π ≤π 0 H 1 : π >π 0 p −π z= π (1 − π ) n 0 统计量 0 拒绝域 z > zα / 2 z < − zα P值决策 P <α 0 z > zα 拒绝H0 2 • 【例】一项统计结果声称,某市老年人口 ( 年龄在 65 岁以上)的比重为 14.7% ,该市 老年人口研究会为了检验该项统计是否可 靠,随机抽选了400名居民,发现其中有57人 年 龄在 65 岁以上。调查结果是否支持该市老 年人口比重为14.7%的看法?(α= 0.05) 分析:比例的检验,双侧检验。 57 P= = 0.1425 400 3 • H0: π = 14.7% • H1: π ≠ 14.7% α = 0.05 • n = 400 • 临界值(s): 检验统计量: z= 0 .1425 − 0 .147 = − 0 .254 0 .147 × (1 − 0 .147 ) 400 决策: 拒绝 H0 拒绝 H0 .025 .025 在α = 0.05的水平上不拒绝H0 0.05 结论: -1.96 0 1.96 Z 该市老年人口比重为14.7% 4 • 练习. 一种以休闲和娱乐为主题的杂志,声称其读者群中 有80%为女性。为验证这一说法是否属实,某研究部门抽 取 了由 200 人组成的一个随机样本,发现有 146 个女性经 常阅读该杂志。分别取显著性水平 α=0.05和α=0.01 ,检 验该杂志读者群中女性的比例是否为80%?P值是多少? • • • • H0 : π = 80% H1 : π ≠ 80% n = 200 P=146/200=0.73 检验统计量: 0.73 − 0.80 z= = −2.475 0.80× (1 − 0.80) 200 5 p=2P(Z>2.475)=0.013328 α = 0.05 • 临界值CV=±1.96 α> p,拒绝H0 • 有充分理由表明该杂 志的说法不属实 α = 0.01 • 临界值CV=±2.58 α< p, 不拒绝H0 • 无充分理由表明该杂 志的说法不属实。 (即属实 ) 6 8.2.2 总体方差的检验 (χ 2检验) 问题: H0 : σ 2=σ 02 H0 : σ 2 ≥σ 02 H0 : σ 2 ≤σ 02 H1 : σ 2 ≠σ 02 H1 : σ 2 <σ 02 H1 : σ 2 >σ 02 • • 假设总体近似服从正态分布 检验统计量 χ= 2 (n −1)s σ 2 0 2 ~ χ (n −1) 2 7 一个正态总体方差的卡方检验 H :σ ≤ σ 2 右侧检验 0 H :σ > σ 2 α 1 χ= 2 2 0 2 0 (n − 1) S 2 ~ χ (n − 1) 2 σ 当χ > χ (n − 1)拒绝H 2 2 2 α 0 χα 2 8 双侧检验 2 χ1−α / 2 左侧检验 2 χα / 2 2 χ1−α 9 总体方差的检验 假设 双侧检验 左侧检验 右侧检验 假设形式 H0 : σ 2=σ 02 H1 : σ 2 ≠σ 02 H0 : σ 2 ≥σ 02 H1 : σ 2 <σ 02 H0 : σ 2 ≤σ 02 H1 : σ 2 >σ 02 统计量 拒绝域 P值决策 χ= 2 2 χ 2 > χα 2 (n −1) χ 2 < χ12−α 2 (n −1) ( n − 1) s σ 2 2 0 χ 2 < χ12−α (n − 1) 2 χ 2 > χα (n −1) P < α 拒绝H0 10 • 【例】某厂商生产出一种新型的饮料装瓶机器,按 设 计要求,该机器装一瓶一升 (1000cm3) 的饮料误 差上下不超过1cm3。如果达到设计要求,表明机器 的稳定性非常好。现从该机器装完的产品中随机抽 取 25 瓶,分别进行测定 ( 用样本减 1000cm3) ,得到 如 下结果。检验该机器的性能是否达到设计要求 (α=0.05) 0.3 -0.3 -1.3 -0.6 -0.5 -0.4 -1.5 0.7 0.7 1 -0.7 0.6 1 -1.5 -0.2 1.4 -0.9 -0.5 -0.2 -0.6 -0.6 1.3 0 -1.9 1.1 分析:方差的检 验,双侧检验。 验,双侧检验。 11 统计量: H0: σ2 • =1 • H1: σ2 ≠ 1 α = 0.05 • df = 25 - 1 = 24 • 临界值(s): χ2 = ( n − 1) s 2 σ 02 ( 25 − 1) 0 . 866 = = 20 . 8 01 决策: α /2 =.05 /2 在 α = 0.05的水平上不拒绝H0 0.05 结论: 0 12.40 39.36 χ2 χ 不能认为该机器的性能未达到 设计要求 设计要求 12 • 练习:啤酒生产企业采用自动生产线灌装啤酒,每 瓶 的装填量为 640ml ,但由于受某些不可控因素的 影响,每瓶的装填量会有差异。此时,不仅每瓶的 平均装填量很重要,装填量的方差同样很重要。如 果方差很大,会出现装填量太多或太少的情况,这 样要么生产企业不划算,要么消费者不满意。假定 生产标准规定每瓶装填量的标准差不应超过和不应 低 于 4ml 。企业质检部门抽取了 10 瓶啤酒进行检 验 ,得到的样本标准差为 s=3.8ml 。试以 0.10 的显 著性水平检验装填量的标准差是否符合要求? 分析:方差的检验,双侧 检验。假定正态总体 检验。假定正态总体 13 • H 0 : σ 2 = 42 • H1 : σ 2 ≠ 42 α = 0.10 • df = 10 - 1 = 9 • 临界值(s): 统计量: (10 − 1) × 3.82 χ2 = = 8.1225 2 4 决策: α /2 =0.05 不拒绝H0 结论: 0 3.325 16.919 χ2 装填量的标准差符合要求 14 一个总体参数的检验 一个总体 一个总体 均值 均值 z 检验 z 检验 比例 比例 tt 检验 检验 方差 方差 z 检验 z 检验 χ22检验 χ 检验 15 8.3 两个总体参数的检验 8.3.1 两个总体均值之差的检验 8.3.2 两个总体比例之差的检验 8.3.3 两个总体方差比的检验 16 8.3.1 两个总体均值之差的检验 双侧检验 左侧检验 右侧检验 H0 : μ 1-μ 2=0 H1 : μ 1-μ 2 ≠0 H0 : μ 1-μ 2≥0 H1 : μ 1-μ 2<0 H0 : μ 1-μ 2≤0 H1 : μ 1-μ 2>0 • 包括: • 独立样本 • 匹配样本 17 • 两个总体均值之差的检验的Excel操作 18 • 两个总体均值之差的检验(Excel) • t-test: 平均值的成对二样本分析(匹配样本) • t-test: 双样本等方差假设 • ( 总体方差未知且σ1 =σ2 ) • t-test: 双样本异方差假设 • (总体方差未知且σ1≠σ2) • z-test: 双样本平均差检验 • (总体标准差σ1,σ2已知) 1 此处不分大小样本,但小样本时假定正态总体 2 大样本总体方差未知时此处为t-test, 公式为z-test, 不矛盾,因为 t-test→ z-test 19 【例1】甲、乙两台机床同时加工某种同类型的零件,已 知两台机床加工的零件直径 ( 单位: cm) 分别服从正态分 知 两台机床加工的零件直径 布,并且有σ12=σ22 。为比较两台机床的加工精度有无显 布,并且有 。为比较两台机床的加工精度有无显 著差异,分别独立抽取了甲机床加工的8个零件和乙机床 著差异,分别独立抽取了甲机床加工的 加工的7个零件,通过测量得到如下数据 。在α=0.05的显 加工的 。在 著性水平下,样本数据是否提供证据支持 “两台机床加工 著性水平下,样本数据是否提供证据支持 的零件直径不一致”的看法? 的零件直径不一致 两台机床加工零件的样本数据 (cm) 甲 20.5 19.8 19.7 20.4 20.1 20.0 19.0 乙 20.7 19.8 19.5 20.8 20.4 19.6 20.2 19.9 分析: 总体方差未知但相等,为“双样本等方差假设”的双侧检验 20 双样本等方差假设 H0 : μ 1-μ 2=0 H1 : μ 1-μ 2 ≠0 H0 : μ 1-μ 2≥0 H1 : μ 1-μ 2<0 H0 : μ 1-μ 2≤0 H1 : μ 1-μ 2>0 假设平 均差=0 21 t-检验: 双样本等方差假设 机床甲 机床乙 平均 19.925 20.14 方差 观测值 0.216428 8 0.2728 7 合并方差 0.24247 假设平均差 0 自由度 df 13 统计量的值 t Stat -0.8548 P(T<=t) 单尾 0.204 t 单尾临界 1.7709 P(T<=t) 双尾 t 双尾临界 0.408 2.160 s2 ni 22 双侧检验 t Stat P(T<=t) 单尾 t 单尾临界 P(T<=t) 双尾 t 双尾临界 -0.854848035 0.204056849 1.770931704 0.408113698 2.16036824 •H0 : μ 1-μ 2=0 H1 : μ 1-μ 2 ≠0 •t=-0.854848035, CV=-2.16036824 α=0.05, p=0.408 •不拒绝H0,无充分证据表明“两台机床加 工的零件直径不一致” 23 【例2】为检验两种方法组装产品所需时间的差异, 分别对两种不同的组装方法各随机安排 12 个工人, 分 别对两种不同的组装方法各随机安排 每个工人组装一件产品所需的时间(分钟)下如表。假 每个工人组装一件产品所需的时间 定种方法组装产品的时间服从正态分布,但方差未 定两种方法组装产品的时间服从正态分布,但 知 且不相等。取显著性水平 0.05,能否认为方法1组 装产品的平均数量明显地高于方法2组? 装产品的平均数量明显地高于方法 两个方法组装产品所需的时间 方法1 方法2 28.3 36.0 27.6 31.7 30.1 37.2 22.2 26.0 29.0 38.5 31.0 32.0 37.6 34.4 33.8 31.2 32.1 28.0 20.0 33.4 28.8 30.0 30.2 26.5 分析: 总体方差未知且不 相等,为“双样本异 相等,为 方差假设” H0 :μ1−μ2≤0 H1 : μ1−μ2>0 24 双样本异方差假设 25 t-检验: 双样本异方差假设 平均 方差 观测值 方法1 32.5 15.996364 12 假设平均差 0 df 22 t Stat 2.1556 P(T<=t) 单尾 0.021 t 单尾临界 1.7171 P(T<=t) 双尾 t 双尾临界 0.042 2.073 方法2 28.8 19.35818 12 26 t Stat P(T<=t) 单尾 0.021 t 单尾临界 1.7171 P(T<=t) 双尾 0.042 t 双尾临界 右侧检验 2.1556 2.073 •H0 : μ 1-μ 2 ≤ 0 H1 : μ 1-μ 2 >0 •t=2.1556, CV=1.7171 α=0.05, p=0.021 •拒绝H0,有充分证据表明 “1组装产品的 平均数量明显地高于方法2组” 27 • 【 例 8.12】一个以减肥为主要目标的健美俱乐部声 称 ,参加其训练班至少可以使减肥者平均体重减重 8.5kg以上。为了验证该宣称是否可信,调查人员随 机抽取了10名参加者,得到他们的体重记录如下表 训练前 94.5 训练后 85 101 110 89.5 101.5 103.5 97 88.5 96.5 101 104 116.5 96 86 80.5 93.5 93 87 102 在 α = 0.05的显著性水平下,调查结果是否支持 0.05 该俱乐部的声称? 该俱乐部的声称? • H0: μ1 – μ2≤ 8.5 • H1: μ1 – μ2 > 8.5 28 注意假设平均差 29 t-检验: 成对双样本均值分析 训练前 训练后 平均 101.25 91.4 方差 63.4028 50.4889 观测值 10 10 泊松相关系数 0.9638 假设平均差 8.5 df 9 t Stat 1.9413 P(T<=t) 单尾 0.0421 t 单尾临界 1.8331 P(T<=t) 双尾 0.0841 t 双尾临界 2.2622 30 t-检验: 成对双样本均值分析 训练前 t Stat 1.9413 P(T<=t) 单尾 0.0421 t 单尾临界 1.8331 P(T<=t) 双尾 0.0841 t 双尾临界 训练后 2.2622 •H0 : μ 1-μ 2 ≤ 0 H1 : μ 1-μ 2 >0 •t=1.9413, CV=1.8331 α=0.05, p=0.0421 •拒绝H0,有充分证据表明 “训练后比训练前体重 减少” 31 【 练习 】 某饮料公司开发研制出一新产品,为比较消费者对 新老产品口感的满意程度,该公司随机抽选一组消费者 (8 人 ) 新 老产品口感的满意程度,该公司随机抽选一组消费者 ,每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种 ,每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种 饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别 饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别 进行评分 (0 分~ 10 分 ) ,评分结果如下表。取显著性水平 α 进 行评分 , 评分结果如下表。取显著性水平 =0.05,该公司是否有证据认为消费者对两种饮料的评分存在 =0.05 显著差异? 显著差异? 两种饮料平均等级的样本数据 新饮料 5 4 7 3 5 8 5 6 旧饮料 6 6 7 4 3 9 7 6 分析: 配对样本, 为“成对二样本分析”, 双侧检验. 双侧检验 32 平均值的成对二样本分析 33 t-检验: 成对双样本均值分析 平均 方差 观测值 旧款饮料 5.375 2.553571 8 泊松相关系数 假设平均差 df t Stat 0.724207 0 7 -1.35724 P(T<=t) 单尾 0.108419 t 单尾临界 1.894578 P(T<=t) 双尾 t 双尾临界 0.216838 2.364623 新款饮料 6 3.428571 8 34 -1.35724 0.108419 1.894578 0.216838 t 双尾临界 双侧检验 t Stat P(T<=t) 单尾 t 单尾临界 P(T<=t) 双尾 2.364623 •H0 : μ 1-μ 2=0 H1 : μ 1-μ 2 ≠0 •t=-1.35724, CV=2.364623 α=0.05, p=0.216838 •不拒绝H0,无充分证据表明 “消者对两种饮料 的评分存在显著差异” 问题:根据所给df查表计算临界值? 35 8.3.2 两个总体比例之差的检验 (z-test) – 问题: – H0 :π1-π2≤0 ,H1 :π1-π2>0 – H0 :π1-π2≥0 ,H1 :π1-π2<0 – H0 :π1-π2=0,H1 :π1-π2≠0 36 两个总体比例之差的检验 假定条件: 1 两个样本是独立的 2 样本容量足够大 n π ≥ 5且n (1 − π ) ≥ 5, 1 1 1 1 n π ≥ 5且n (1 − π ) ≥ 5 2 2 2 2 37 两个总体比例之差的检验 – 检验统计量 z= ( p1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2 38 两个总体比例之差的检验 – 检验统计量 p −p z= 1 2 ⎛1 1⎞ p (1 − p )⎜ + ⎟ ⎜n n ⎟ ⎠ ⎝ – 其中: 1 2 x + x pn + p n p= = n +n n +n 1 2 1 2 1 1 2 1 2 2 有的书上采用该公式,很接近 39 【例】 对两个大型企业青年工人参加技术培训的情 况进行调查,调查结果如下:甲厂:调查60人,18 况 进行调查,调查结果如下:甲厂:调查 人参加技术培训。乙厂调查 40人,14 人参加技术培 人 参加技术培训。乙厂调查 训。能否根据以上调查结果认为乙厂工人参加技术 训 。能否根据以上调查结果认为乙厂工人参加技术 培训的人数比例高于甲厂?(α = 0.05) 0.05) 培训的人数比例高于甲厂? 40 • H0: π1- π 2 ≥ 0 • H1: π1- π 2 < 0 α = 0.05 • n1 = 60,n2 = 40 • 拒绝域 (s): 临界值 检验统计量: 0.30 − .035− 0 z= = −0.52 0.30(1 − 030) 0.35(1 − 0.35) + 60 40 决策: 在 α = 0.05的水平上不拒绝H0 0.05 结论: α -1.645 0 Z 没有证据表明乙厂工人参加技 术培训的人数比例高于甲厂 术培训的人数比例高于甲厂 41 【 练习 】 一所大学准备采取一项学生在宿舍上 网收费的措施,为了解男女学生对这一措施的看 网收费的措施,为了解男女学生对这一措施的看 法是否存在差异,分别抽取了 200 名男学生和 法 是否存在差异,分别抽取了 200 名女学生进行调查,其中的一个问题是: “ 200 你是否赞成采取上网收费的措施? ”其中男学生 你 是否赞成采取上网收费的措施? 表示赞成的比例为27%,女学生表示赞成的比例 表示赞成的比例为 为35%。调查者认为,男学生中表示赞成的比例 显著低于女学生。取显著性水平 α =0.05 ,样本 显 著低于女学生。取显著性水平 提供的证据是否支持调查者的看法? 提供的证据是否支持调查者的看法? 42 检验统计量: • H0 : π1- π2 ≥ 0 • H1 : π 1 - π 2 < 0 α = 0.05 • n1=200 , n2=200 • 临界值(c): 拒绝域 z= 0.27 − 0.35 1⎞ ⎛1 0.31 × (1 − 0.31) × ⎜ + ⎟ ⎝ 200 200 ⎠ = −1.72976 决策: 拒绝H0(P = 0.041837 < α = 0.05) 0.041837 结论: α -1.645 0 Z 样本提供的证据支持调查者的 看法 看法 43 【 练习 】 有两种方法生产同一种产品,方法 1 的 生产成本较高而次品率较低,方法 2 的生产成本 生 产成本较高而次品率较低,方法 较低而次品率则较高。管理人员在选择生产方法 较低而次品率则较高。管理人员在选择生产方法 时,决定对两种方法的次品率进行比较,如方法 时,决定对两种方法的次品率进行比较,如方法 1比方法2的次品率低8%以上,则决定采用方法1 ,否则就采用方法2。管理人员从方法1生产的产 ,否则就采用方法 品中随机抽取300个,发现有33个次品,从方法2 品中随机抽取 生产的产品中也随机抽取 300 个,发现有 84 个次 生 产的产品中也随机抽取 品。用显著性水平α=0.01进行检验,说明管理人 品。用显著性水平 员应决定采用哪种方法进行生产? 员应决定采用哪种方法进行生产? 44 检验统计量: • H0 : π1π2≥8% • H1 : π1π2<8% α = 0.01 •拒绝域 300 , n1= α n2=300 • 临界值(c): -2.33 0 (0.11 − 0.28) − 0.08 z= 0.11× (1 0.11) 0.28 × (1 − 0.28) + 300 300 = −7.91229 决策: 拒绝H0(P = 1.22E-15 < α = 0.05) 1.22E 结论: Z 方法 1 的次品率显著低于方法 2 达8%,应采用方法1进行生产 45 8.3.3 两个总体方差比的检验 (F-test) 问题: H0: σ12/σ22=1,H1 : σ12/σ22≠1 H0: σ12/σ22≥1,H1 :σ12/σ22<1 H0 :σ12/σ22≤1 ,H1 :σ12/σ22>1 • • • • 46 两个总体方差比的检验 • 假定条件 – – • 两个总体都服从正态分布(要求较严) 两个独立的随机样本 检验统计量 s12 F = 2 ~ F ( n1 − 1, n 2 − 1) s2 2 ⎡ ⎤ s2 ⎢或F = 2 ~ F ( n 2 − 1, n1 − 1) ⎥ s1 ⎣ ⎦ 47 两个总体方差比的 F 检验 拒绝 拒绝 H0 拒绝 拒绝 H0 F1−α /2 1− Fα /2 F 方差比F检验示意图 48 两个总体方差比的检验 假设 双侧检验 左侧检验 右侧检验 假设形式 H0: σ12/σ22=1 H1 : σ12/σ22≠1 H0: σ12/σ22≥1 H1 :σ12/σ22<1 H0 :σ12/σ22≤1 H1 :σ12/σ22>1 2 统计量 s F= s s F= s 1 1 2 2 拒绝域 F > Fα (n −1, n −1) /2 1 2 2 2 2 ⎡ s⎤ ⎢或F = s ⎥ ⎣ ⎦ 2 2 2 1 F > Fα (n1 −1, n2 −1) 49 【 例 8.11】 “ 多吃谷物,将有助于减肥。 ” 为了验 证这个假设,随机抽取了35人,询问他们早餐和午 证这个假设,随机抽取了 餐的通常食谱,根据他们的食谱,将其分为二类, 餐的通常食谱,根据他们的食谱,将其分为二类, 一类为经常的谷类食用者(总体1),一类为非经常谷 一类为经常的谷类食用者 类食用者(总体2)。然后测度每人午餐的大卡摄取量 类食用者 。经过一段时间的实验,得到如下结果:检验该假 。经过一段时间的实验,得到如下结果:检验该假 设 (α = 0.05) 0.05) 分析: 总体方差未知,先检验两个总体方差是否相等。 • 若相等,为“双样本等方差假设”的单侧检验 • 若不相等,为“双样本异方差假设”的单侧检验 50 35人的大卡摄取量 样本2 650 569 622 630 596 637 628 706 617 624 563 580 711 480 688 723 651 569 709 632 568 540 596 555 496 646 607 562 589 636 529 584 681 539 617 样本1 51 F-检验 双样本方差分析(两个总体方差比的检验) 平均 方差 观测值 df F P(F<=f) 单尾 F 单尾临界 非经常食用谷物 629.25 3675.461 20 19 1.511647 0.217542 0.41666 食用谷物 583 2431.429 15 14 H0: σ12/σ22=1, H1 : σ12/σ22≠1 α =0.05, p=2× 0.217542> α 不拒绝H0,无充分证据表明 “方差有显著差异” 52 t-检验: 双样本等方差假设 非经常食用谷物 平均 629.25 方差 3675.461 观测值 20 合并方差 3147.689 假设平均差 0 df 33 t Stat 2.413 P(T<=t) 单尾 0.011 t 单尾临界 1.692 P(T<=t) 双尾 0.022 t 双尾临界 2.035 • H0: μ1- μ2 ≤ 0 • H1: μ1- μ2 > 0 α = 0.05 • n1 = 20,n2 = 15 食用谷物 583 2431.429 15 P=0.011, 有证据 有证据 表明多吃谷物将有 表明多吃谷物将有 助于减肥 助于减肥 53 两个总体参数的检验 两个总体参数的检验 均值 独立样本 比例 方差 z 检验 F 检验 配对样本 z 检验 t 检验 t 检验 (大样本) (小样本) (小样本) 54 练习1 孕期服从均值为268天,标准差为15天的正态分布。 (1)如果随机选择一名怀孕的妇女,计算她的孕期少于 260天的概率。 (2)如果随机选择25名妇女,在她们怀孕之前让她们接受 一种特殊的饮食,计算她们的孕期长度的平均值少于 260天的概率。(假设这种饮食对孕期没有影响) (3)如果这25名妇女的平均孕期少于260天, 这种饮食看起 来安全吗? 55 练习2 用包装机包装某种洗衣粉,在正常情况下,每袋重 用包装机包装某种洗衣粉,在正常情况下,每袋重 量为1000g, 标准差不能超过15g, 假设重量服从正态 分布,某天检验机器的正常情况,从已经装好的袋 中随机抽取10袋,测得重量为: 1020 1030 968 α = 0.05 994 1014 998 976 982 950 1048 问这天机器是否正常工作? 56 Excel的描述统计 输出结果 平均 意义 184.5667 标准误差 中值 模式 标准偏差 1.979154 182 196 21.68054 样本方差 s/ n 470.0459 置信度(95.0%) 3.9189 中位数 众数 s t α / 2 , n −1 s n 57 ...
View Full Document

Ask a homework question - tutors are online