基础统计
一、描述性统计
• Select: Stat >Basic Statistics >Display descriptive statistics假设想对两组学生的身高进行 描述性统计以便比较,数据如下:
1. 填入参数
2. 输出结果
Select: Stat > Basic Statistics > Graphical Summary
假设检验广告宣传的虚假性:
手机电池的使用寿命不是按年来计算的,而是按电 池的充放电次数来计算的。镍氢电池一般可充放电 200-300次,锂电池一般可充放电350-700次。某手 机电池厂商宣称其一种改良产品能够充放电900次, 为了验证厂商的说法,消费者协会对10件该产品进 行了充放电试验。得到的次数分别为891,863,903, 912,861,885,874,923,841,836。
广告宣传是虚假的吗:
上述数据的均值为878.9,明显少于900。但是,到底均值落在什么范围内我们就认为广 告宣传是虚假的呢?
一、假设检验的原理
• 假设检验的原理是逻辑上的反证法和统计上的小概率原理
1. 反证法:当一件事情的发生只有两种可 能A和B,如果能否定B,则等同于间接的 肯定了A。
2. 小概率原理:发生概率很小的随机事件 在一次实验中是几乎不可能发生的。
• 由于个体差异的存在,即使从同一总体中严格的随机 抽样,X1、X2、X3、X4、、、,也不尽不同。
• 它们的 不同有两种(只有两种)可能:
1. 分别所代表的总体均值相同,由于抽样误差 造成了样本均值的差别。差别无显著性 。
2. 分别所代表的总体均值不同。差别有显著 性。
二、假设检验的几个步骤假设检验的一般步骤,即提出假设、确定检验统计量、计算检验统计量值、做出决 策。
1. 提出假设
在决策分析过程中,人们常常需要证实自 己通过样本数据对总体分布形式做出的某 种推断的正确性(比如,总体的参数θ大 于某个值θ0),这时就需要提出假设, 假设包括零假设H0与备择假设H1。
1) 零假设的选取
假设检验所使用的逻辑上的间接证明法决定 了我们选取的零假设应当是与我们希望证实 的推断相对立的一种逻辑判断,也就是我们 希望否定的那种推断。
同时,作为零假设的这个推断是不会轻易 被推翻的,只有当样本数据提供的不利于 零假设的证据足够充分,使得我们做出拒 绝零假设的决策时错误的可能性非常小的 时候,才能推翻零假设。
所以,一旦零假设被拒绝,它的对立 面——我们希望证实的推断就应被视为 是可以接受的。
2. 构造检验统计量 收集样本信息
利用样本信息构造检验统计量
3.计算检验统计量值 把样本信息代入到检验统计量中,得到检验 统计量的值。
4. 做出决策
a. 规定显著性水平α,也就是决策中所面临的风险
b. 决定拒绝域(critical region)和判别值(critical value)
c. 判定检验统计量是否落在拒绝域内
d. 得出关于H0和关于H1的结论
1) 显著性水平
显著性水平α是当原假设正确却被拒绝的 概率
通常人们取0.05或0.01
这表明,当做出接受原假设的决定时,其 正确的可能性(概率)为95%或99%2)
判定法则
a. 如果检验统计量落入拒绝域中,则拒绝原假设
b. 如果检验统计量落入接受域中,则我们说不能拒绝原假设
※注意:判定法则2的含义是指我们在这个置信水平下 没有足够的证据推翻原假设;实际上,如果我们改变 置信水平或样本数量就有可能得到与先前相反的结果。
3) 零假设和备择假设可能的零假设和备择假设的情况
三、单侧检验(one-tailed hypothesis)
某种果汁的包装上标明其原汁含量至少为 90%。假定我们想通过假设检验对这项说明 进行检验。
1. 检验的方向性
如果要检验的问题带有方向性,如灯泡寿 命、电池时效、头盔防冲击性等数值是越 大越好;零件废品率、生产成本等数值则 是越小越好,这类问题的检验就属于单侧 检验。
2. 单侧检验的例子
例1:一家食品公司广告说他的一种谷物一袋 有24千克。消费者协会想要检验一下这个说 法。他们当然不可能打开每袋谷物来检查, 所以只能抽取一定数量的样品。取得这个样 本的均值并将其与广告标称值作比较就能做 出结论。
请给出该消费者协会的零假设和备 择假设。解:
(一)、首先找出总体参数,这里应该是总体的均值m,即谷 物的平均重量,给出原假设和备择假设,即用公式表达两个 相反的意义。 H0 : m ≥ 24 (均值至少为 24) Ha : m < 24 (均值少于24)
(二)、确定概率分布和用来做检验的检验统计量。 我们要检验抽取的样本均值是否达到广告宣称的数额, 就可以用样本均值离标称值的标准离差个数的多少来判断。因此构造检验统计量
(三)、设定置信水平为95%。收集样本信息,假设选取了 一个数目为40的样本,计算得
计算检验统计量的值为(σ = 0.2)
(四)、查表可以得出临界值和拒绝域,也可用计算机输 出p值。计算出的Z值落入拒绝域,所以拒绝H0,即意 味着我们认为谷物的重量达不到厂商宣称的数值。
四、双侧检验
一些产品某一项指标必须满足在某一个范 围内,如精密零件的尺寸和重量、保险丝 适用的电流强度等等,这类问题的检验属 于双侧检验。
1. 两类错误
假设检验是基于样本信息做出的结论,而 我们知道样本只是代表了总体的一部份信 息,因此必须考虑发生误差的概率。
H0为真时我们拒绝H0的错误称为第I类错误, 犯这种错误的概率用α来表示,简称为α错 误或弃真错误;
当H0为伪时我们接受H0的错误称为第II类错 误,犯这种错误的概率用β来表示,简称为 β错误或取伪错误。
2. 两类错误出现的场合
3. 两类错误发生的概率两类错误发生的概率如下表所示:
4. 两类错误的关系
五、假设检验的Minitab实现:
(一)单样本Z检验(1-Sample Z)
•Select: Stat >Basic Statistics > 1-Sample Z
(二)单样本t检验(1-Sample t)•Select: Stat >Basic Statistics > 1-Sample t
(三)双样本t检验(2-Sample t)
•Select: Stat >Basic Statistics > 2-Sample t
(四)成对样本t检验(Paired t)
•Select: Stat >Basic Statistics > Paired t
(五)单样本比例检验(1 Proportion)•Select: Stat >Basic Statistics > 1 Proportion
输出结果:
(六)双样本比例检验(2 Proportion)
•Select: Stat >Basic Statistics > 2 Proportion本案例采用总结数据形式,直接填入参数:
输出结果
其它注意事项:
选择假设检验方法要注意符合其应用条件;
当不能拒绝H0时,即差异无显著性时,应考 虑的因素:可能是样品数目不够; 单侧检验与双侧检验的问题。
(七)正态性检验(Normality test)
•Select: Stat >Basic Statistics > Normality test
填入参数
注:ECDF:(Experimental Cumulative Distribution Function) 实验室累计分布函数基于ECDF检验的输出结果
基于相关分析检验的输出结果
基于相关卡方检验的输出结果
本篇文章介绍了《Minitab基础统计与假设检定》,下篇将介绍《方差分析》,请大家持续关注。
1242