" id="b1img" alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO">
  • " alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" />
  • " alt="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" title="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" />
  • " alt="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" title="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" />

别了网工——我的数据分析之路(十)假设检验

资源分享2018-06-18 itlogger阅读(99) 评论(0)

假设检验——批判性思维

1.假设检验步骤

(1)问题是什么?

零假设/备选假设:零假设(虚无假设)是做统计检验时的一类假设。零假设的内容一般是希望证明其错误的假设。与零假设相对的是备选假设(对立假设)

检测类型

抽样分布类型:大样本(正态分布),小样本(t分布),其他

检验方向

(2)证据是什么?零假设成立时,得到样本平均值的概率P

(3)判断标准是什么?显著水平 $\alpha$(常用0.1%,1%,5%)

显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取α=0.05或α=0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。

(4)做出结论 p<=α 拒绝零假设则备选假设成立;$p>α,接受零假设

P值(P value)就是当零假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明零假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝零假设,P值越小,我们拒绝零假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

a)显著水平

b)置信区间

c)效应量

效应量是指由于因素引起的差别,是衡量处理效应大小的指标。与显著性检验不同,这些指标不受样本容量影响。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。

2.假设检验类型

(1)单样本检测:检验单个样本的平均值是否等于目标值

(2)相关配对检验:检验相关或配对观测之差的的平均值是否等于目标值

(3)独立双样本检验:检验两个独立样本的平均值之差是否等于目标值

单尾检验:右尾>,左尾<

双尾检验:两端各占$\alpha/2$

#单样本检测实例
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
dataSer=pd.Series([15.6,16.2,22.5,20.5,16.4,19.4,16.6,17.9,12.7,13.9])
sample_mean=dataSer.mean()
sample_std=dataSer.std()
sns.distplot(dataSer)
plt.show()

n=10
se=sample_std/(np.sqrt(n))
se
0.9428149341201592
pop_mean=20
#手动计算t值
t=(sample_mean-pop_mean)/se
t
-3.001649525885985
#python包直接计算t值,双尾检验的p值
from scIPy import stats
t,p_twoTail = stats.ttest_1samp(dataSer,pop_mean)
t
-3.001649525885985
p_oneTail=p_twoTail/2
p_oneTail
0.0074582071244487635
#假设判断标准(显著水平)α=5%
alpha=0.05
#左尾判断
if (t<0 and p_oneTail<alpha):
    print('拒绝零假设,有统计显著')
else:
    print('接受零假设,没有统计显著')
print ("单样本t(9)=-3.0,p=0.0074,α=5%,单尾检测(左尾)")
拒绝零假设,有统计显著
单样本t(9)=-3.0,p=0.0074,α=5%,单尾检测(左尾)
#求置信区间
#查t表,95%置信水平,自由度n-1对应的t值
t_ci=0.0645
se=stats.sem(dataSer)
a=sample_mean-t_ci*se
b=sample_mean+t_ci*se
print ("置信区间:95% CI=("+a.astype(str)+","+b.astype(str)+")")
置信区间=[17.109188436749246,17.23081156325075]
#求效应量
d=(sample_mean-pop_mean)/sample_std
d
-0.9492049239364257

0.94>0.8,因此效果显著

转载请注明 :IT樵客
文章地址:http://www.itlogger.com/res/2537.html
标签:,
相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注