开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2019.02.10
导读
对面来了一个美女,我们会首先对其打量一番,高矮和胖瘦是最直观的描述,对于数据也是一样,在获得一堆数据之后,我们也需要直观的先去看一下数据的状态:集中趋势(高矮)——平均值和离散趋势(胖瘦)——标准差。所以数据描述是第一步,其次才是对数据的深层次挖掘。
均数是生活中常用到的定量资料描述指标,计算方式就是数据之和除以样本含量。我们每天都会听到平均收入、平均成绩等平均数,但是平均数不一定都是均数,平均数只是均数的一种量化方式,并不完全等同于均数。
比如说,刚刚毕业的你在网上看到了两家公司的招聘信息,甲公司说员工的平均月薪为1万元,乙公司说员工的平均月薪为1.3万元,你可能会毫不犹豫地选择乙公司,但这个选择真的合理吗?未必如此,因为单凭平均月薪无法判断到底哪个公司更好,这种冲动的选择可能会让你错失更好的机会。
既然是平均薪资,那么肯定有人高于该值,有人低于该值,我们注重的应该是到底有多少人高于或低于这个平均值呢。我们看一下下面给出的两张图,它们的均数都是1万元,但是反映出来的情况却是完全不同的:
A公司员工收入
B公司员工收入
A公司每个员工的工资都在均数附近上下波动,并且波动的幅度很小;B公司中有一个值显得很突兀,竟然达到了3万元。现在让你在A、B两家公司中选一家,你会选择哪个呢?相信多数人会选A公司吧,除非你坚信自己能达到B公司中那个突出的值。
所以,尽管均数是相同的,它反映的情况也可能会完全不同。如果你和马云取平均收入的话,那你厉害了,你肯定觉得自己已经达到了富翁的层次,然而,这是没有价值的。(我还是很努力的,昨天我和马云两个人的财富加起来都没有马化腾多,昨晚上我连夜加班赚钱,今天一早我和马云的财务终于又赶超马化腾啦。人啊!一定要努力,不然怎么跟中国首富斗?)
这个时候就必须来看一下描述数据的波动大小,反映数据波动大小的指标就是:标准差。“波动大小”的统计学上的专业术语就是“离散程度”。标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。(方差只是计算标准差的中间环节)。
例如,一个班男生的平均身高是170cm,,方差是100cm2,那么就是标准差是10cm。可以进行的比较简便的描述是本班男生身高分布是170±10cm,而方差就无法做到这点。
再例如,对面来了一个美女,我们会首先对其打量一番,高矮和胖瘦是最直观的描述,对于数据也是一样,在获得一堆数据之后,我们也需要直观的先去看一下数据的状态:集中趋势(高矮)——平均值和离散趋势(胖瘦)——标准差。所以数据描述是第一步,其次才是对数据的深层次挖掘。
所以数据描述是第一步,其次才是对数据的深层次挖掘。
假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。简单来说:假设检验采用的逻辑推理方法是反证法。
有一天,你怀疑你的男朋友最近可能与另外一个女孩联系频繁,有变心的趋向,但是自己逻辑能力太差,不敢轻易判断自己推测的正确性,因此就请了学统计学的'侦探’来帮你破案。
于是,我就拿出了自己的杀手锏武器,也就是破案的常用套路:假设检验。
我需要明确问题是什么?
问题:女孩要验证男朋友是否变心了?
根据这个问题我提出来下面两个互为相反的假设:
零假设(H0):男孩没有变心
备选假设(H1):男孩变心了
试想,如果我们有确凿的证据证明零假设不成立,那么,它的对立面备选假设就肯定是成立的。
零假设与备择假设在逻辑上是互补的,就是一对对立事件,推翻了其中一个,对立的那个必须得到肯定,毋庸置疑!
再看这个例子,如果我能找到足够强的证据来否定零假设(也就是男孩没有变心),那么我就能信心十足的说零假设不成立,备选假设自然当选。
好了,接下来的问题就是:如何寻找证据。我们来看第2步。
证据是什么?
根据中心极限定理,我们知道,足够多的样本可以代表总体。所以我要找到男孩合理的样本数据来做证据。
接下来,我随机让女孩调查了男孩这几年的样本数据,包括上网,开房,财务等。根据女孩查到的所有数据,我利用自己的专业知识计算了零假设成立的前提下,男孩没有变心的概率。
算出的结果真是让我大吃一惊,在零假设成立的前提下,样本数据计算出男孩没有变心的概率是0.01%(是不是小到怀疑人生?)。
这个概率值有自己的专属名字,叫做p值。也就是,在零假设成立的前提下,得到样本观察结果出现的概率。
在这里p值就是在零假设成立的前提下(男孩没有变心),用样本证据计算出的男孩没有变心的概率,p=0.01%
判断标准是什么?
不能因为p值小就立马说明人家男孩变心了,错误的判断会影响他们之间的关系和生活。所以,提前制定好一个定罪的标准,有助于我能做到:不放过任何一个渣男,帮助女孩更深的认识现在的男朋友,并且做出选择。
因为我定的零假设是:男孩没有变心。所以这里定的标准是,如果男孩没有变心的概率≤5%,那么就直接否定了零假设,也就是男孩没有变心不成立。
这里比较难理解,男孩没有变心的概率≤5%,它的反面就是男孩已经变心的概率大于95%,所以男孩有很大概率变心了,因此把零假设:男孩没有变心否定了。
这里用于做出决策的标准5%,在假设检验里叫做“显著性水平”,用符号α表示,是一个概率值。
得出结论
那么,男孩到底有没有变心呢?我们将样本证据计算出的p值与'定罪’标准α比较一下就可以了:
如果pα,那么拒绝零假设,也就是备选假设成立。
如果pα,那么零假设成立,接受零假设。
你又问了,这是什么意思呢?其实:α是判断标准,也就是小于这个值就表示零假设不成立。p值在零假设成立前提下,用样本证据得出的概率,在这里表示有样本证据得出男孩没有变心的概率。
通过比较这两个值,我们会惊奇的发现:p远远小于α!
小哥哥,样本证据对你大大不利啊。本想零假设证明你没有变心的,但是被我们收集到的证据,也就是你没有变心的概率只有0.01%,这个数值与我们的标准相差甚远啊。所以,我可以大胆的拒绝零假设。
回头去看我们一开始的假设:如果零假设不成立,那么备选假设成立。现在我们已经得出零假设不成立了,所以备选假设成立,也就是男孩变心了。我将这个毫无破绽的推理过程告诉女孩后,女孩很生气,但是也很庆幸认识到了这个男人可恨的一面,立刻做出抉择:给他两巴掌后分手。
福尔摩斯说:一旦排除所有的不可能,剩下的不管多么难以置信,一定就是真相。
福尔摩斯还说过:一定要远离渣男!
总结一下假设检验的步骤
根据问题的要求提出假设,写明原假设H0与备择假设H1的具体内容;
根据的内容,建立检验统计量并确定其分布;
对给定的显著性水平α,由统计量的分布查表或计算确定出临界值,进而得到H0的拒绝域和接受域;
做出判断:当统计量的值落入H0的拒绝域时就拒绝H0,否则接受Ho。
假设检验
总体参数的假设检验是样本推断总体的一种形式。样本推断总体的假设检验有三种情况:1.总体平均数的假设检验(Z、T);2.总体比率的假设检验(P);3.总体方差的假设检验(卡方、F)。今天我们先来了解一下假设检验的基本思想。
假设检验的基本思维是:先假设,得到结论,然后用已知的材料或事实与假设得到的结论进行比较、分析,最后做出推断。
1.抽样:对100只老鼠注射一单位计量的药物
提出假设:
我们再看一个例子:
某餐厅每天营业额服从正态分布,以往老菜单其均值为8000元,标准差为640元。一个新菜单挂出后,九天中平均营业额为8300元,经理很想知道这个差别是否是由于新菜单而引起的①(还是由于抽样误差引起的——这个抽样9天的数据正好抽中了销售额最好的9天②)——提出假设
上面的两个例子的讨论就是假设检验的思想的第一步:提出假设
区别:
方差分析又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。T检验主要用于样本含量较小(例如n<30,至于>30的时候则采用Z检验或U检验,下次再讲),总体标准差σ未知的正态分布资料。t检验只能用于两样本均数及样本均数与总体均数之间的比较。方差分析可以用于两样本及以上样本之间的比较。
联系:
两者都要求比较的资料服从正态分布;而且两样本均数的比较及方差分析均要求比较都有相同的总体方差(方差齐性);配伍组比较的方差分析是配对比较t检验的推广,成组设计多个样本均数比较的方差分析是两样本均数比较t检验的推广;对于两个样本之间的比较,方差分析和t检验效果是相同的,且有:
方差分析主要用途:
①均数差别的显著性检验;
②分离各有关因素并估计其对总变异的作用;
③分析因素间的交互作用;
④方差齐性检验。
方差分析的应用下一辑再讲!
先来总结一下T检验。
T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著,如果差异显著,就说明两个均数之间是有差异的,接下来就是谁数值大谁就好。下面再用图示来回顾一下:
我们知道两个均数:x1与x2,想要看一下这两个均数之间的差异是否显著?我们的思路是通过计算:x1-x2=差,用这个“差”与“0”(作为一个基准)做比较,看一下这个差异是否显著。因为,我们首先要做一个假设H0:这两个均数(x1与x2)是没有差异的,也就是它俩的“差”与“0”相比是没有差异的,统计p值是大于0的。但是,经过计算之后,发现p值是小于0的,也就是它们之间有差异。就推翻了H0假设。(至于说x1和x2是怎么来的?这是你抽样调查的结果,比如,我们从高三1班抽样,得到高三1班的数学平均成绩是x1;从高三2班抽样,得到高三2班的数学平均成绩x2,我们想比较两个班数学成绩之间是否差异,差异是否显著?就是用T检验。把数学成绩换成某类患者的抑郁、焦虑、生活质量、自我管理能力等等都可以,思路是一样的。)
上面说的是有关T检验的图示,下面我们来看一下方差分析的思路:
我们都知道方差表示一个值距离平均值的远近程度,方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成数据围绕均值波动(数据围绕样本均值波动就是方差吗)的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的SPSS操作:
从上面的分析选项中也可以看出,方差分析是放在“均值比较这一栏”。
因为我们在比较多组均值的时候,并不是仅仅比较多组之间有无差异,还要具体分析哪两组间差异如何,所以要进行时候两两比较(这个在下一辑中细讲)。
今天我们讲解T检验——两独立样本T检验。
为什么这个论文中,判断“领导力课程参加与否”是否是RSLQ的影响因素,用的是T检验呢?
再来说一下:两独立样本T检验
两独立样本T检验(twoindependentsamplest-test),又称成组t检验。独立样本t检验跟配对样本T检验的原理是一样的,也是用来看两组数据的平均值有无差异,与配对样本t检验的区别就在于方案的设计,也就是两个样本是独立的还是配对的。比如,你选取了5男5女,想看男女之间身高有无差异,这样,男的一组,女的一组,这两个组之间的身高平均值的大小比较可用这种方法,因为男样本和女样本是独立的(互不影响)。这个独立样本t检验还会涉及到方差齐性检验,这点需要注意下。如果方差不齐,则要采用校正后的t检验,也就是t'检验。下面是步骤:
计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。在我们对计量资料进行参数估计和统计推断的时候,往往方法的选择受各种条件的限制(比如,统计原理和公式),很多护理老师很难去判断,动不动上来就进行t检验或者卡方检验,这就造成了“千篇一律的统计方法”和“千篇一律的退稿”,那么,从今天起,我们艾德医讯公众号开始通过通俗易懂的图示及案例讲解,给大家讲述不一样的统计学。
首先,今天我们给大家讲解的是t检验。t检验包括两种类型:单样本t检验、两样本t检验。今天先来看一下单样本t检验。单样本t检验是指:检验一个样本平均数与已知的总体平均数的差异是否显著。我们先来看一个例子:
如上图,我们想要比较一下山东大学和山东师范大学在校大学生身高的差异(哪一个更高?)。我们已经知道:山东大学在校大学生这个总体的平均值μ=178cm(每一个学生的身高汇总求出),但是山东师范大学在校大学生的身高μ=?我们不知道,我们知道的只是经过抽样得到的样本的身高平均值x=170cm(如果去统计山东师范大学的全部在校大学生的身高工作量有点大,我们就偷懒抽取了一个样本,用这个样本去跟山东大学的值比较),那么,我们接下来要面临两个问题:①我们抽取的山东师范大学的这个样本能否很好的反映山东师范大学在校大学生的身高(参数估计)?②用这个样本的均数怎么去与山东大学去比较(统计推断)?
我们不去管复杂的公式,我们可以试想一下,既然是样本,那么这个样本肯定是能够反映这个总体(山东师范大学在校大学生身高)的情况,从理论上讲,我们可以通过样本的身高均数x可以推断出总体身高的均数的一个范围,比如这个范围是:169-179cm,再用169-179cm这个范围值去跟山东大学身高的平均数178cm去比较,看一下哪个更大,是不是就可以判断出哪个学校在校大学生身高更高一些了?对吧!这就是单样本t检验的原理。总结一下就是:我们去调查山东师范大学在校大学生全部身高这个工作量有点大,我们就抽取了一个能够反映它的样本,这个样本的均数能够估计出山东师范大学在校大学生身高这个总体的一个范围值,然后用这个范围值再与山东大学在校大学生身高的平均数比较,看一个哪个更高(或者说这两个的差异)。
那么,到这明白之后,最后一个解决的问题就是怎么判断?——用P值。(统计学研究的最后就是研究一个屁(p))。这地方有一个判断标准就是:大同小异。意思是:p值大于0.05(大)就是相同,相同就是没有差异,没有差异也就是说两者一样;p值小于0.05就是有差异(小),异就是有差异,就是说两者之间有区别,那么这个差异到底是谁的身高更高,那肯定是谁的平均值大谁的更高了。所以,你只需要记住:大同小异就可以了。
单样本t检验就是比较一个样本平均数与已知的总体平均数的差异是否显著。我们可以理解为:我们知道一个样本的情况,通过这个样本跟所谓的常模(就是已知总体)的比较。在护理研究中的应用太多了。比如:我们随机抽样了我们产妇得到一个样本,测量这个产妇样本的心理焦虑的情况,得到一个焦虑的平均值,用这个平均值再与常模(焦虑量表的标准分50分)做比较,首先看一下两者数值之间有无差异,如果有差异,哪个均值大,再做判断。至于SPSS软件的操作那就更简单了,这都是软件帮我们做的,干就完了!
SPSS软件操作步骤
一.案例
关于三种鼻空肠管置管方法在机械通气患者中的应用研究。
二.解析
三.SPSS操作
①正态性检验
②正态检验结果
由结果得:三组的P值均小于0.05,因此应该拒绝原假设,认为数据是不服从正态分布的。所以三组差异比较应该选择Kruskal-Wallis秩和检验。
③Kruskal-Wallis秩和检验
④检验结果
正态性检验操作步骤和上述步骤一样,经检验数据是服从正态分布的,因此选用方差分析。
②方差分析
点击选项,出现如下对话框,显示栏勾选描述统计和齐性检验。
③方差分析结果
(1)方差齐性检验
由结果得:F=0.373,P=0.689>0.05,因此不能拒绝原假设,认为三组数据是方差齐性的。
(2)主体间效应检验
四.总结
本文介绍了完全随机设计中多组比较的不同方法的选择,有些研究者在拿到数据后,发现是多组比较时马上选用方差分析,这是非常错误的,必须先对数据进行基本的分析,了解数据分布的基本情况,如果不满足正态分布或方差齐性,则应该选择非参数检验,这样才能为后续工作的进展奠定正确的基础。
社区精神分裂症患者亚群分类研究
方法:采用精神分裂症患者自我管理量表和重复成套神经心理状态评估工具,对139例社区精神分裂症患者进行测评,通过聚类分析方法进行分类,比较不同类型患者的一般特征。
本研究欲将精神分裂症患者根据自我管理能力、自我效能和认知功能进行聚类,同时分析不同类型患者的一般特征在某些变量上的差异性。对不同类型患者的一般特征进行分析时,对于计量资料可以采用方差分析或秩和检验,对于双向无序列联表可以采用皮尔逊卡方检验或Fisher精确检验,对于结局变量为等级资料的列联表,则需要采用Wilcoxon秩和检验。这节我们重点介绍如何使用SPSS进行结局变量为等级资料的秩和检验。
本研究最终聚为三类,这里以文化程度变量为例,分析三类患者在文化程度等级上是否存在显著性差异,(对于其他同为等级资料的变量,操作步骤类似),数据如表1所示:
数据说明:
类型栏:1代表Ⅰ类,2代表Ⅱ类,3代表Ⅲ类;
文化程度栏:1代表小学及以下,2代表中学,3代表大学及以上。
1.数据加权(这个过程已经操作过很多遍,只要录入的数据为汇总格式,一定记得先进行数据加权)
激活个案加权系数,将人数放入频率变量,点击确定。
2.秩和检验
出现如下对话框,将文化程度放入检验变量列表,类型放入分组变量,点击定义范围,因为共3类患者,因此设置最小值为1,最大值为3;检验类型栏选择克鲁斯卡尔-沃利斯H。
3.结果解读
(1)秩
表格给出了不同类型患者的个案数以及秩的平均值。
(2)检验统计
由结果得:χ2=11.163,P=0.004<0.05,因此应该拒绝原假设,认为三组不同类型的患者在文化程度等级上存在显著性差异。
对于不服从正态分布的多组均数比较时,非参数检验也是使用的克鲁斯卡尔-沃利斯H检验,虽然方法一样,但是判断的前提却是不同的。
需要注意的是,不是存在等级资料的数据就要选择秩和检验,还要根据研究目的做进一步的判断,具体关于等级资料方法的选择,详见(解疑答惑|对于等级资料,选择卡方检验还是秩和检验?)。
评价子午流注择时五音疗法在慢性心力衰竭(CHF)焦虑患者中的应用效果。
方法:将70例CHF焦虑患者随机分为实验组和对照组,各35例,实验组实施子午流注择时五行音乐疗法,对照组实施五行音乐疗法。两组在干预前、干预后4周、8周和12周采用匹兹堡睡眠质量指数量表(PSQI)评价睡眠质量。
二.说明
1.正态性检验(以实验组得分为例)
将所有变量均放入因变量列表,点击图,出现如下对话框,勾选含检验的正态图。
2.正态检验结果
3.Friedman秩和检验
弹出如下对话框:
点击上方的'字段’,出现如下对话框,将所有变量均选入检验字段。
点击上方的'设置’,出现如下对话框,点击定制检验,在比较分布栏选择傅莱德曼检验,多重比较选择全部成对。
4.结果解读
输出的结果如上图所示,结果分别给出了原假设、检验方法、显著性以及最后的决策。由结果可得P<0.001,应该拒绝原假设,即认为实验组在干预前、干预后4周、8周、12周的得分存在显著性差异。
5.成对比较
(1)双击上述输出的表格,则可以得到下面的界面,帮助我们更好的理解假设检验摘要的结果。
(2)在模型查看器界面的查看栏中选择成对比较,如下图所示:
6.成对比较结果
由结果可以看出,干预前PSQI得分与干预后8周、干预后12周PSQI得分分别存在显著性差异,干预后4周PSQI得分与干预后8周、干预后12周PSQI得分分别存在显著性差异。
五.补充
如何正确应用t检验?
在所看到的文献中,几乎所有的两组比较均用的是t检验,因此它总被人们称为'两组万能检验’,真的是这样吗?NO,人家也是有原则的,不该用的地方可不敢随便尝试,万一误人子弟罪过可就大了。那么,到底什么情况是它不能随便接近的呢,一起总结一下:
1.多组后的两两比较不要用t检验
虽然t检验在两组均值比较中占据着'领导’的地位,但是如果你的设计有多组,并且发现可能其中两组存在差异,想分别对任意两组进行比较,这时候,t检验可就不能主动伸出援手了,因为你需要进行好几次的两两比较,整个过程的假阳性错误就会不断增加。
2.如果数据严重偏离正态,建议不用t检验
t检验一般都是要求满足正态性假定的,如果一组数据严重偏态,那么此时的均值已经不能反映数据的真实情况,这时有两种方法可以考虑:一是进行数据变换,使变换后的数据满足正态分布;二是采用非参数检验方法。注意,这里说的是严重偏态,多数情况下,轻微偏态不会对结果造成太大的影响。
3.如果两组间的方差不齐,建议不用t检验
理论上,t检验还要求两组方差是相等的,即满足方差齐性检验。一般两组方差间的比较采用F检验,用其中较大的方差除以较小的方差,若F=1,则说明两者方差相等;F不等于1,则说明不等。
4.若两组数据非独立,建议不用t检验
(1)比较同一组人群在服用某药物前后的睡眠质量差异。毫无疑问,这时候需要采用配对t检验进行分析,实质是比较两者均数的差值与0是否有统计学意义。若差值不服从正态分布,则采用秩和检验。
(2)将人群分为两组,对每组服药前后分别进行睡眠质量检测,这时候便不能采用配对t检验了,因为我们的目的不是比较组内前后的差异,而是比较两组间的差异,只是比较两组前后(服药后-服药前)的变化值。
看到了吧,t检验没有那么神通广大,在使用之前一定要先对数据情况做基本的了解,不然犯错之后,怪t检验还是怪自己呢?
提问
K个独立样本非参数检验的两两比较咋实现?
方差分析用于多组均数比较时,通常在得到拒绝原假设的结论后,还要进行进一步的两两比较,从而得到究竟是哪两组间均数不等。但是最近看到有好多朋友问,非参数检验的时候怎么没有两两比较的选择呢,我想要知道哪两个组间存在差异。既然大家都是追求细节的人,那我们就一起看看怎么办吧。
数据是3组慢性心力衰竭焦虑患者接受3种不同药物治疗后的睡眠质量得分总和,问3组患者间的睡眠质量得分是否存在差异。
为什么你们没看到两两比较的选项呢,因为你们用的是旧对话框,如下:
弹出下图:
点击上方的字段,设置如下:
点击上方的设置,设置如下:
看看输出的结果是什么样的:
“小编你个骗子,枉我那么相信你,这不还是没有两两比较的结果吗?”莫急莫急,还没说完呢,现在双击黄色部分,是不是发现了新大陆一样,如下图所示,在查看栏选择成对比较。
看结果:
这不就出来了嘛,而且软件很体贴,将两两间有显著性差异的都用黄色标注出来了,另外大家要记住,我们看的是调整后显著性哦。结果告诉我们任意两组间的睡眠质量得分都是存在差异的。
总之一句话:若想知道K个独立样本间非参数检验的两两比较结果,一定要采用新的对话框,旧对话框是不能帮助我们达到目的的。
1.先将得分数据进行分类:
医疗支持得分:0代表≤30分,1代表31-40分,2代表>40分。
点击旧值和新值,从得分最低到最高依次进行变换,从最低到值填入40,在新值框中填入'0’,点击添加,即可完成得分小于等于40的患者分组。