卡方检验(Chisquaretest/ChiSquareGoodnessofFitTest)stardsd

卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。

该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

χ2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。

(1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。

(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。

(3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。

进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家KarlPearson在1900年首次提出的,因此也称之为Pearsonχ2,其计算公式为

其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。i水平的期望频数Ei等于总频数n×i水平的期望概率pi,k为单元格数。当n比较大时,χ2统计量近似服从k-1(计算Ei时用到的参数个数)个自由度的卡方分布。

作为学术界的领袖,Pearson先生当初发表在《哲学杂志》上的χ2论文题目为:Onthecriterionthatagivensystemofdeviationsfromtheprobableinthecaseofacorrelatedsystemofvariablesissuchthatitcanbereasonablysupposedtohavearisenfromrandomsampling.

由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ2值为0;观察频数与期望频数越接近,两者之间的差异越小,χ2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2值越大。换言之,大的χ2值表明观察频数远离期望频数,即表明远离假设。小的χ2值表明观察频数接近期望频数,接近假设。因此,χ2是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。如果χ2值“小”,研究者就倾向于不拒绝H0;如果χ2值大,就倾向于拒绝H0。至于χ2在每个具体研究中究竟要大到什么程度才能拒绝H0,则要借助于卡方分布求出所对应的P值来确定。

卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。只有当样本量比较充足时,才可以忽略两者问的差异,否则将可能导致较大的偏差具体而言,一般认为对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有4/5的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。如果数据不符合要求,可以采用确切概率法进行概率的计算。

1、四格表资料的卡方检验

四格表资料的卡方检验用于进行两个率或两个构成比的比较。

1)专用公式:

2)应用条件:

要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。

2、行×列表资料的卡方检验

行×列表资料的卡方检验用于多个率或多个构成比的比较。

要求每个格子中的理论频数T均大于5或1

3、列联表资料的卡方检验

同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。

1)R×C列联表的卡方检验:

2)2×2列联表的卡方检验:

列联表卡方检验应用中的注意事项同R×C表的卡方检验相同。

卡方检验最常见的用途就是考察某无序分类变量各水平在两组或多组间的分布是否一致实际上,除了这个用途之外.膏方检验还有更广泛的应用。具体而言,其用途主要包括以下几个方面:

(1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从Poisson分布等。

(2)检验某个分类变量各类的出现概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为1/36;掷硬币时,正反两面出现的概率是否均为0.5。

(3)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。

(4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。

(5)检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。

适用于四格表应用条件:

1)随机样本数据。两个独立样本比较可以分以下3种情况:

(1)所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。

(2)如果理论数T<5但T≥1,并且1≥40,用连续性校正的卡方进行检验。

(3)如果有理论数T<1或n<40,则用Fisher’s检验。

2)卡方检验的理论频数不能太小。

R×C表卡方检验应用条件:

(1)R×C表中理论数小于5的格子不能超过1/5;

(2)不能有小于1的理论数。如果实验中有不符合R×C表的卡方检验,可以通过增加样本数、列合并来实现。

1.应用实例——适合度检验

实际执行多项式试验而得到的观察次数,与虚无假设的期望次数相比较,称为卡方适度检验,即在于检验二者接近的程度,利用样本数据以检验总体分布是否为某一特定分布的统计方法。这里以掷骰子为例介绍适度检验的方法。

【例1】

(1)假设掷一骰子120次,各点数共出现次数为a,b为各点数出现的期望值120×1/6=20,建立工作表文件,如图1所示。

(2)设置零假设H0:观察分布等于期望分布。

(3)计算卡方检验统计量,如图2所示。

D2=(B2-C2)^2/C2

D8=SUM(D2:D7)

(4)确定自由度,(6-1)×(2-1)=5;选择显著水平α=0.05。

(5)利用Excel提供的CHIINV函数求临界值,在D9单元格中键入“=CHIINV(0.05,5)”按回车键,得临界值11.07。

(6)比较临界值和统计量,11.07>2.3,即临界值大于统计量,故差异不显著,接受H0。

2.应用实例2——独立性检验

卡方独立性检验是用来检验两个属性间是否独立。一个变量作为行,另一个变量作为列。下面一例便是介绍卡方独立性检验的方法。

【例2】某机构欲了解现在性别与收入是否有关,他们随机抽样500人,询问对此的看法,结果分为“有关、无关、不好说,,三种答案,图3中县调查得到的数据。

下面是利用Excel解决此问题的步骤。

(1)零假设H0:性别与收入无关。

(2)确定自由度为(3-1)×(2-1)=2,选择显著水平α=0.05。

(4)利用卡方统计量计算公式计算统计量,在单元格B15中键入“=(B3-B9)^2/B9”,其余单元格依次类推,结果如图5所示。

(5)利用Excel提供的CHIINV函数计算显著水平为0.05,自由度为2卡方分布的临界值,在Excel单元格中键入“=CHIINV(0.05,2)”按回车键,得临界值为5.9915。

(6)比较统计量度和临界值,统计量14.32483大于临界值5.9915,故拒绝零假设。

3.应用实例3——统一性检验

检验两个或两个以上总体的某一特性分布,也就是各“类别”的比例是否统一或相近,一般称为卡方统一性检验或者卡方同质性检验。下面一例便是利用卡方统一性检验的例子。

(1)零假设H0:南京和北京居民对最低生活保障满意程度的比例相同。

(2)确定自由度为(4-1)×(2-1)=3,选择显著水平α=0.05。

(3)求解卡方检验的l临界值,在Excel单元格中键入“=CHIINV(0.05,3)”,按回车键得临界值为7.81。

(4)计算北京和南京不同满意程度的期望值,在单元格B11和C11中分别键入“=$B$7*D3/$D$7”和“=$C$7*D3/$D$7”,选中B11:C11,按住C11右下角填充控制点,填充至C14。

(6)比较统计量和临界值,统计量1.3875小于临界值7.81,故接受零假设。

THE END
1.大神给了我一个公式,不敢独享分享给大家大神给了我一个公式,不敢独享 分享给大家 小海在远方 0 2024-11-27 09:53 坛友要的定个位甄选表,选中一组,定准一个个位,百分百9-16注中直选 百2589 十1458 个* 百147 十037 个* 百147 十269 个* 百2589 十269 个* 百147 十1458 个* 百2589 十037 个* 百036 https://m.17500.cn/arts-m/sdetail-11210687.html
2.如何将彩票信息表格打印出来(彩票怎么表格打印)在日常生活中,许多彩票爱好者喜欢将彩票信息整理成表格,以便于追踪和核对。下面,我们将详细介绍如何将彩票信息表格打印出来,让你轻松管理彩票数据。 1. 准备彩票信息表格 首先,你需要有一个包含彩票信息的电子表格。你可以使用Microsoft Excel、Google Sheets或类似的应用程序来创建表格。以下是创建表格的基本步骤: https://biaoge.zaixianjisuan.com/q/ru-he-jiang-cai-piao-xin-xi-biao-ge-da-yin-chu-lai.html
3.简单的excel公式理想股票技术论坛1. 轻松学习Excel基础公式,掌握简单的表格计算方法。 ,理想股票技术论坛https://www.55188.com/tag-09852613.html
4.掌握一些关键的Excel函数其实只要掌握了一些关键的 Excel 函数,很多事情都会变得简单得多。 比如,当你需要加班整理数据时,下面这些小小的公式就能让你更从容地应对~ ? 删除区域中的空格【除了单词之间的单个空格】=Trim(区域) ? 按指定的位数对数值进行四舍五入=Round(数值,小数位数) https://blog.csdn.net/2401_84268222/article/details/144077021
5.财务会计再忙,也要学会这2个Excel万能公式!今天跟大家分享是的对财务会计非常有用的2个Excel万能公式,这些公式不仅能帮助你提高工作效率,还能让你的财务分析更加精准。 一、完成率公式 万能公式: =TEXT(IF(总数量<0,(已完成数量-总数量)/总数量的绝对值,已完成数量/总数量),'0.00%') 或者 http://www.360doc.com/content/24/1124/12/170868_1140274638.shtml
6.我用excel做了彩票号码分析表,用了大批的函数公式,运行时才发现太我用excel做了彩票号码分析表,用了大批的函数公式,运行时才发现太慢了,有高手能帮忙解决吗爱克 查看全部4条评论回答 写回答 tangtingg 如果你使用了大量函数和公式进行彩票号码分析,在Excel中运行速度变慢了,可以考虑以下解决方法:1. 优化函数和公式:检查你的函数和公式是否存在重复计算或者冗余操作,可以考虑优化https://wap.zol.com.cn/ask/details_21051749_259373_3.html
7.怎么用Excel计算公式算彩票求Excel计算公式 共1条回答 > CLouD.: 1.先在某一空列中(也可以是另外一个工作表中),如L列中,把J列不重复的小区名称提取出来,L2中输入公式:=INDEX(J:J,MIN(IF(COUNTIF(L$1:L1,$J$2:$J$1000)=0,ROW($J$2:$J$1000),4^8)))&""同时按Ctrl+Sheft+Enter三键输入数组公式,然后下拉到出现空白https://www.3d66.com/answers_relation/relation_3600971_5.html
8.求教怎样用EXCEL公式计算彩票的单双遗漏?如下表,求当前遗漏和最大如下表,求当前遗漏和最大遗漏的公式分别要怎样写,期数号码单双 1 5 单2 7 单3 10 双 4 12 双5 18 双 6 22 双7 9 单8 28 双9 15 单10 33 单当前遗漏 2最大遗漏 4 扫码下载作业帮搜索答疑一搜即得 答案解析 查看更多优质解析 解答一 举报 当前遗漏=RIGHT(MAX(IF(ISERROR(FREQUENCY(IF(C1:C11https://qb.zuoyebang.com/xfe-question/question/9212a941980f504221ac8dad737b974b.html
9.ExcelCOMBIN函数全面指南COMBIN函数在计算彩票中奖概率时非常有用。例如,在Powerball彩票中,从69个数字中选择5个数字,可以使用公式COMBIN(69, 5),结果为11,238,513。这表示有11,238,513种不同的方式可以从69个数字中选择5个数字。进一步计算中奖概率时,还需考虑额外的条件,如选择正确的Powerball。 https://www.feishu.cn/content/combin-function
10.EXCEL做彩票排列3数据经典小公式ExcelVBA程序开发如何把EXCEL的公式直接转换到VBA程序中,直接作用于区域内的每一个单元格,也就是单元格就显示一个结果https://club.excelhome.net/thread-1049030-1-1.html?_dsign=c06c6c72
11.Excel读书笔记26——账龄分析表——IF函数经典应用示例前面我们提到过,在数据表录入信息时,一般需要通过VLOOKUP函数引入最近三个账龄期间的借方累计发生额。由于使用VLOOKUP函数进行数据匹配时要求索引信息的唯一性,所以我们需要考虑核算项目的重名问题(特别是核算项目为职员时,存在同名的概率比买彩票中500万大多了)。否则数据出了差错,你在老板面前用一句“纯属巧合”肯定是摆https://www.jianshu.com/p/21484811c64a
12.彩乐彩票welcome大厅下载app新版除了数据透视表和公式,还可以使用Excel中的“条件格式”功能来实现相同单元格数据的合并求和。在需要合并求和的单元格中,可以设置条件格式来实现这一功能。 11. 设置条件格式 在需要合并求和的单元格中,点击鼠标右键,选择“条件格式”,然后在弹出的对话框中设置条件格式。可以根据条件设置单元格的颜色或字体,从而实现相https://www.xjtrcw.com/zhiwei/company-22351.html
13.如何在Excel中生成彩票號碼?為防止彩票號碼在當前工作表刷新時自動更改,可以單擊 公式 > 計算選項 > 手動操作.使用Kutools for Excel生成彩票號碼 如果您已安裝Kutools for Excel,則其 插入隨機數據 實用程序可以幫助您立即在Excel中生成彩票號碼。 Excel的Kutools 提供300 多種進階功能來簡化複雜的任務,提高創造力和效率。 AI 功能增強,Kutoolshttps://zh-tw.extendoffice.com/documents/excel/2761-excel-lottery-number-generator.html
14.推荐一修改美化版Delphi日程日历控件界面报表Excel表格文档快速找到高于平均值的数的方法 本文将详细阐述在Excel表格文档中快速找到高于平均值的数的方法。首先介绍如何计算平均值,然后从数据筛选、条件格式、公式计算、排序筛选、数据透视表和图表分析等六个方面进行详细讲解。通过本文的学习,读者将能够快速准确地找到高于平均值的数据,并加深对Excel表格的运用理解。https://www.2ccc.com/news/Html/?774.html
15.凤凰彩票大厅APP通用app凤凰彩票大厅APP简介 好彩提供通用版的凤凰彩票大厅APP官网hc9123.com行业龙头?指定ios以及安卓app全新版本V8.16.6下载平台,凤凰彩票大厅APP官方(好彩娱乐.com)是一款探索式捉妖回合冒险手游,游戏以西游故事为蓝本,描绘了一段凡人斩妖除魔得道成仙的神话故事。https://qianfanapi.sxhonor.com/wap/thread/view-thread/tid/950496
16.excel开方公式excel开方公式课程问答最后通过工具 - 保护 -保护工作表(excel2010里是通过 审阅 - 保护工作表)。然后在单元格或编辑栏里就看不到公式了。 14、excel表格中下拉复制数字时,为什么不变大呢?怎么才能递增? 答:复制数字时,只需要按ctrl键再下拉,数字就会发生变化了。 15、excel中平方函数是哪个? https://www.300.cn/edu/wd/excel_3528.html
17.excel表格数据怎样算几率?excel函数计算几率的教程excel表格中哟1到6个数据没想要计算其排列组合的几率,该怎样计算呢?下面我们就来看看excel函数计算几率的教程,需要的朋友可以参考下 几率是我们生活中常常遇到的数学问题,最多见的就是我们买彩票中奖几率,了解几率可以帮助我们分析成功率,该怎样计算几率呢?我们可使用excek函数来计算,下面我们就来看看详细的教程。https://www.yingxiongyun.com/news/post/33934.html
18.彩票Excel攻略.doc相对于开发软件,Excel的门槛要低得多,但也别小瞧了Excel,当你对Excel的精华也就是函数部分有所了解之后,定会大开眼界,用函数能实现复杂的运算,可以统计查询检索数据,做预测表格,制作走势图表,就连软件中的缩水彩票Excel攻略相对于开发软件,Excel的门槛要低得多,但也别小瞧了Excel,当你对Excel的精华也就是函数部分https://m.taodocs.com/p-677281170.html
19.Excel彩票常用的统计分析函数大全如上表所示,最左边的是福彩3D开奖号码,两两组合最高有3种,比如713,两两组合就有13 17 37这3种;中间那列是过滤后的号码组合,我们现在要求,开奖号码两两组合的号码在组合集里面出现的次数。下面是求解上面问题的EXCEL函数公式: {=COUNT(FIND(TEXT(MMULT(SMALL(--MID(A2,{1,2,3},1),{1,2;2,3;1,3}https://www.360doc.cn/article/11610514_528588801.html
20.凤凰彩票大厅~welcome2024最新版安全下载v73389.4.7本文主要介绍了如何在Excel中设置万元为单位的教程。我们需要了解如何在Excel中设置单元格格式,然后介绍了如何使用自定义格式来实现万元为单位的显示。接着,我们讲解了如何在公式中使用千位分隔符来显示金额。然后,我们介绍了如何在图表中使用万元为单位来展示数据。我们还介绍了如何在打印设置中将金额以万元为单位打印出来http://www.mp.jianxikang.com/682/detail/95615486/