为了了解医护人员对统计软件的使用和需求情况,我们特意开展了一次专题调查。本次调查共收集了1202份问卷,其中1152份完整有效,有效问卷占比为95.84%。参与调查的对象主要为临床人员和护理人员(图1),本科和硕士学历为主(图2),职称分布比较均匀(图3)。
下面我们来看一下主要的结果。
问题1.“您正在使用哪些统计学软件?”
问题结果如图4所示。约有一半的调查对象使用SPSS,可见,SPSS为医护人员最常用的统计软件;其次excel使用者有21.6%(可能更多作为办公软件使用);GraphpadPrism由于其优秀的作图功能,使用者有10.9%,其次就是R语言、Stata和SAS等主流软件。
问题2:“您听说过以下哪些统计学软件?”
问题结果如图5所示。大致排序结果和图4差不多,只不过听过的比例高于使用的比例(这个能理解,没吃过猪肉还没见过猪跑吗?)
问题3:“您想学习哪些统计软件?”
问题结果如图6所示。大家还是想学习SPSS,因为操作简单;其次是R,因为R免费,作图也好看。当然还有21.6%的参与者啥也不想学,其实我们都想躺。
问题4:“如果您有机会学习一种新的统计学软件,您认为该软件具有的最重要的特征是什么?”
问题结果如图7所示。可见大家非常重视“上手快、容易学习”、“界面友好、操作简单”、“免费”。简单点就是好用不要钱!
问题5:“如果您有机会学习一种新的统计学软件,您最希望以什么方式学习?”
问题结果如图8所示。大家最喜欢视频课,一步一步操作看得见。
每款软件都有自己的特点,我们选择学习什么软件主要是根据自身的需求和实际情况,那么你是否知道到底有多少软件可供选择学习?每个软件的特点又是什么呢?今天我们就一起来了解一下常见的统计分析软件及特点。
首先就谈谈SPSS这个人气之王。
SPSS的特点可以简要归纳为以下4点:
(1)功能强大
SPSS是一个组合式软件包,它集数据录入、整理、分析、结果报告功能于一身,囊括了各种成熟的统计方法与模型,为用户提供了全方位的统计方法。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPV格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大地方便了中、高级用户。
(2)兼容性好
SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。随着自身产品线的不断完善,SPSS不同产品间的互补和兼容性也在不断加以改进,和其他软件之间的兼容性也较为理想。
(3)易用性强
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好、操作简单,且提供了中英文等多个语言版本,输出结果美观漂亮,使得统计分析人员对它“情有独钟”。事实上,不断地增强其易用性(而不是盲目追求方法的高精尖)几乎是近十几年来SPSS的核心改进方向。
(4)扩展性高
SAS的特点可以简要归纳为以下3点:
(1)功能强大,统计方法齐全
(2)使用简便,操作灵活
SAS编程语句简洁、短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出以简明的中文或英文给出提示,统计术语规范易懂,具有初步统计基础即可学习。
(3)结果专业,认可度高
作为目前公认的最为权威的统计软件之一,得到了国际上的认可。SAS为用户提供了详实、专业的分析结果,世界五百强企业的前100名当中,绝大部分公司都在使用SAS。
Stata的特点可以简要归纳为以下3点:
(1)短小精炼,功能强大
Stata占用空间小,但是Stata在数据管理、统计分析以及制图等功能上与其他软件相比并没因规模小而显得逊色。在Stata中键入命令,提交执行后,随即就能得出结果。即使是计算量庞大的复杂调估算程序,也可以很快得出结果。最新版的Stata能够涵盖广泛的统计模型与技术,每次的更新升级,也使得Stata能够与最新的统计技术相匹配。
(2)语法简单,易学易用
Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。Stata的命令构成与语法结构都非常的简单明了,易学易用。相近统计模型的分析指令往往是同一个命令,这使得用户在记忆使用时相当轻松。使用时可以每次只输入一个命令(适合初学者),也可以通过一个Stata程序一次输入多个命令(适合高级用户)。这样的话,即使发生错误,也较容易识别并加以修改。
(3)开放的框架,众多用户支持
Stata的构建哲学是建成一个开放的、用户可以添加自己编写的程序的软件。用户可以根据自己的需要编写所需统计量、估计方法等程序,同时网上有很多Stata用户编写的程序包可下载并使用。这些用户程序能够轻松解决许多复杂的计算和数据处理,而所有这些用户程序都能够以资源共享的形式从网络上轻松获得。
R语言的特点可以简要归纳为以下3点:
(1)免费开源
多数商业统计软件价格不菲,投入成千上万美元都是可能的。而R是免费的,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的!这对绝大多数使用者而言,好处显而易见!它易于扩展,并为快速编程实现新方法提供了一套十分自然的语言。用户可以免费获取全球各地使用者贡献的各类“包”,并直接使用,而不必要自己重新写一套算法。目前R已经提供了超过了1万个“包”可供用户选择。
(2)功能强大
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统、数组运算工具(其向量、矩阵运算方面功能尤其强大)、完整连贯的统计分析工具、优秀的统计制图功能、简便而强大的编程语言、可操纵数据的输入和输出、可实现分支、循环,用户可自定义功能。因此,与其说R是一种统计软件,还不如说R是一种数学计算的环境。
(3)优秀的绘图功能
R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。试想,仅仅一个ggplot2包就编写了好几本教材专门介绍其使用方法。
R的优点远不止上述所提,对它钟情者或许更能体会。唯一遗憾的是,R的学习曲线较为陡峭,对于新手入门较为困难。由于它免费开源的特点,许多功能都是由独立贡献者编写的可选模块,这些文档可能比较零散、很难找到,且每个用户的语法书写习惯不同,代码没有相对统一的使用定义,增加了初学者的难度。
jamovi的特点可以简要归纳为以下4点:
(1)免费、开源
相比许多统计软件高昂的价格,jamovi软件免费、开源,可以在多平台下载使用,是一款不用付费就能使用的正版统计软件。
(2)友好的操作界面
jamovi的操作界面与SPSS类似,直观易懂、操作便利。使用jamovi对数据进行统计分析,只需要通过选择菜单、填写对话框和点击按钮等简单操作即可完成,免去了复杂的程序编辑环节。分析过程,不仅可以同步得到标准数字图表,还可产生美观、高清的统计图;这些结果均可便捷地导出或复制、粘贴。此外,jamovi可以实现数据的实时编辑与管理,相应的统计分析结果也会在输出窗口及时更新,极大地提高了工作效率。
(3)灵活安装模块,避免“模块灾难”
jamovi软件具有可扩充性的特点,主菜单栏包含了常用的统计分析模块,若想实现更多的统计分析如元分析、功效分析、中介与调节模型分析、贝叶斯方法等可通过加载模块(Modules)的方式实现方法扩充,这种方式很好的规避了过多的模块使得主菜单或模块列表里过于拥挤,造成分析模块的选择和操作的不便。
(4)集成R的庞大功能
jamovi是基于R语言开发,可以与R软件无缝对接,加载Rj模块后,可通过RjEditor实现所有R软件的数据处理功能。
Python的特点可以简要归纳为以下3点:
(1)模块众多,功能强大
Python的模块众多,基本实现了所有的常见功能,从简单的字符串处理,到复杂的3D图形绘制,借助Python模块都可以轻松完成。Python社区发展良好,除了Python官方提供的核心模块,很多第三方机构也会参与模块开发,这其中就有Google、Facebook、Microsoft等软件巨头。即使是一些小众的功能,Python往往也有对应的开源模块,甚至不止一个模块。
(2)使用简便,易于学习
Python对于初学者非常友好,易于理解和学习。相比于用其他大多数编程语言编写的程序,Python程序更整洁。Python几乎没有多余的符号,且使用的是简单易懂的英语名称,阅读一个良好的Python程序就感觉像是在读英语一样。Python的这种伪代码本质是它最大的优点之一,它使你能够专注于解决问题而不是去搞明白语言本身。
(3)免费、开源
除了上述提到了常用统计分析软件以外,还存在着很多单位自主研发的一些统计分析软件,如: