随着税收管理信息化建设的深入,税收数据实现了省局大集中,这为税源管理、税收分析决策提供了一个良好的应用平台。如何通过税收数据分析应用促进提高税收管理的整体水平,是当前需要研究的重要课题。随着税收信息化建设的不断推进,以及其它税收业务应用系统的推行、完善和拓展,加上内联网络各系统的应用,使各类涉税数据信息日益丰富,为信息资源在税收工作中的广泛应用提供了广阔的空间。如何盘活海量数据信息,进一步加强数据信息资源的开发和利用,让它们发挥应有的效果,实现信息管税新跨越,为领导决策提供依据,已成为目前亟待解决的一个问题。
税收信息数据是税收管理的基础。这些数据是全省地税系统的宝贵资源,通过适当的加工处理和提炼分析,不仅可以强化税源管理,提高日常工作效率,而且还能够提高地税部门对经济税源的分析能力和监控水平,为各级领导决策提供科学、合理的依据,更好地指导税收征管工作。
从全市地税系统来看,2008年临川区地税局在本局的行政办公软件中加一个“旅店式”税源管理,后来随着个体户变化逐渐增大,管理员没有及时进行登记或变更,就逐渐没有进行运用。到现在为此,此软件已没有运行了。只保留了2008年的有关数据。
乐安县地税局开发了可视化税源管理软件,目前已经在全市范围内推广使用。
基层税务部门没有建立健全适应信息管税的管理体系,县局、分局、税收管理职能部门、税收管理员实施信息管税没有明确的管理分工和管理责任,影响着信息管税的质效。
一些基层县、分局(所)税收管理员不知道征管系统提供了哪些数据,不会查询数据或由于存在技术困难无法实现数据应用的需求。
很多领导没有打开机器自己动手查询的意识和习惯;业务职能部门没有熟练掌握数据查询的操作技能,统计数据仍然习惯于向基层索要然后汇总的传统方式。
充分应用数据指导税收征管的意识不够,靠数据分析、决策、处理问题意识不强。各数据管理部门联系不紧密,各自为政,单打独斗,缺乏统
对税收征管数据的利用仅仅局限于基本汇总、分类、简单计算基础之上的对原始税收数据的“复制式”展现和对税收现象的“陈列式”描述,应用仅限于报表浏览、简单查询、数据比对、简单的收入分析等,数据应用的范围不广,利用程度不高,服务于征管的作用没有得到很好发挥。
分析应用只满足于单一的业务需要,而不能够通过数据分析有效监控管理行为和执法行为,不能从区域、行业等深层次对区域间的税源进行动态分析和对比,不能对纳税人的税源变化进行综合的、动态的分析监控,没有把“静态数据”没有变成“动态信息”,为领导提供决策的作用不明显。
虽然一些报表在征管数据系统中都能生成,但上级局各有部门仍然需要基层手工报送各类报表,加重了基层税务部门向上级税务机关报送大量报表的负担。
数据管理的主要目标是通过各项管理措施提高数据质量,为数据应用打好基础。离开了数据质量,数据分析应用就成了无本之木,无水之源。抓好数据质量就是把住数据进入系统的各个入口,从税务登记的一个项目,从申报表的一行数据开始,一丝不苟、严肃认真地对待每一项业务,认真核实、修改数据监控系统发现的每一笔错误,这决非一朝一夕就能做好、见效的事情;数据分析应用工作也是一项系统工程,受制于人员素质、数据质量、外部数据采集等诸多因素,无法一蹴而就,需要长期的努力和坚持,不是短期行为。
认为一个系统会解决所有的问题,通过数据分析能够查找所有的管理漏洞,通过数据监控可以发现所有的薄弱环节。对系统的严密性和数据分析应用的期望值过高,导致一旦出现一些问题后不能正确认识,甚至把一些人为操作的因素也归结为系统问题,“怨天尤人”,抹杀了众多普通工作者的辛勤劳动成果,给数据管理和分析应用带来负面影响。
由于没有一套涵盖税收所有业务的涉税信息指标体系和数据采集标准,采集录入数据信息随意性较大,质量不高,与纳税有关的第三方信息采集渠道不畅,采集的信息深度和广度不够,数据信息质量影响着涉
税信息分析的应有价值和对税源的有效监控。由于开展数据分析应用,是一种谋划工作的主动意识,无形的工作,上级局没有严格的指标考核,部分人就不会利用系统数据查找管理漏洞、有效监控日常管理工作、提升管理水平,被误认为一种“可做可不做”工作。
数据分析的结果虽然在一定程度上促进了税收管理工作提升,取得了成效。但由于信息化应用一定程度上超越了当前的税收管理水平,征管软件上线后,多次进行的数据清理核查发现的错误数据,反映了我们现有的管理手段、管理水平的粗放落后,与系统要求科学严密的业务流程存在着一定差距,征管系统的全面应用某种程度上超越了当前的税收管理水平,或者说部分地区的管理水平、管理手段与系统所要求的严密的工作流程不适应。
信息管税,既是税务部门落实科学发展观的长远性基础工作,也是解决当前税收征管问题的有效措施。因此,各级税务机关要牢固树立信息管税的思路和理念,充分利用江西地税管理信息系统数据,来破解征纳双方信息不对称的问题;以涉税信息的采集、分析、利用为主线,树立税收风险管理理念;以健全税源管理体系为手段,加强业务与技术的融合,进而提高税收征管水平。
优质的数据有利于促进管理,优质的管理有利于促进收入,是多年实践验证的真谛。要进一步抓好数据信息采集、加强对数据信息整理与存储、分析与运用、加工与管理,紧紧抓住信息管税的核心,通过完善制度建设,依靠先进的管理和技术手段,制定规范的数据管理办法,确保数据采集的真实、准确、全面。对税务登记、纳税申报、发票管理等基础信息资料,采集录入时,要做到完整性、真实性、及时性、准确性,杜绝虚假数据的录入,提高基础数据质量。
税收数据分析利用是落实信息管税的核心,也是信息管税工作的难点所在。要在提高对数据分析利用的重视程度的同时,应着力提升信息应用深度,拓展应用广度,提高应用效率,注重应用实效。
开展税收数据分析利用,数据是手段,管理是关键,税收是目标。要建立适应信息管税要求的管理体系,让基层税收管理员,中间的管理层、上面的决策层按照不同的管理职能,调整角色,形成纵向上下之间、横向部门之间,职能配置、协调配合机制。
局领导要根据上级要求和本地税收管理实际制定征管措施,要利用数据管理平台,对税收计划执行情况、分区域、分行业税收经济运行情况等进行分析,用数据揭示经济发展、产业结构、行业税收征管状况之间的内在联系,实现对税收管理的科学决策。在税收管理中发挥“指挥中枢”的作用。
具有税收管理职能的税政、征管、计会等部门负责对决策层制定的工作规划、举措进行具体的组织实施。管理人员利用数据管理平台提供的数据模型,根据决策层的要求采取有效措施进行组织落实,并根据业务需求,采取关联分析法,从宏观上针对不同地域、产业、行业和注册类型等制定切实可行的管理办法,指导分局和税收管理员强化税收征管,并要进行多角度、多层次、分类别的分析评估,从微观上对单个纳税人进行“一户式”查询分析,提高管理的针对性。
税收管理员负责对纳税人进行日常监管、对管理层制定的各种管理办法进行具体的贯彻执行。利用数据管理平台提供的分析和监控功能,对本辖区纳税人征管情况进行分析评估,有针对性地加强管理。监控功能主要包括对非正常户、临时户、注销户、停业户、零申报户等异常户申报征收情况的监控,对所有纳税业户申报情况的多角度分析监控,对纳税户税负变化情况的监控,对纳税户发票使用、缴销情况的监控等。
建议省级应逐步设立征管数据分析利用处理中心,负责全省征管数据分析和处理,研究和制定数据分析利用处理机制,统一业务流程和分析指标,建立数据分析利用考核体系,防止业务部门之间或业务部门与信息技术部门之间不协调、不适应,导致工作中推诿或“踢皮球”,同时,市县一级要落实机构和人员从事征管数据分析应用专(兼)职工作,负责全市、县级数据分析应用工作安排部署,发布市县级征管数据分析指标,指导督促数据采集、录入、分析、应用等工作,汇总和上报《征管数据分析应用报告》。各基层税务所要做好征管数据采集、录入工作,保障数据质量和时限要求,结合辖区实际,抓好纳税户基本数据统计查询和数据比对工作,提出一定的税收管理性建议和措施。基于此,上级局应正式发文,明确市、县局成立独立的运行维护组织,选派业务素质、技术素质较高的人员充实到运维队伍中来,担当起数据管理与应用的重任。县局应以文件形式明确承担运行维护工作的部门、人员,这是开展工作的基本保障。
各部门齐抓共管,形成合力,共同做好数据质量和数据分析应用。征管信息系统涵盖了税务登记、发票管理、待批文书、稽查法制等全部业务流程,涉及税政、征管、稽查、法规、办税服务厅、税务分局(所)等诸多部门。要想对各个环节、各个部门进入系统的数据进行有效监控,提高数据质量,要想从各个部门的业务需求出发开展数据应用分析,单纯依靠某个部门的力量无法完成。简言之,征管系统是整个税务局的系统,不是哪个部门的系统。但是由于目前各项工作在机构、人员、业务分工上的相对独立,在工作的安排部署中的部门负责意识愈加突出,因此加强部门配合、协调联动就显得尤为重要。
高校教育大数据的分析挖掘与利用
摘要,本文从高校教育大数据的汇聚融合与挖掘应用的角度,分析了如何运用教育大数据技术推动大学管理和人才培养的创新改革的思路和方法。首先,分析了教育大数据对高校现代化、精细化、规范化管理的4个价值,其次,给出了高等教育大数据技术平台的基本技术架构,第三,结合教育大数据实际应用,介绍了陕西省高等教育质量监管大数据中心、mooc中国、西安交通大学教学
关键词,高等教育,大数据,分析,挖掘
高校大数据分析挖掘至少有四个典型价值,一是使得大学的管理更加精准高效,可以朝着智慧治理、分类管理、过程监控、趋势预测、风险预警的方向发展,真正实现基于大数据分析规律的精准治理,改变管理的模糊性,二是可以更加准确地分析评价课堂教学的质量,过去我们对课堂、对老师的评价是定性和模糊的,而在大数据智慧课堂的模式下,可以真正实现采集样本的持久化,采集方式
进行数据交换与对接
显然,这样一个大数据平台必须是一个高性能的计算平台,没有这样的基础设施一切无从谈起,所以去年我们学校花了很大的力气做了两件事,一个是把校内二级单位原来小的集群计算进行整合,形成学校统一的高性能云计算平台,既面向校内的科学研究、人才培养提供服务,其实也可以为社会提供合作共建共享模式。目前,我们已建立了一种自我造血机制,四两拨千斤,以这个平台吸引更多的外部资源,努力扩展平台的性能和应用
目前,我校的高性能平台除了应用于材料、航天、能动、信息等大型科学计算之外,还开展了以下三项典型的大数据应用
案例1,陕西省高等教育质量监控与评估大数据应用
图2所示的是陕西省高等教育的整体架构。其数据基础是来自陕西省100多所高校的各种办学状态数据,有将近700个表格,以及陕西省教育厅各个职能部处的各种各样的管理数据,此外还有行业第三方提供的数据,包括招生、就业数据等等,这个平台上我们开展预测预警、查询在线分析、信息发布、统计决策等等,主要是为省级教育管理部门、评估机构、教育管理机构提供各种各样的办学状况的分析、统计、关联分析
建设全省高等教育大数据服务平台,实时采集各高校的办学状态数据,其根本目的是为了汇聚全省各高校的办学状态数据,打破数据孤岛,融合各方数据,实现横向关联比较、纵向历史分析,提供精准服务,支持科学决策
首先,该平台面向省教育厅提供了11项功能,从根本上解决了原来各处室间的数据孤岛的问题,实现了数据融合,横向关联,纵向融通,这个数据和各个高校是实时融通的,为省教育厅领导和职能部处提供了领导仪表盘、各职能处室的专项服务、81张高基表及年报年鉴表格的自动生成、绩效分析、招生就业及办学指标计算、教育评估等功能,从根本上解决了数据碎片化及其治理问题
其次,面向全省高校辅助决策,为高校领导以及校内各个职能部处提供了系列功能,包括办学情况综合分析和在线查询,专业结构分析比较,校级的教学质量监控评测体系,教师管理等等,这些功能非常实用,这是大学实现精细化、规范化、现代化管理的必备基础。以我校为例,我们过去教师的数据可能在人事处、教务处、科研院等学校的职能部门,采取本平台以后,把教师有关的所有数据都进行了融合,打通了所有原来割裂的数据。从去年开始,我们学校的职称评聘,年度考核全部基于这一平台,全部在大数据里,建立健全了基于数据驱动的精准化服务,解决了数据碎片化历史遗留问题,实现了从管理信息化向服务信息化的根本转变
第三,为本科教育教学评估及专业认证提供技术支撑。鉴于本平台能提供比较全面的高校办学状态数据,便于专家在进校之前全面系统地掌握学校办学的情况,找到问题,精准查看验证,提高效率,给高等教育评估提供了重要支持。基于本平台,我们成立了中国西部高等教育评估中心,接受陕西省教育厅指派的省属本科高校的审核评估和专业论证。如果没有这一高等教育大数据平台的支撑,工作量和难度是极其巨大的,甚至难以实现
案例2,mooc中国技术平台
mooc中国成立于2015年1月,到目前为止已经有121所高校加入,理事单位40家,会员单位80家。该平台的宗旨是,做政府想做的,做社会愿意做的,做单一高校做不了的事情。例如,真正解决校际资源共享、学分互认等,开拓远程教育国际化等未来发展的难题。图3给出了mooc中国的技术框架。其核心是互联网+教育,实现互联网教育从1.0到2.0的升级。基于这一平台,既要开展网络教育业务的国际化,比如我们牵头成立的“丝路大学联盟”,其目的之一是借助mooc中国平台,实现网络教育业务的国际化,通过mooc中国平台,面向“一带一路”国家开展开放教育和技能培训
到目前为止,mooc中国已经有了9911门课程,用户将近600万,其中光it培训的有500多万,学历教育在读
学生50多万
案例3,西安交大教育教学大数据分析挖掘与应用
学校非常重视教育信息化技术融入和应用到教育教学之中,去年一次性建成了80个智能教室,把物联网技术、云计算技术应用于智能教室和教学一线,基于物联网技术实现教室设备的集中管理、智能控制,同时,将互联网技术深度融入到教室的管理当中,除了多媒体的直播录制功能以外,还提供了学生考勤和专家的精准督导,通过云平台来集中管理各个教室,比如说开投影机、关电源、关多媒体设备等等,都可以通过后端的云平台集中管控,真正实现教室管理的数字化、智能化、精细化,提升了教学保障的能力,也大大提高了教室管理的效率。更重要的是,这些教学的过程数据可以全程采集下来,获得数据,有了这些数据,就可以做精准化分析服务,建立西安交大教学质量大数据监测中心目前,我校的教学大数据主要包括两大部分,一是教师在授课过程中的全程录制的课堂实况,二是学生在学习过程中产生的大量日志数据。基于这个平台,我们可以开展教育教学的大数据关联分析,开展课堂教学质量的综合评价,实现正面激励、负面惩戒、精准督导,实现教学评价从模糊宏观到量化精准、从每学期制到持续常态、从部分随机到全面覆盖、从事后评价到实时动态的根本转变。通过评价激励老师敬畏课堂,评选精品课堂、示范课堂,在全校内进行正面
表彰,另外也作为教学质量评价的重要依据,包括教师的职称晋升,评选最喜爱的老师等等
此外,本系统还为学院领导和管理部门提供了针对性的信息服务与决策支持,以数据说话,量化分析,改变了以前我们的模糊评价,采取多维度、全覆盖、持续化、精细化的过程评价与监控
第三步,才是人机对弈,从职业选手到世界围棋冠军,通过这样不断的对弈完善算法,校正学习,使得alphago具有强大的智能计算能力。alphago的难点在哪,其关键在于在一个巨大的落子空间选一个最大的收益点,或者落子点,称之为movepicker,,函数,这个空间很大,有10170次方,在如此庞大的计算空间中选择最优函数,只能依靠高性能计算平台
alphago为我们研究大数据问题提供了思路和启发。我们在研究教育大数据问题中需要着力攻克以下理论与技术难题
第一,大数据造成了严重的认知碎片化问题。比如,大家在百度搜糖尿病会检索出4440万个数据源,谁也看不过来,并且里面还有一大堆真假难辩的数据。所以,碎片化知识的聚合是一个非常基础的难题,高度的碎片化降低了知识的可用性,造成了分布性、动态化、低质化、无序化等典型的问题
一方面是知识的碎片化,另一方面是每个人的兴趣和需求还不一样。所以,资源的碎片化整合以及个性化推荐是今后人工智能中的关键问题。我们的思路是,一方面,我们要
从资源的角度把无序、分散、低质的资源进一步重组以后形成知识点,形成有序的知识地图,另一方面,要对学习过程进行跟踪,实现兴趣、个性、情感等方面的动态分析与挖掘,两者结合起来,建立基于用户兴趣和个性的资源推荐,最后实现个性化精准过滤,通过知识地图面向用户提供导航学习,从而缓碎片化知识的问题。开展这一研究也要建立庞大的基础数据,就像刚才讲的alphago,光靠智能软件肯定不可能那么聪明,需要建立庞大的知识地图、知识图谱,并将其放到了国际开源社区和开放数据平台之上第二,碎片化知识的聚合问题。其目的是解决“既见树木,又见森林”的问题,破解“学习迷航”、“认知过载”的问题。我们正在承担国家自然科学基金重点项目,研究如何将多源、片面、无序的碎片化知识聚合成符合人类认知的知识森林,找出主题与主题之间的认知关系,最后形成一个知识森林,其中需要解决主题分面树的生成、碎片化知识的装配、知识森林生成、学习路径选择与导航等有关知识地图、知识图谱构建与应用等许多基础性关键技术
第三,学习行为的分析和挖掘技术。网上学习最大的好处我们可以把教师和学生所有的教与学的行为记录下来,讨论、作业、习题、笔记及进度记录下来,有了这些数据,我们可以进行后续分析,开展学习行为的特征识别和规律发现等等,既可以跟踪挖掘某个个体的学习规律,也可以找出一
教育是全人类、全社会发展的基础性事业,随着互联网+技术全面渗透和深度融入教育教学,不仅产生了大量的课程资源和学习内容,而且还产生了巨量的教育教学管理数据、行为数据、服务数据,蕴藏着巨大的价值,亟需我们开展深入研究,可谓前景广阔,挑战巨大,
,编辑,王晓明,
大数据模式下的精准营销
背景:爱点击的客户,国内最知名的电子商务网站之一,希望能提高roi(投资回报率)和线上交易数量
挑战:客户已经使用了网站再定向技术来实现一个较好的roi,但是,从再站内定向所带动的交易数量开始有下降的趋势。
优化策略︰利用多重数据的整合,提升转化漏斗每一阶段的人群数目,以提升总转化量
第一步:网站再定向
有了全面的追踪和分类,再定向受众数量的基数大幅增加。在短短两个星期内,交易数量显着提升,尤其是来自老访客的成交量更是大幅提升44%。
第二步:搜索再定向(searchretargeting)及购买第三方受众分类数据
第三步:利用机器学习(machinelearning)进一步扩大客户的数量
什么是机器学习(machinelearning)(摘自维基百科wikipedia)机器学习是人工智能的核心,根据数据或以往的经验,通过设计算法来模拟背后机制和预测行为,并获取新的数据。这是一个重新组织已有的知识结构使之不断改善自身性能的过程。研究者可以
通过机器学习来抓取现有数据的特征来预测未知的概率分布,找到新的具有相同特征的数据并加入库中。机器学习中最关键的就是开发出能智能识别复杂模式并能智能化决策的算法。