导言:作为写作爱好者,不可错过为您精心挑选的10篇大数据金融论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
[48]武汉市五交家电商业协会.关于2013年全市家电行业发展情况和2014年行业发展建议[R/OL].[2014-04-15]..
[49]冯芷艳,郭迅华,曾大军,陈煜波,陈国青.大数据背景下商务管理研究若干前沿课题[J].管理科学学报,2013(1):1-9.
[50]Ernst&Young.Globalonlineretailing[EB/OL]..
近日,专业第三方电子商务、互联网金融研究机构与国内最大媒体服务平台——中国电子商务研究中心正式推出“中国电商大数据网”(100ec.cn/zt/bd/),国内覆盖最全的电商领域大数据应用一科技平台。
据(100EC.CN)监测数据显示,美国已有20%、30%的网络展示是通过大数据来售卖的,而目前中国还比较少,只有3%到4%,从这个角度来说大数据营销市场是大力可为的,有着广泛的发展空间。
[3]王喜文.日本强化ICT领域国际竞争力[N].中国电子报,2012-06-15(003).
[11]李奕.大数据应用方式:从数据服务、信息服务到知识服务[N].中国计算机报,2012-07-09(024).
[13]李晨晖,崔建明,陈超泉.大数据知识服务平台构建关键技术研究[J].情报资料工作,2013(2):29-34.
[14]秦晓珠,李晨晖,麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作,2013(2):18-22.
大数据是当前社会发展中非常重要的组成部分,在大数据时代下,我国的图书馆管理也实现了高新技术的层面,图书馆数据流量也呈现出了级数非线性增长,大数据环境的主要特点是数据量大,高速且高价值。这也使得图书馆数据系统的复杂程度以及数据的管理难度有了极大的增加,大数据平台也逐渐成为广大黑客攻击的主要目标,基于此,如何保证在大数据时代下,图书馆数据平台的安全问题也就成为了当前主要的研究课题,怎样有效利用大数据技术来构建智能图书馆,这对于提升图书馆的市场竞争能力都是非常有帮助的。
1大数据时代下数字图书馆说面临的安全威胁
1.1数据中心IT系统安全需求
1.2大数据给图书馆带来了新安全问题
随着大数据技术在图书馆应用的不断加深,图书馆数据环境具有海量存储、计数递增等特点,与此同时,数据结构模式以及数据类型的多样性特点也是非常明显的,这也导致数据处理的格式其可变性和处理速率也更加的不确定。
除此之外,虚拟化技术也是当前我国图书馆大数据应用中非常重要的技术手段之一,数据虚拟化技术是一种允许用户访问和管理的方法,图书馆在利用虚拟化技术来改善图书馆系统的同时,也极大的降低了运营的实际成本,面临着数据中心系统设备异构化等安全问题。
1.3黑客会利用大数据技术对图书馆发起攻击
其次,由于大数据时代下的图书馆网络具备非常强的社会化属性,网络数据还附带复杂、敏感等特点,因此网络数据平台已经完成了不同图书馆大数据平台的数据整合与资源共享。
1.4读者自身面临的威胁
在大数据时代下,图书馆主要是通过对用户行为数据的健康和采集来获取读者的个体特征,这些数据在确保图书馆用户服务质量的同时,也面临着泄露用户信息的威胁,而为了进一步的提高系统管理与用户服务决策的有效性,图书馆会通过扩展用户数据采集的对象来不断提升大数据几何的数据价值。
首先,数据拥有者能够通过对大部分无关的数据分析来获取用户的隐私信息,由于体术管对一些相对比较敏感的数据没有一个明确的界定,这一状况也使得很多机遇大数据的图书馆所有权和使用权也没有明确的界定。
2基于大数据的数字图书馆安全防范策略
2.1增强安全防御能力
2.1.1现安全威胁
2.1.2构建基于大数据安全威胁与防御能力的评估评价体系
大数据安全威胁与预防能力的评价主要是针对当前我国图书馆精准评估安全威胁等级和安全防范能力的关键体系,图书馆基于大数据的安全威胁评估评价体系是图书馆服务信息与系统管理数据传输的重要载体,由于网络安全关系着图书馆管理与服务安全的可靠性,所以,图书馆在数据中心的网络传统评估中,要平均的在网络上部署大量的安全检测数据采集设备,进一步保证安全评估平台的全面性和准确性。
2.2保证云计算计数和虚拟化数据的安全
在当前的大数据环境下,图书馆一般都会采用租赁等方式来采集图书信息,除此之外,我们的研究人员在对云服务平台的数据进行管理的传输的时候,图书馆最好是根据高校的计算机管理系统来实现对数据的自动化管理,不断加强对读者阅读行为的安全管理,通过建立全面、高校的监控网络来进一步实现对数据流的全程较差监管,这样也能够有效的避免数据出现非法监听和窃取。
2.3制定实施科学的大数据安全管理策略
其次,图书馆安全管理平台还要通过实时的监督管理系统来对图书馆安全威胁问题进行检测和评估,并根据安全管理平台数据反馈来实现对图书馆大数据运用平台的参数设置,提升图书馆安全管理的强度。增强图书馆管理系统的整体效率。
3结语
大数据自身的复杂性和多样性特点使得在大数据环境下的图书馆出现了很多的不可预测攻击行为,导致图书馆大数据资源在采集的过程中经常会出现很多的问题,我们此次主要针Φ鼻拔夜大数据时代下现代化图书馆的安全威胁问题进行了详细的分析和研究,并针对出现的问题提出了几点可行性的解决建议,希望可以为我国的图书馆安全问题提供有效的帮助。
参考文献
[1]蔡津津,郜新鑫,付建俐.基于业务元数据标准化的金融财经数据仓库及服务系统架构探讨[C]//中国新闻技术工作者联合会2012年学术年会、五届四次理事会暨第六届“王选新闻科学技术奖”的“人才奖”和“优秀论文奖”颁奖大会论文集.2012.
[2]周为钢,杨良怀,潘建,等.论智能交通大数据处理平台之构建[C]//第八届中国智能交通年会论文集.2013.
[3]乔向杰.基于大数据的旅游公共管理与服务创新模式研究[C]//北京两界联席会议高峰论坛文集.2013.
[4]谭胜淋,陈曦.大数据的标准化研究[C]//市场践行标准化――第十一届中国标准化论坛论文集.2014.
[5]包磊,罗兵,孙越林.大数据时代的态势评估技术思考[C]//2014第二届中国指挥控制大会论文集(下).2014.
[6]尹素格,王健,张桂刚,等.大数据技术在精确空投系统中的应用[C]//2014第二届中国指挥控制大会论文集(下).2014.
[8]飞.大数据时代中国期刊的发展机遇与探索创新[C]//第十二届2014全国核心期刊与期刊国际化、网络化研讨会论文集.2014.
[9]朱力纬,刘丽勤,王健.高校基于大数据时代的数字化校园建设研究[C]//中国高等教育学会教育信息化分会第十二次学术年会论文集.2014.
[10]孙圣力,郑志高,王平,等.RTDP系统网络体系结构及其关键技术[C]//.2013年全国通信软件学术会议论文集.2013.
[11]张岚,郭俊杰.信息安全风险评估的安全措施探讨[C]//2011年通信与信息技术新进展――第八届中国通信学会学术年会论文集.2011.
中图分类号:TU984文献标识码:A
1引言
随着云计算、物联网等的发展,新兴信息技术与应用模式的涌现,使得全球数据量呈现出爆发式增长态势,市场调研机构IDC的研究显示,到2020年,全球以电子形式存储的数据量将达到35ZB,大数据的时代已经到来[1]。最早提出“大数据时代已经到来”的机构是全球知名咨询公司麦肯锡,其在报告中指出,“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。”
1.1大数据概念
1.2大数据发展历程
2大数据研究应用评述
2.1国外大数据研究应用
2.2国内大数据研究应用
中国大数据的应用处于起步阶段,淘宝、腾讯、百度等互联网巨头是率先使用大数据技术的用户,主要是基于开源软件自主开发大数据应用,推出相应的大数据产品和平台,开展了多种深度商务分析,电信和银行领域也开始对大数据技术和服务产生浓厚的兴趣。此外,IT业、传媒界和学界举行了多次以大数据为核心的主题讨论会,共同探索大数据的发展与创新。
3大数据时代城乡规划管理技术创新探讨
3.1现有城乡规划管理技术局限性
80年代末开始,我国城市规划管理领域开始引进新技术,网络技术、虚拟现实技术、数据库技术、地理信息系统、日照分析技术、电子报批审查技术等已初步得到运用,建立了基于GIS的城市规划管理系统,但仍存在一定局限性:(1)现有管理信息系统存储能力有限,仍无法建立实时、全面的资料档案库,同时也是内部条块分割,查询、检索困难,给城市规划管理工作带来了一定的障碍。(2)由于规划管理工作量大,规划管理人员虽然借助规划管理信息系统,提升了处理速度,但是仍不能满足快速城市化背景下快速准确地处理各类城市规划案件,对规划管理实施效果进行快速反馈。(3)公众参与与市民监督平台建设不足,城乡规划管理透明度有待进一步提高。
3.2大数据时代城乡规划管理技术变革方向探讨
3.2.1建立城乡规划管理大数据集系统,提高城乡规划管理效率
3.2.2建立城乡规划管理大数据分析系统,提高城乡规划管理科学性
3.3城乡规划管理技术创新挑战
目前城乡规划管理技术创新所面临的挑战也是大数据发展应用中需要解决的问题:(1)从城乡规划管理大数据中精准定位并采集所需信息、管理海量复杂结构、实时增长的数据、保护和控制数据,数据管理挑战。(2)基于城乡规划大数据的实体识别与行为建模,挖掘大数据中蕴含的群体及其网络结构,分析社会群体的行为演化规律,数据分析挑战。(3)数据隐私性问题。
3.4城乡规划管理技术创新对策
4结论
[1]Bigdatain2020[EB/OL].[2012-12-24]/leadership/digital-universe/iview/big-data-2020.htm
[2]IDC,中国大数据技术与服务市场2012-2016年预测与分析
作者简介:黄赞,男,国家注册城市规划师,现就职于中社科城市与环境规划设计研究院,城乡规划所所长
一、大数据在经济学领域应用的基本原理
二、大数据对经济学的影响及前景
如今,随着数据样本容量的急剧增加,使得大数据的使用方式不尽相同。作为一个规律性科学,经济学需要广泛、详细的数据,并运用统计技术来处理新型数据,大数据的出现可能会在社会学与计算机科学间构建一架桥梁,其学科价值可能在于创造新的思维方式,这将会导致对经济学的新思考和研究方法创新,甚至会带来分析经济学方法的质变。
一方面,由于多维度的精细间隔,大数据可以为经济学研究人员提供更多研究变量和视角,可以研究以前难以测度的行为理论,这为经济理论研究提供了一种全新的测量方法。例如:麻省理工大学助理教授AlbertoCavallo设计的“百万价格”项目,该项目旨在通过一个网络程序,获取网上物品价格,继而运用这些数据计算得出通胀指数,该通货膨胀指数就是阿根廷的精确透明通货膨胀指标,其实时价格数据的捕捉能力和准确度,使得该指标作为政府测量通胀的替代选择。又如,谷歌提供的请求式数据选择也提供了一个探索新机会的理由,目前一个备受瞩目的例子就是“及时预报”,在某些方面它可以通过庞大经济社会数据集进行短期精确预测。
段云峰
秦晓飞
具有理学学士、工学学士和管理学硕士学位。最近十几年先后从事BI系统的运维、开发、项目管理以及应用推广等工作,参与并见证了中国移动BI系统从TB级别数据仓库向PB级别大数据平台跨越的整个过程。先后获得高级工程师、信息系统项目管理师、高级电信业务师、国际信息系统审计师等专业资格认证,并且被评为2012年山西省青年岗位能手。在《移动通信》《中国新通信》《电子世界》《信息与电脑》等杂志发表多篇专业论文,并且申报了多项国家发明专利。
目录
01大数据现状/1
1.1大数据的概念和特点/2
1.2互联网思维的故事/4
羊毛出在猪身上/4
圈客户/圈眼球/4
1.3“天变了”/5
用户变了/6
平台变了/8
金融变了/9
营销变了/9
思维变了/10
1.4大数据为什么需要互联网思维/12
大数据项目不同于传统IT项目/12
大数据产业是咨询服务产业/13
互联网思维是咨询服务产业的法宝/14
大数据“变现”需要互联网思维/15
大数据中“群众的智慧是无穷的”/15
1.5小结/16
02堪比“文艺复兴”的互联网思维/17
2.1文艺复兴的意义类比/18
艺术解放思想,思想解放生产力/19
引导了第一次工业革命/19
互联网引导新的工业4.0/20
改写金融业,改写社会/21
2.2互联网企业的发展/21
BAT的造梦/22
IT技术成为企业的核心竞争力/22
2.3互联网思维的概念/24
2.4互联网思维的特点/24
2.5互联网思维改写了手机产业/26
2.6互联网思维改变大数据/29
大数据的客户体验/29
大数据的产品化思维/30
大数据的平台思维/37
大数据的迭代思维/42
2.7大数据的新生/44
从配角到主角/44
产业化成为可能/45
大数据的春天/45
2.8小结/46
03大数据的发展/47
3.1大数据产业的发展/48
互联网改写了历史,大数据改写了互联网/48
第三次浪潮中的新兴产业/49
数据成为最大的资产/50
促进“理性社会”/51
3.2从网络运营到大数据运营/52
互联网平台如何使用用户数据/53
建立数据分析保障管理体制/55
从基础设施到产品提供/57
从网络产品到数据产品/59
3.3如何运营大数据/60
互联网基因/60
对内服务/63
对外服务/66
大数据营销/68
3.4大数据发展的瓶颈/69
与传统IT不同/70
机构和机制不同/71
新理论和新思维/71
转型更难/72
3.5小结/72
04大数据的客户体验/74
4.1客户是谁/75
内部客户/外部客户/77
个人客户/集团客户/78
校园客户/80
4.2客户的大数据需求是什么/80
取数——“取柴火”/82
取知识——“将柴火烧成炭”/83
取专业建议——“集体供暖”/84
4.3客户体验是什么/85
什么是体验/85
数据如何可读/90
“啤酒和尿布”的另一个角度解读/95
4.4客户体验如何提升/96
服务不同角色/96
娱乐思维/98
管家式服务/98
4.5小结/99
05大数据产品设计/100
5.1大数据产品背景/101
产品长什么样/101
谷歌是搜索门户还是数据门户/102
提品还是平台/103
卖咨询服务/104
智慧产品/104
5.2大数据产品内容/105
工具类/106
中间类/107
像棋谱一样的知识库/108
数据分析手机/109
互联网联通了人,数联网联通了大脑/110
5.3产品的“客户流量”/110
吸引客户/110
运营客户/111
5.4大数据产品类比/113
大数据的搜索门户/113
大数据的社交平台/113
大数据的电商平台/115
大数据的云化——在云里找数据/115
5.5大数据产品特点/115
目的决定产品特点/116
通过对比显示价值/116
更多的群众参与/116
5.6产品的界面优化/117
从苹果App中学习什么/117
结果的可视化/117
5.7产品的用户定位/117
如何让孩子看懂/118
数据的消费者/118
DIY发烧友/118
产品的商业模式/118
5.8小结/119
06大数据的极致思维/120
6.1产品的极致/121
傻瓜化的App/121
新的触摸屏在哪里/123
服务的极致/124
专家的极致/125
棋手的极致/126
智能改造之后的极致产品/127
智慧产品的极致/132
6.2思维的极致/134
兵书的知识提炼/134
参谋的极致/134
知识库和运维/135
思维的“众筹”/135
6.3营销的极致/136
点对点的精准营销/136
成本控制的极致/137
6.4“讲故事”的极致/137
吸引人的标题/138
吸引人的叙事方法/139
吸引人的数据证据选择/140
6.5小结/140
07大数据的快速迭代/142
7.1怎么“快”/143
标准零件的拼接/143
分析过程简单/143
不要追求完美,但求不断完善/144
7.2数据的标准/144
大数据是否还有逻辑模型/144
口径的管理/145
业务元数据和技术元数据/145
7.3平台的标准/146
云计算平台的标准化/146
PaaS还是SaaS/147
7.4环境的标准/148
编程规范和标准/148
软件结算的标准等/149
7.5迭代的知识积累/149
农业知识积累出的农历/149
何时更新、如何更新/150
7.6小结/150
08大数据的平台思维/151
8.1大数据的平台定义/152
数据得到丰富,取得规模效益/153
运营能够细分,拓展发展前景/153
8.2大数据平台思维的特点/153
平台越来越通用,应用越来越专业/153
孤立的数据是金,共享的数据是钻/154
数据的多维决定着平台价值的多样/154
8.3大数据的平台实体——“数联网”/154
数据交换的高效网络/155
数联网的内容/155
访问工具/160
数据管控/161
8.4大数据平台的生态环境/180
谁会购买大数据产品/181
各方获利的互联网模式/182
速度弥补精度/184
8.5平台SDK的开放性/185
平台的可编程API接口/186
数据的标准/186
数据的可读性/187
加工的简化性/188
容易参与/190
人人参与/192
8.6互联网企业的数据开放平台/192
阿里巴巴的御膳房/192
百度的阿拉丁/202
8.7人人的“数据”到数据的“人人”/204
8.8互联网平台升级到大数据平台/205
互联网平台是新时代的农业文明/205
大数据平台的价值最大化/205
电信运营商,新的电力公司or大数据公司/206
8.9小结/207
09大数据的跨界思维/208
9.1大数据跨界的背景/209
Hadoop的兴起,去了IOE/209
大数据的渗透——大数据×/210
9.2大数据跨界的定义/211
大数据跨界的特点/211
大数据跨界的展望/213
大数据跨界的案例/215
9.3大数据的业务多维/216
横看成岭侧成峰/216
数据的行业解读/216
9.4大数据的行业交叉/216
电信数据与金融数据的交叉/217
电商数据与医药数据的交叉/219
9.5小结/220
10大数据实践案例探索/222
10.1大数据提升客户体验/223
基于角色的应用/223
解决问题的应用/226
用户的GUI界面/234
10.2大数据实现产品化/238
BIStore案例/238
自助分析工具/242
用户的知识库/251
10.3大数据的极致思维/254
思维导图案例/255
大数据分析报告剧本/256
10.4大数据的跨界思维/258
大数据在交通行业的应用/258
大数据在金融行业的应用/259
大数据在制造业的应用/261
10.5大数据的平台思维/261
淘宝的API开放平台/261
某电信运营商的对外开放平台/265
10.6大数据的快速迭代/267
多波次灰度营销/267
数据字典的迭代/268
一、引言
信息是金融行业中最重要的资源之一,而数据是信息最直接的表现方式。随着电子技术发展以及世界金融市场交易规模的迅速扩大,金融行业中的数据量呈爆炸式增长趋势,如每一天世界金融产品交易数据达到500G以上,其中保险公司的数据占比达到12%(第一届CCF大数据学术会议,国家会议中心,2012年12月)。这充分说明金融行业已经进入了“大数据时代”。
按照KennethCukier在《Bigdata》中的定义,大数据又被称为巨量信息、海量数据等,指的是所涉及的信息量非常巨大,超过传统软件和技术所涉及的范围[1],而所谓的大数据技术或大数据能力就是在这种海量数据下有效的数据分析技术,即能够利用各种各样类型的巨量数据,快速获取有价值信息,并使之应用的能力[2]。鉴于金融行业的巨量数据存量以及每天的新增数据规模,大数据分析能力对其尤为重要[3],保险公司是金融行业的重要组成部分,也不可避免要面对大数据现状,充分利用巨量数据来推动业务发展和创新,提升竞争力也自然成为当前最迫切的任务[4][5]。
为了详细了解我国国内的大数据情况,我们对中国保险业进行了数据情况的统计(以下简称“中国保险业大数据背景调查”)。该统计所涉及的保险公司共122家,其中包括58家人身险公司、59家财产险公司以及5家再保险公司。在人身险公司中,中资公司35家,外资公司23家;在财产险公司中,中资公司38家,外资公司21家。这些公司的业务规模占全部保险市场的95%以上,可以认为调查结果具有一定的普遍性。
首先,大数据的本质是快速和预测,而并不关心重复数据的冗余情况,对重复数据冗余的处理其实是降低大数据应用效率的,大数据更关心的是基于整体的巨量信息快速进行决策和分析[6][7]。
其次,每家公司在经营过程中,即需要考虑公司本身特有的信息、特有的数据,同时也必然和其他公司一样面对公共的信息、公共的数据,这些数据都是他们决策基础[5]。
最后,重复的数据虽然存在但其对决策的影响其实是不同的,这和一同协作的数据有关,也和每家公司的大数据能力有关,换句话说,对每家公司来说,即使是重复的数据但也意味着不同的信息。
这种现状正是本文研究的出发点,我们将以掌握的数据为基础,在定价、巨灾分析以及健康险方面进行大数据应用研究的尝试。
二、跨部门大数据应用:寿险产品精算定价
产品精算定价能力是保险公司的核心竞争力之一,大数据在精算定价中的应用核心就是从“样本精算”过渡到“全量精算”。
对寿险来讲,保险公司基于“精算模型”,并使用“资产份额”和“宏观定价”等方法来确定实际保费。对财险公司而言,保险公司通常利用历史数据来获得“损失模型”,并通过分析各因素作用来获得最终保费。传统的这些过程中,一般只涉及公司所掌握数据的很小一部分,是“样本精算”,但为了获得更大的市场空间,保险公司有必要利用大数据来获得“定价”的比较优势,实现“全量精算”。这里我们仅以寿险定价为例来进行应用研究。
寿险公司在长期经营过程中积累了大量的数据和信息,同时外部环境变化也积累了海量数据,而传统的寿险产品定价对这些数据置若罔闻,仍然是基于保监会公布的00—03生命表和一些公司的有限信息来进行,这必然不能反映真实的风险状况,也丧失了市场竞争中的比较优势。
根据此定理,我们利用大数据的信息来进行参数估计,方法是最小二乘法或极大似然估计。保险公司仅需要在大数据的基础上,进行程序运算,给出对应的距离或其他信息,就可以得到该极值分布的具体参数。如我们以上述例子为样本,可以得到其参数估计值分别为-0.7和1.8。有了损失分布,财产险公司就可以用来进行定价或者进行分保安排,而再保险公司就可以进行风险控制。
五、结论
通过以上大数据在保险公司中的具体应用,我们得到几点结论:
第一,保险公司应该在定价中充分利用公司所掌握的全部数据,让定价从“样本精算”转移到“全量精算”上来,让每个部门数据都发挥作用,通过整合和利用大数据技术,达到更精确的风险定价,从而获得更大的定价空间。
第二,保险公司自身应该重视数据接力,甚至保险公司之间应该加强数据合作,通过针对性的保险产品覆盖来实现客户价值挖掘,扩大保险市场。
第三,保险公是不但要重视本行业的数据积累,还要重视并挖掘其他行业的数据价值,通过与自身数据的融合来实现大数据所带来的价值。
参考文献:
[1]ViktorandKenneth,BigData:Arevolutionthatwilltransformhowweliveworkandthink[M].EamonDolan/HoughtonMifflinHarcourtPress,2013.
[2]RedmanT.Theimpactofpoordataqualityonthetypicalenterprise[J].CommunicationsoftheACM,1998,41(2):79-82.
[3]张宁,云计算在保险公司信息化中的应用[J].数学的实践与认识,2012,42(27):97-103.
[4]EckersonW.DataWarehousingSpecialReport:DataqualityandthebottomlineJR.ApplicationsDevelopmentTrends,2002.
[5]EnglishLP.ImprovingDataWarehouseandBusinessInformationQuality:MethodsforReducingCostsandIncreasingProfits[M].NewYork:Wiley,1999
[6]SwartzN.Gartnerwarnsfirmsof‘dirtydata’[J].InformationManagementJournal,2007,41(3):6-12.
一、背景
二、机器学习理论
机器学习(machinelearning)是继专家系统之后人工智能应用的又一重要研究内容,在某种意义上,机器学习或将认为是数据挖掘的同义词。数据挖掘是指有组织、有目的地收集数据、分析数据,从海量数据中寻找潜在规律,并使之为决策规划提供有价值信息的技术。机器学习是人工智能的核心部分,在金融、工业、商业、互联网以及航天等各个领域均发挥着重要的作用。对机器学习研究的进展,必将对人工智能、数据挖掘领域的发展具有深远影响。
机器学习方法主要包括:ExperSystem(专家系统)、K-NearestNeighbor(K近邻算法)、DecisionTree(决策树)、NeuralNet(神经网络)、SupportVectorMachine(支持向量机)、ClusterAnalysis(聚类分析)等。近几年,研究人员将遗传算法、神经网络、系统理论以及当代数学研究的最新进展,应用于金融领域。这使得金融领域数据挖掘在金融管理中备受青睐。例如,产品定价、金融风险管理、投资决策甚至金融监管都越来越重视金融数据挖掘,通过数据挖掘发现金融市场发展的潜在规律与发展动态。机器学习理论及其在金融领域的应用成为了一个比较热的研究领域。[2][3]
三、金融数据的特点
在众多机器学习方法中,基于Logistic回归、判别分析等传统的统计方法,对金融模型假定条件非常严格,在实际应用中很难达到理想效果。其原因在于对金融数据的非线性和非平稳性的操作具有片面局限性,在实际处理金融数据时,既定假设与金融市场发展实际并不完全一致,这样可能会影响模型的推广能力和泛化能力。
四、支持向量机
大数据时代下金融专业的数学重在以下方面的应用:深度学习(DeepLearning)、机器学习和数据挖掘、分布式计算,如MR、Hadoop等,在大数据中预测最先取得突破的技术环节将会是分析中的大数据挖掘与关联分析、存储结构和系统、数据采集和数据化。目前金融问题的研究方向和发展趋势,主要集中在计量经济方法,例如,格兰杰因果分析、向量自回归、条件异方差、随机波动分析等。这些计量经济方法和技术大部分使用了线性技术,以及与金融市场不太吻合的理论假设,基于这些方法的结果,例如,资产预测价格、发展动态以及风险评估结果和实际出入较大,影响了金融管理的效率。对于我们大学教师来说,如何将已有分析数据算法整合,让学生抓住重点,挖掘到比较可靠的信息或知识,都将成为金融专业数学研究的方向和目标。
[注释]
[1]AnandRajaramanJeffreyDavidUllman.大数据――互联网大规模数据挖掘与分布式处理[M].北京:人民邮电出版社,2012.
[2]Kumar,P.R.andRavi,V.2007.Bankruptcypredictioninbanksandfirmsviastatisticalandintelligenttechniques-areview.EuropeanJournalofOperationalResearch,180(1):1-28.
[3]M.Oet,R.Eiben,T.Bianco,D.Gramlich,S.Ong,andJ.Wang,“SAFE:anearlywarningsystemforsystemicbankingrisk,”inProceedingsofthe24thAustralasianFinanceandBankingConference,SSRN,2011.