锲而舍之,朽木不折;锲而不舍,金石可镂。
生活就像海洋,只有意志坚强的人,才能到达彼岸。
三军可夺帅也,匹夫不可夺志也。
重复是学习之母。
学而时习之,不亦说乎。
完成工作的方法是爱惜每一分钟。
精诚所至,金石为开。
勿以恶小而为之,勿以善小而不为,惟贤惟德,能服于人。
人生应该如蜡烛一样,从顶燃到底,一直都是光明的。
3、天才就是无止境刻苦勤奋的能力。作者:卡莱尔。
一、示范
二、实习
在这个阶段,我采取“名言警句值日”的方法,开展名言警句接龙――由语文科代表首先“值日”,将自己当天积累的名言警句认真誊写在“名言警句火炬簿”上后传递给下家。就这样,轮回接力,一轮下来,正好是期中,每学期可以接龙两个回合。一般来讲,每学期可积累一百则名言警句。在接龙过程中,如果有谁失职,科代表有权处罚他重新“值日”。这样,不仅可以培养学生良好的阅读、积累习惯,更重要的是能增强他们的合作意识和责任感。
三、整理
在一个学年结束之前,即“名言警句值日”达到四个回合时,我指导学生将平时积累起来的名言警句进行分类,用专门的笔记本整理出来进行展览,让同学们大饱“眼福”,相互学习、相互促进、共同提高。名言警句共分十个类别――爱心篇、立志篇、真理篇、理想篇、青春篇、修养篇、勤奋篇、毅力篇、事业篇、友谊篇。这样的分类整理,一方面可强化学生的记忆,另一方面可为学生作文提供充足的营养,从而提高他们的写作水平。
四、仿写
所谓仿写,即以名言警句的结构特点或是修辞手法等作为借鉴,运用联想、想象,写出一句具有新意的“名言警句”。仿写同样由语文科代表按前面的要求首先“值日”,先写出名言警句,再写出仿句。如:“莫等闲,白了少年头,空悲切。”(岳飞《满江红》)仿句:“勿虚度,废了黄金时,只哀叹。”
3、从垃圾中淘宝不如变垃圾为宝。——日本民谚
大学生创造意识和发明创造能力欠缺的原因
传统教育体制是“满堂灌”的应试教育,造就了学生跟着教师走、教师跟着标准试卷走的思维模式。在学校里,按部就班、听话的学生往往被认定是好学生,而思维活跃、具有扩散思考能力的学生经常被误认为不听话,瞎折腾。在大众观念的压力之下,学生的创造精神经常被扼杀在萌芽里。在应试教育时代,分数就是人生的全部,这种观念使得学生只学习好好要考,拿到高分就万事大吉。久而久之大部分学分都是理论修养差、知识面太窄、综合能力弱。这样的高中毕业生到了大学阶段,知识容量不够,创新意识差、发明创造能力弱,难以适应社会主义市场经济对人才素质的新要求。
激发学生的发明创造意识,营造创新创造的校园文化氛围
针对大学生创造意识和发明创造能力欠缺的原因,想要提高学生的发明创造能力,首要是营造良好的校园文化氛围,激发学生的发明创造意识。通过开展以发明创造为内容的学校主题教育和实践活动、开展大学生发明创造与科技创新竞赛活动、举办大学生发明创造与科技创新成果展,营造创新创造的校园文化氛围。
(2)为了让大学生和发明创造拉近距离,在讲座中举例说明一些小的创造如何改变生活。比如说最新一代的空调,装上摄像头,就可以监控室内幼儿是否踢被,实时调整空调温度,实现家居智能化。基于电学知识而发明的捕鼠器,可以帮助很多地方改善居住环境。通过生活中的小发明创造,让学生认识到发明创造人人可为,通过学习增长知识,增长才干,也可以开发自己的创造潜能。
开展创造性思维能力训练
想要提高大学生的发明创造能力,还需要对学生进行创造性思维训练。要理论学习和实践相结合,有目的、有计划、有步骤地展开,全面提高学生的创造素质。训练的形式有集体讨论训练和个人分散训练。
集中讨论训练
集中训练主要以座谈会、讨论会形式进行,开展创造性思维广度、深度和力度训练。组织学生讨论,针对电气信息类的学生,着重查找家电产品和电子信息产品存在的不足甚至危害。针对某缺点和不足,组织学生进行创新设想,各抒己见,从众多创新设想中选出最佳方案;进行创新设想时,鼓励学生思维独特新颖,与众不同;对某产品进行创新设想时,尽量向多功能的方向思考。
个人分散训练
要求学生多观察生活,分析对生活密切的电气电子类产品。把创造设想记录好,定期和同学讨论分析其可行性,大家针对某一设想提出建议和意见。对可实施的设想,组织实施。开展个人分散训练,目的在于培养创新精神,养成创新习惯。
学习发明创造方法,指导创造实践
创造技法主要有还原法、智力激励法和缺点列举法。还原法是把创造的起点回归到产品创造的原点上,它可以帮助创造者克服习惯性思维。智力激励法是利用智力激励讨论来集思广益的方法。缺点列举法是列举产品缺点,然后针对产品的不足,提出创新设想的方法。将三种方法综合运用,指导大学生从小发明创造入手,通过联想、类比、组合、移植、演变、逆向思维等方式,结合创造技巧,开拓扩展思路,产生大量创新设想,寻找更优方案。
为促进激励推进相应的保障措施
加强基础条件建设,为学生开展发明创造活动提供保障
充分利用现有实验室、创新基地,组织学生开展形式多样的科技创新活动,积极引导学生开展发明创造,鼓励学生多出成果、出好成果,为广泛开展发明创造活动奠定基础。
实施创新创业训练计划
针对有意向进行发明创造的学生,学院派专业老师组织全面的创新创业训练计划,提高专业的创新素养,逐步进行发明创造活动。
定期组织学生参加电子设计大赛
为了训练电气信息类大学生的发明创造能力,将理论和实际结合,学院每年都会组队参加广西区电子设计竞赛,优胜队伍推荐参加全国电子设计竞赛。这种参赛经历对电气信息类的学生进行发明创造活动是非常重要、可贵的。
制订鼓励大学生开展发明创造、申请专利活动的计划,组织专利申请培训
针对大学生本身的发明创造能力的激励措施
研究设置创新学分及其实施方案
设置创新学分,根据每个创新科技成果的分量等同于一定的选修课的学分。在市级创新类型活动比赛中的奖项,等同于专业选修课的2个学分。在省级创新类型活动比赛中的奖项,等同于专业选修课的3个学分。在国家级级创新类型活动比赛中的奖项,专业选修课等同于4个学分。
研究设立发明创造成果奖学金及其实施方案
为了激励大学生的发明创造,给大学生进一步进行发明创造提供一定的经济支持,设立发明创造成果奖学金。如果发明创造成果是市一级认定,奖励500元人民币。如果发明创造成果是省级认定,奖励1000元人民币。如果发明创造成果是国家级,奖励1500元人民币。
研究学生发明创造能力评估与毕业设计、就业、保送研究生挂钩的实施方案
在就业时,进行过发明创造的学生在简历上面的经历相对丰富,有说服力,更能打动用人单位的心。在推荐毕业生的时候,针对那些发明创造成果丰富的学生,就业指导老师可以直接推荐给相应的用人单位,为学生提供更好的就业环境。
目前,很多学生愿意进一步读研深造。为了改善研究生的生源,可以将保研政策和发明创造成果(含专利、论文、创新成果、比赛奖项)挂钩,进一步激励学生的发明创造热情,为学生读研究生提供相应的奖励政策。
针对指导学生发明创造的教师的激励措施
为了进一步辅助学生进行发明创造,需要给指导学生进行发明创造的指导老师一定的激励,加深效果。
对相应的指教老师进行物资和精神奖励
对发明创造成绩突出的指导教师,根据成果的级别高低(国家级、省级、市级),分别给予800元、500元和300元的物资奖励,并发相应的优秀指导教师荣誉证书,以资鼓励。在年终考核的时候,将学生的发明创造成果纳入指导教师的考核数据,参与学校的年终评比。
一、引言
近年来,随着语料库翻译学的不断发展,国内外已经出现了开展基于语料库的翻译文本词汇的搭配特征研究,然而利用语料库对中医英译文本中词汇搭配的实证研究并不多见。中医文本在词汇方面具有很多鲜明的特点,有着大量固定的短语和搭配,因此本文作者利用语料库,对动名搭配在中医英译文本和医学英语原文文本的使用情况进行统计研究,进而对比分析得出医学文本中动名搭配的规律,旨在为中医文本的英译提供一些参考,即如何在中医文本英译中选择合适的词语进行搭配,发掘词汇搭配对中医文本解读与翻译的现实指导意义。
二、研究设计
(一)研究对象和问题
目前国内外对动名结构的研究主要是从文体、语法和语义等方面进行,本文侧重于动名结构在语义方面的研究,即如何通过词语搭配来体现医学语言的特点。
本文致力于解决以下两个问题:
1、医学语言中动名搭配有什么特点?2、英译中医文本与医学英语原文在动名搭配上有什么不同?
(二)语料与研究方法
研究分为三步:语料的检索与选择、语料的对比与分析、结果的对比与统计。
首先将所选的翻译英语语料经过文字扫描和格式转换为Word文档,校对后汇总成为一个小型中医英语语料库。为了便于提取研究数据,对语料库进行词性附码标注,并对标注结果做人工抽检,尽可能保证标注的准确性。然后用AntConc软件对自建的小型中医英语语料库进行统计分析,得出高频动词的使用情况,选择其中三个作为分析对象,随机各抽取200组动名搭配,并分析这三个高频动词的搭配使用情况,最后通过BNC语料库进行检索,得出这三个高频动词在不同类型文本中的搭配情况,然后借助统计软件Excel进行统计分析,找出医学英语和其它类型文本的动名搭配的不同,进而为英译中医文本的词汇搭配提供参考。
三、数据统计与分析
(一)~频的统计
词频是指某一词项或某一类词汇在语料库中出现的总频数,统计词频可以为语篇的文体或者语体特征提供某些参考信息。词语搭配研究的中心应是实词的行为,搭配研究应主要选择实词为节点词进行,功能词或语法词的行为大都已由语法学家作了详尽的描述[4]。因此,本文选择节点词的第一标准就是实词。而且在四大类实词(名词、动词、形容词和副词)中,名词和动词的搭配能力最高,因此进一步将本文研究的节点词界定为动词。英文文本库常用的统计数据包括以下几项:形符(Token)数、类符(Type)数、类符/形符比(Type/TokenRatio)、词长(WordLength)、平均词长(AverageWordLength),等等。本文采用WordSmith5.0对自建的中医英语语料库作了常用参数统计,获取总体统计信息,然后按照词形频率从高到低对该语料库的动词词形进行排列,选取前20个词,其结果见表1。
因本文研究的重点是医学英语文本的动名搭配,所以从表格中选择了其中三个与医学联系较为紧密的动词:influences,caused,treating。
(二)动名结构搭配词的提取
用AntConc软件检索自建的中医英语语料库中这三个动词(influences,caused,treating)的搭配,要求搭配词必须是名词词性,而且其充当的句子成分是做宾语。因此,研究时对不符合研究要求的搭配词予以剔除,分别为这三个动词留下符合要求的200组显著性搭配词。因为BNC自带检索数据分析功能,能够选择在不同年代不同体裁文本中的搭配,所以直接把这三个动词(influences,caused,treating)输入BNC中,选取符合研究要求的搭配文本,然后与之前的数据进行定量和定性相结合的分析。
(三)数据的分析
从表2中发现,动词influence在原生英语语料库中与sphere搭配最多,其次是与decisions搭配,而在翻译英语语料库中与factors搭配最多,其次是与range搭配;从表3中发现,动词cause在原生英语语料库中与trouble搭配最多,其次是与harm搭配,而在翻译英语语料库中cause往往以被动形式出现,与damage搭配最多,其次是与problems搭配;从表4中发现,动词treat在原生英语语料库中与patients搭配最多,其次是与symptoms搭配,而在翻译英语语料库中treating往往以进行时态出现,与disease搭配最多,其次是与pain搭配。
本文研究发现,原生英语语料库中所选的节点词的搭配数目要明显高于翻译英语语料库中的搭配数目,这表明医学英语原生文本在用词方面变化多,用到的词汇量要大于翻译文本,这一点没有超出预料,毕竟英译中医文本多是由译者完成,在用词方面没有原生英语文本丰富。在翻译文本中一些高频词汇搭配的表达方式,一旦被广泛接受,就可能进入目的语,成为多个近义表达式的翻译对应项,因此可以部分证实翻译语言倾向于词汇简化现象。
翻译文本中搭配模式的常规化指的是非典型搭配词在翻译文本中比例较小或没有。非典型搭配词指不是其基本义的,而是修辞性的、俗语的、变体的等的搭配词[5]。本文研究表明,与原生英语文本相比,翻译文本中动名搭配在整体上具有常规化的倾向。以动词“treating”为例,在原生英语文本中该词的搭配词中有不是该搭配词的基本义,而是修辞性搭配词,往往是在口语语料中出现俗语化。但是该词的修辞性搭配在翻译英语文本中未找到,在翻译语料中动词“treat”往往与名词disease的搭配,而且表现为“treating…diseasewith…”的固定搭配。如将中医术语“寒因寒用”译成“treatingcoldwithcold”就比“usingmedicinesofcoldnaturetotreatpseudo-coldsyndrome”简洁得多,而且更加符合英语的语法规则。
翻译文本中异常搭配指的是由翻译引入的外来的不符合目的语常规的搭配,即翻译文本读起来有翻译腔。目前语料库的技术手段还有限,对异常搭配的判定主要是依据人的判断、词典和语料库的查找[6]。因此,对本文选取的三个节点词的搭配是否存在异常搭配情况只能通过人脑来判定。筛查后发现,翻译文本中这三个节点词仅仅只存在少量的异常搭配,而且搭配的名词大多是在原生英语语料中没有对应词的中医术语,这些异常搭配可以不予以考虑。这一点表明,翻译中医文本时受源语影响而产生的异常搭配特征不明显。
四、结论与启示
总结起来,基于语料库的英译中医文本中动名搭配特征的类比研究发现如下:
(1)与其它文本相比,医学语言中的动名搭配更为简炼,被动形式使用较频繁,动名搭配模式相对比较固定,医学词汇的选择体现出医学语言专业性与简明性的特点,搭配结构简单,逻辑性强;
(2)英译中医文本的选词范围较医学英语原文相比有些狭窄,而且节点词对搭配词语的影响程度远远不如目标语,体现出译者翻译时受源语的影响,选词有一定的局限性,在动词使用上与目标语有差异。
语料库可以为中医文本翻译提供大量真实自然的语言数据,更加客观全面地显示中医英语的特点和内在规律。运用中医英语语料库研究词汇搭配特征,有助于探索中医英语翻译的普遍规律,把握翻译文本自身的特征,为中医英语术语标准化提供事实上的依据。同时,通过检索本族语者的语料库,探索医学英语词汇的构成规律以及习惯搭配,深入挖掘医学英语词汇涵义,可以为中医文本的英译提供新的翻译思路和翻译方法。
――――――――――
参考文献:
〔1〕王克非.语料库翻译学十五年[J].中国外语,2008(6):9-14.
〔2〕Olohan,M.IntroducingCorporainTranslationStudies[M].NewYork&London:Routledge,2004:233-250.
〔3〕Toury.G.DescriptiveTranslationStudiesandBeyond[M].Amsterdam/Philadelphia:JohnBenjamins,1995:208-209.
关键词:格萨尔人名词汇音节切分
目前我们暂以《格萨尔王传》中著名诗篇
一、人名词汇的音节分类方案
1.单音节人名
《格萨尔王传》中极少出现单音节人名,但其中若干姓氏用一个音节表示的情况较多,诸如:
根据我们目前的统计,尚未在格萨尔史诗中发现单音节人名。
2.双音节人名
格萨尔史诗中出现的双音节人名基本都是以单纯人名为主,并未发现任何附加在名字前后显示身份等内容的信息。
例如:
3.三音节人名
三个音节的人名多是在名字前后附加了姓和身份。例如
4.四音节人名
四音节人名在格萨尔史诗中出现较多,成为音节分类中出现数量较多的人名类型,多数是在名字的前后附加了身份等方面的信息。例如:
5.五音节人名
五音节的人名在格萨尔史诗中属于相对出现较少的类型,仅有部分人名的乳名、美名和地名信息等内容组成。例如:
6.六音节人名
六音节人名一般是在人名前后附加地名、身份、部落名等信息组合形成的称谓。诸如:
7.七音节人名
七音节的人名多数是由姓名、地名和性格等附加信息组成的称谓。例如:
8.八音节人名
八音节的人名出现较少,同于前述六、七音节的人名,这类人名也是多数由姓名、地名、尊号等信息共同构成。诸如:
9.九、十音节人名
就我们收集到的材料而言,目前尚未发现九个音节的人名,但十个音节的人名数量仍有个别出现。例如:
二、人名语音的切分方法
1.格萨尔史诗中几乎未出现单音节人名,若有出现也可为单音节来切音,不会混淆于其它人名。
2.双音节的人名在格萨尔史诗中属于数量最多的类型,基本都是以双音节作为语音切分点。
3.三音节的人名多数以双、单语音切分点的形式表现,但也有个别人名以单和双的语音切分点的形式表现,大体归纳为如下:
4.四音节人名基本都以双音节为语音切分点划分,几乎没有单音节的语音切分现象。
5.五个音节的人名在格萨尔史诗出现较少,在语音切分上主流以双双单形式划分音节,也有个别人名是单双双形式的进行音节切分。
6.六音节的人名都是以双双双形式的音节语音切分。
7.七音节的人名在语音切分上没有一致的音节语音切分,相对其他分类而言规律性较弱。
8.八音节的人名都是以双音节为单位进行语音切分,目前尚未发现单音节切分点的人名出现。
9.九个或九个以上音节的人名在格萨尔史诗中只个别出现,基本除格萨尔王的别称外没有其他的人物名称。
三、结语
《格萨尔王传》中出现海量的人物形象,人物名称的音节变化多样,尤其部分人名具有多个别称,诸如格萨尔王即有十数个称谓,多是终其一生不同的友人和敌人出于各自立场对其进行褒贬,因而形成的形成各种称名,此类人名的出现,给研究者造成极大困扰。将这些人物名称进行嗜返姆掷嗪脱芯浚对于构建格萨尔知识库的工程而言有着难以估量的意义,这些工作的共同开展,又将会极大的有助于理清格萨尔史诗中诸多人物之间的相互关系,从根本上推动和提升当前关于《格萨尔王传》的研究能力和认识水平。
参考文献
[1]《仙界占卜九藏》,兰州:甘肃民族出版社,1982年。
[2]《花岭诞生六部》,成都:四川民族出版社,1980年。
ResearchonFuzzyClusterMethodintheDivisionofHi-techEnterprises'Lifecycle
WEIHang,ChenQin-qun
(InformationTechnologyCollege,GuangzhouUniversityofChineseMedicine,Guangzhou510006,China)
Abstract:Accordingtothefeaturesofhi-techenterprises,thepaperputsforwardaclusteringmethodbasedontheimprovedfuzzyc-meansalgorithmtodividetheirlifecycleintodifferentstages.TheFCMalgorithmisimprovedbasedonthesituationofinitializationandexclusionofisolatedpoints.Inaddition,empiricalAnalysisonChina's351high-techenterprisesshowsthattheimprovedalgorithmismorescientificandwillofferanewthinkingforthedivisionofhi-techenterprises'lifecycle.
Keywords:hi-techenterprise;lifecycle;fuzzyc-meansclustering
1概述
将企业的成长过程划分为若干阶段,根据不同阶段所具有的经济学特性,分别研究其经营管理问题并形成决策,属于阶段理论范畴。由于其具有较强的针对性,阶段理论广泛在企业中得到应用。高新技术企业也是企业,其存续发展也同样会具有企业阶段性特征。同时,高新技术企业又有其自身的特点,如高智力密集、高风险、高收益、高成长和高竞争等。因此,如何对高新技术企业进行分阶段性研究,是管理者及投资者越来越关心的问题。
目前,对高新技术企业成长生命周期的研究,主要集中定性分析其阶段性的特征,对企业的整个发展过程如何划分为具有不同特征的各个阶段的研究较少,一般是凭经验人为划分。有鉴于此,本文试图探讨一种非经验的方法――模糊C均值(FuzzyC-Means)算法。大多数高新技术企业并没有严格的属性,其所处的阶段具有过渡性的性质,没有明确的界限。当利用模糊聚类引入了隶属度这一概念时,则可很好地体现这一事实。模糊聚类结果可以得出某企业属于不同阶段的隶属度,能够更有效地帮助管理人员与投资者进行分析。特别是在无法确知总体的分布函数时,采用模糊聚类可以获得较好的效果[1]。但是,在高新技术企业生命周期的划分中,考虑到FCM算法的主要缺点,本文着重从初始聚类中心的选取、孤立点数据的检测与处理两个方面进行改进,以提高聚类质量和划分的客观性。
2模糊C-均值算法
在模糊C均值聚类算法中,每一个数据点按照一定的模糊隶属度属于某一聚类中心。这一聚类技术作为对传统聚类技术的改进,由JimBezdek于1981年提出。该方法提供了一种如何将多维空间的数据点分成特定数目的群的途径。
FCM算法的目标函数为:
式中dij=vi-xj为第i个聚类中心与第j个数据点间的距离,m∈[1,∞)是一个加权指数。
模糊c均值聚类的算法思想是:迭代调整(U,V),使得目标函数最小。其中模糊聚类算法初始化聚类中心的典型的做法是从所有数据点中任取c个点。
3FCM算法在高新技术企业生命周期划分中的改进与应用
3.1对初始聚类中心和聚类数目c的选取
在高新技术企业生命周期的划分中,由于对考察对象认知的不完整,要确定聚类数目c是有困难的。因此,我们根据最大最小距离法[3]进行初始聚类中心的选择,这样可找到较好的聚类中心,聚类数目c也随之确定。
3.2对孤立点数据的检测与处理
模糊C均值算法是基于距离的算法,聚类结果受数据集中孤立点影响较大。我们利用了相似系数和对孤立点数据的检测[4]和改变隶属度的约束条件对孤立点进行处理,这样可以有效降低孤立点数据对FCM算法的影响。
其中隶属度修改为:
当修改后的隶属度应用于聚类中心公式时,隶属度小的数据对象对聚类中心的影响降低了。
3.3改进的FCM算法步骤
根据以上分析,我们可对传统的FCM算法进行改进,具体步骤如下:
1)数据的预处理:孤立点的检测、清除与数据归一化。
2)聚类中心初始化:根据最大最小距离法选择初始聚类中心V(0)={vi},(i=1,2,…,c),其中c为聚类中心个数。设置迭代计数器b=1。
3)用式(2)计算或更新划分矩阵U(b):对于任意的i,j,如果存在,则有:
(3)
若果存在i,r,使得dir(b-1)=0,则有uir(b)=1,且对j≠r,uij(b)=0
4)更新聚类中心V(b)。
5)计算价值函数。如果它相对上次价值函数值的改变量小于某个阈值,则算法停止。否则,令b=b+1,转向步骤2。
3.4应用实例
3.4.1样本的选取与样本特征的选取
本文主要以我国上市的297家高新技术企业(截至2009年2月28日,通过2008《高新技术企业认定管理办法》[6]的企业),以及*市*开发区的54家高新技术企业为实验数据样本。
3.4.2实验数据的预处理
将所采集的数据做以下预处理:
1)孤立点的清除:
本文采用相似系数和的方法从351个样本中检测出2个孤立点,经分析后确定1个异常点,清除后得到有效样本企业350个。
2)归一化:
由于数据之间量纲与范围不同,为了保证各目标具有等效性,便于以后的模糊聚类算法的实现,需要对原始数据进行处理,使之无量纲化与归一化。
其中n为实验样本高新技术企业数,k为特征指标数
3.4.3高新技术企业生命周期的划分
首先,本文采用最大最小距离法进行初始聚类中心的选取,确定了5个初始聚类中心v0(如表2所示)。
基于企业生命周期理论,结合高新技术企业的特点[9]分析,这5个初始聚类中心分别是处于种子期、初创期、成长期、成熟期以及衰退期较具有代表性的企业的相应特征量。当聚类中心确定后,结合Bezdek等[8]的建议,在1.5~3之间采用不同的加权指数m,进行FCM运算,经过对比m为2.0时,聚类分割精度、迭代次数和分割速度整体效果较好。
接着,设定ε=0.001根据上文所所述改进的模糊C均值算法具体步骤,经过多次迭代并不断修正聚类中心,直至收敛为止,目标函数变化曲线如图1所示。
从图1可以看到,目标函数经12次迭代后,很快趋于收敛,这样可以保证聚类中心的稳定性。最终获得不同阶段下的聚类中心v(如表3所示)和隶属矩阵U。
表3各阶段的聚类中心
最后根据已经得到的聚类中心或隶属矩阵U,依据“择近原则”或“最大隶属度原则”,这样就完成了高新技术企业生命周期的划分。
3.4.4结果分析
鉴于条件限制,本文采用随机抽样、分层抽样方式采取分类精度检验的样本。随机抽样用来检验所获取的高新技术企业信息的整体情况,随机采样23个;分层抽样旨在检验模型是否可以很好地适应每个生命周期阶段信息的变化,设计从所划分的结果按种子期、种子期、初创期、成长期、成熟期以及衰退期各抽取6个样本,共30个样本点。
从表3中可以看出,改进的FCM算法的效果要好于传统的FCM算法,提高了划分高新技术企业生命周期的客观性。
4结束语
本文针对高新技术企业在各个生命周期所呈现的不同特征,提出了一种基于改进的模糊C-均值算法(FCM)的生命周期划分方法,主要是从初始聚类中心的选取与孤立点数据的检测与处理两方面对传统的FCM算法进行改进。此方法既可以避免传统FCM算法中随意选取初始模糊分类中心可能带来的失真现象,又可以排除孤立点对聚类结果的干扰,提高了聚类分析的质量与可靠性。运用其于我国351家高新技术企业的实验数据样本中,结果表明,该方法对高新技术企业生命周期的划分是可行、有效的。
参考文献:
[1]LundyM.ClusteranalysisincreditScoring[M].CreditScoringandCreditControlNewYork:OxfordUniversityPress,1993.
[2]董国华.一种改进的聚类算法及其在说话人识别上的应用[J].微计算机信息,2004,33(2):133-135.
[3]周涓,熊忠阳,张玉芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006(6).
[4]姜灵敏.基于相似系数和检测孤立点的聚类算法[J].计算机工程,2003(11):183-185.
[5]RAMACHANDRAAR,SRINIVASVV.Regionalizationofwatershedsbyfuzzyclusteranalysis[J].JournalofHy-drology,2006,318:57-79.
[6]国家科学技术部办公厅关于印发《高新技术企业认定管理办法》的通知[Z].国科发火[2008]172号.