KeywordsAtmosphericaerosol;Aerosolsingleparticle;Chemistrycomposition;Aerosollasertimeofflightmassspectrometer;Adaptiveresonanceneuralnetwork
1引言
目前已用于质谱数据分析的方法多为离线分析,如等级聚类分析(HCA)、主成分分析(PCA)、模糊C均值(FCM)[5]、自组织特征映射神经网络(SOM)和自适应共振算法(ART2a)[6~8]。本课题组利用FCM和ART2a算法对气溶胶质谱进行离线聚类分析[5,8],取得了较好的效果,但无法满足实时在线快速提取信息的要求。目前,在线聚类分析质谱数据方面的工作鲜有报道。
ART2a神经网络算法与其它算法相比,其最大的特点是能快速识别遇到过的质谱模式类型,即存储在数据库中的聚类中心所代表的模式类,并且能够根据环境输入,自动将不同于已知质谱模式类但又具有相似特征的输入归为新的一类,并将学习到的这个新类的聚类中心保存下来,作为一种新的模式类参与以后的分类。简单而言,该算法具有无需监督、可灵活控制分类精细程度、快速有效识别已记忆质谱模式类以及根据环境变化自适应快速识别和学习新类的特点,非常适合气溶胶粒子化学成分的在线聚类分析。本研究在前期离线聚类分析基础上,利用ART2a算法开发实时的化学成分分析软件,将其加载到ALTOFMS质谱采集控制系统中,并对实验室环境下和大气中的气溶胶单粒子进行在线分类,对粒子分类后的分类信息在采集控制系统中实时显示。实验证明,此算法可对气溶胶单粒子的化学成分进行在线聚类分析,并可以较好地运用到整机系统中。
2实验部分
2.1实验装置
2.2数据预处理
在线聚类分析中的ART2a算法是离线聚类分析中ART2a算法的简化版本,前者省略了后者中的重复迭代过程,缩小了后者中学习速率的作用范围。这是为了保证存放在数据库中的聚类中心的稳定性,其余步骤相同,见文献[8]。简化的目的是在保证数据库中聚类中心稳定的情况下,通过牺牲少量的分类精确度,实现实时分类当前采集到的气溶胶粒子。在线仿真时单粒子的分析速度可以达到50个/s,而单粒子的采集速率仅为5个/s,因此,在线聚类分析的速度完全可以跟得上粒子的采集速率。
3结果与讨论
3.1NaCl气溶胶单粒子在线聚类分析
根据离线聚类分析的经验值[7,9],本实验中警戒阈值和学习速率分别取0.1和0.05。
3.2警戒阈值对NaCl粒子在线聚类数的影响
本实验考察了警戒阈值参数。实验发现,加大警戒阈值,可以增加在线分类数、提高分类的精细程度。图2为不同警戒阈值与聚类数的关系。当警戒阈值
3.3NaCl和CaCl2气溶胶粒子混合物在线聚类分析
用Devilbiss40#分别产生多分散的NaCl气溶胶粒子和CaCl2气溶胶粒子,将其混合在10L棕色瓶中,用ALTOFMS进行检测。实验共获得255个有效质谱数据,分为5类,各聚类的粒子个数(所占比例)、主要质谱峰和物质类型如表1所示。表1基于ART2a算法的聚类概述(略)
3.4三聚氰胺气溶胶单粒子在线聚类分析
以三聚氰胺为例研究有机气溶胶单粒子的在线聚类分析。图3a为三聚氰胺(C3H6N6)典型的正、负离子解吸/电离(LDI)质谱。正离子质谱中,m/z127为分子离子([C3H6N6+H]+),m/z85为三聚氰胺开环分子重排失去H2NCN的碎片离子峰([C3H6N6+H-H2NCN]+),m/z68为m/z85脱去NH3的碎片离子峰([C3H6N6+H-H2NCN-NH3]+),m/z60应为三聚氰胺开环分子重排失去HNCNCN的碎片离子峰([C3H6N6+H-HNCNCN]+),m/z43应为m/z60脱去NH3的碎片离子峰([C3H6N6+H-HNCNCNNH3]+)。负离子质谱中m/z26是可以标识的,为CN-。图3b为三聚氰胺单粒子的在线聚类中心:负离子质谱在m/z26,41和66处有明显信号,这与其质谱完全吻合;正离子质谱在m/z18,23,39和43处有明显信号,m/z127处没有信号,原因是大多数有机气溶胶粒子的LDI谱峰复杂多样,且常存在金属离子的干扰,分子离子峰本身质量数比较大,探测效率很低(三聚氰胺分子离子峰的探测效率仅有0.2%),软件未分析出来,这就是牺牲少量的分类精确度,换取质谱的实时分类。随着实验方法和实验条件的完善和提高,分子离子峰的探测效率会相应优化,此软件可以很好地应用到有机气溶胶粒子的实时分类。
3.5大气气溶胶单粒子化学成分在线聚类分析
在前面研究的基础上,对大气气溶胶单粒子进行实时在线聚类分析。图4为实验过程中截取的质谱采集控制系统软件界面。在质谱采集控制系统[13]基础上增加了实时的化学成分分析模块,对粒子分类后的分类信息在图5左侧中间的列表控件中实时显示。当采集到的质谱不属于已加载的质谱数据库时,在线聚类名称以newcluster1,newcluster2,newcluster3……命名。命中的103个粒子被很好地聚为4类,被成功分类的粒子数占命中粒子总数的100%。
4结论
参考文献
1SuessDT,PratherKA.Chem.Rev.,1999,99(10):3007~3035
2XUSiQi(徐思琦),XIEZhouQing(谢周清),LIUWei(刘崴),YANGHongXia(杨红霞),LIBing(李冰).ChineseJ.Anal.Chem.(分析化学),2010,38(2):219~224
3XIAZhuHong(夏柱红),FANGLi(方黎),ZHENGHaiYang(郑海洋),KONGXiangHe(孔祥和),ZHOULiuZhu(周留柱),GUXueJun(顾学军),ZHUYuan(朱元),ZHANGWeiJun(张为俊).ChineseJ.Anal.Chem.(分析化学),2004,32(7):973~976
4ZHOULiuZhu(周留柱),ZHUYuan(朱元),GUOXiaoYong(郭晓勇),ZHAOWenWu(赵文武),ZHENGHaiYang(郑海洋),GUXueJun(顾学军),FANGLi(方黎),ZHANGWeiJun(张为俊).ChineseJ.Anal.Chem.(分析化学),2005,33(11):1551~1554
5GUOXiaoYong(郭晓勇),FANGLi(方黎),ZHAOWenWu(赵文武),GUXueJun(顾学军),ZHENGHaiYang(郑海洋),ZHANGWeiJun(张为俊).SpectroscopyandSpectralAnalysis(光谱学与光谱分析),2008,28(8):1713~1717
6SongXH,HopkePK,FergensonDP,PratherKA.Anal.Chem.,1999,71(4):860~865
7MurphyDM,MiddlebrookAM,WarshawskyM.AerosolSci.Tech.,2003,37(4):382~391
8LINYing(林莺),GUOXiaoYong(郭晓勇),GUXueJun(顾学军),XIAWeiWei(夏玮玮),ZHENGHaiYang(郑海洋),ZHANGWeiJun(张为俊),FANGLi(方黎).SpectroscopyandSpectralAnalysis(光谱学与光谱分析),2009,29(3):580~584
9GuoXY,ZhaoWW,HuangMQ,FangL,ZhangWJ.OpticaApplicata,2007,37(3):229~235
10DenisJP,KevinPR,AnthonySW,DavidBK,MurrayVJ.Anal.Chem.,2001,73(10):2338~2344
11ZHANGShuDong(张树东),XUMingKun(许明坤),KONGXiangHe(孔祥和).SpectroscopyandSpectralAnalysis(光谱学与光谱分析),2007,27(4):799~802
[关键词]超支化聚合物,高度支化聚合物,树枝状大分子,超支化聚矾胺,超支化聚酉旨胺,超支化聚氨醋,分子设计,新方法,荧光,荧光超支化聚合物,激基缔合物,碎灭,两亲性聚合物,两亲性超支化聚合物,自聚集,花标记,花探针
1.主要内容
结论
1.1自然语言理解的含义
广义“语言”是指任意有结构的符号系统。在这之中,自然语言和形式语言是常用的最关键的两种语言。然而狭义“语言”是说人类在社会生活中发展出来的用来互相交际的声音符号系统,是“自然语言”。
“自然语言理解”又名为人机对话,说的是让计算机根据这种语言所传递的指令做出相对应的回应的体系。
1.2自然语言理解技术的含义
(1)自然语言是非常繁琐的符号系统。
(2)自然语言所有层次都具有非常高的不稳定性。
(3)自然语言是时时刻刻都在改变的,它在人们的日常生活中变化,在不同语言的使用者之的相互影响和发展。
(4)自然语言是人们交流思想的工具。
2自动理解系统涉及到的问题
(1)人类拥有独立的语言能力,可以做出词与词之间的区分,为了使计算机能够达到类似的效果,需要将有可能用到的词语搜集到计算机系统中并构建相应的词语库。
(2)人们是通过识别出题目语句中的各个成分来对应用题题目进行理解的。计算机必须具有对句子中重要成分进行划分并标注,才能拥有像人类一样的能力。
(3)本文的最终目的是为了理解应用题,分析句子成分之后如何提炼成分之间的数量关系,即如何将题目中涉及的知识提取表述出来。
综上所述,为获得能达到以上三点要求的一个系统,应解决如下问题:
①句子成分的自动分析
句子成分的自动分析意味着识别出句子中的各个单词。这包括了确定句子中的各个成分,以及判断不同成分的必要性,并如何实现其中的具体过程。
②题目所含信息的提取与表示
题目所含信息的提取与表示则意味着要在分析句子成分后提取有效的信息,并将这些信息以计算机能够理解的方法进行表达。
3句子不同成分的分析
3.1语义块
语义块在句子中起着最小语义构成单位的作用,常用词或短语来表达。语义块的具体分类如下所示:
(1)主语义块:主语义块是句义中最重要的成分之一,可以将他们的组成部分分成核心部分和说明部分。
(2)辅语义块:相比于主语义块显得无足轻重。
在概念网络理论中,特征语义块的上装代表前说明成分,特征语义块的下装代表后说明部分。特征语义块的构成可表示如下:
E=上装+Ek+下装公式1
其中,Ek是E块的核心部分。
3.2句类
句类定义了句子的语义类别,具体分类如下所示:
(1)基本句类:基本句类只表达作用效应链的一个环节。
(2)混合句类则表达作用效应链的任意多个环节。
E语义块可以构成效应句、作用句、转移句、过程句、状态句和关系句。每一个基本句类有其下属类别,下属类别之下还可以再分子类。
3.3概念层次网络理论的句类分析技术
概念层次网络理论的句类分析技术是专门为了对语句进行句子语义成分分析的一类技术,是识别句子中各语义块的一种方法。
概念层次网络理论的句类分析通过以下步骤来完成:
(1)对语义块进行感知。
(2)作出语义假设。
(3)旬类检验。通过对句类的合理性进行分析,确定出句子的句类。
(4)分析语义块的构成。在旬类检验通过之后,分析各个语义块的内部结构。
本文主要是利用HNC的句类分析技术,对句子中的各个语义块进行识别,识别之后按照一定规则提取出各个语义块之间的数量关系。
4系统的设计
为了将以句类知识提取思想诉诸实践,实现前面所设计的算法,对这一思想的可行性以及实用性进行检验,本文设计并实现了一个自动理解系统。系统的总体模型如下:
依据本文中设计的系统总体模型框图,设计出的应用题自动理解系统的具体流程为:
(1)先处理各个分句;再处理各个分句中的各个分词,以词的序列来代替各个分句。
(2)通过字词结合规则预处理阶段,标注一些特殊的语义块。
(3)识别语义块,具体途径则参照概念层次网络理论的句类知识和语义块知识。
(4)结合特定规则提炼出各个子句蕴含的知识;最后扫描问题,寻找出需要求的未知量。
5结束语
5.1本文总结
本文通过研究自动理解应用题系统的设计原理与设计思路,分析了自动理解时需要注意的问。本的主要工作如下:
(1)针对高中生应用题的具体特点,在概念层次网络主要理论基础上,概括总结了常用的3种句子成分的划分模块。
(2)给出了高中生应用题自动理解系统的总体设计模型和基本设计流程。
5.2进一步研究
本文在概念层次网络理论的基础上设计出了高中生应用题自动理解,在未来的科研工作中,本文准备再做以下几个方面的深入研究:
【关键词】句子结构句型热点考查
根据语法形式,即句子的结构,英语的句子可分为简单句、并列句和复合句。
一、简单句:
只包含一个主语(或并列主语)和一个谓语动词(或并列谓语动词)。英语简单句由于所用的主要动词不同(即系动词、不及物动词和及物动词),就产生了简单句的五种基本句型。
(一)主语+系动词+表语
Weareteachers.
主谓
系动词包括下面几种:
1.表示感觉、视觉:feel,seem,appear,look,taste,smell,sound等。
2.表示变化:turn,become,get,grow,go,come,run,fall等。
3.表示保持某种状态:keep,be,stay,remain,continue,stand,sit等。
(二)主语+不及物动词
Therainstopped.
(三)主语+及物动词+宾语
Welikethedeliciousfood.
(四)主语+及物动词+间接宾语+直接宾语
Tomtellshimthewaytothestation.
(五)主语+及物动词+宾语+宾语补语
HecalledmeAmanda.
二、并列句:
包含两个或两个以上主谓结构的句子叫并列句(构成并列句的简单句常被叫作分句),句与句之间通常用并列连词或逗号来连接。
Wehelpthemandtheyhelpus.
主谓主谓
常用的并列连词可以分为四种:
1.平行关系and,aswellas,alongwith,notonly…but(also)…,neither…nor…等。
Theteacher’snameisSmith,andthestudent’snameisJohn.
2.转折关系but,yet,however,nevertheless,while等。
Heisyoung,butheknowshowtotakecareofhim.
3.选择关系or,otherwise,ratherthan,either…or…等。
Hurryup,oryou’llmissthetrain.
4.因果关系for,so,therefore,hence等。
Theweatherisfine,soIwanttogoshopping.
三、复合句:
有两个或更多的主谓结构,通常由一个主句和一个分句构成。在复合句中,主句是句子的主体,通常可以独立存在;从句是主句的一个句子成分,不能独立存在,但它也有主语部分和谓语部分。根据从句在主句中所发挥的语法功能将复合句分为名词性从句、定语从句和状语从句。
Hesaidthathewouldcome.
主句从句
(一)名词性从句:在句子中充当主语、宾语、表语与同位语的句子分别叫作主语从句、宾语从句、表语从句和同位语从句,这些统称为名词性从句。
1.主语从句:在复合句中用作主语的从句。为了保持句子平衡,主语从句常用it作形式主语,将主语从句后置。
1)Itis+名词+that从句
2)Itis+形容词+that从句
3)It+动词+that从句
4)Itis+过去分词+that从句
2.宾语从句:在复合句中作主句的宾语。可以作主句谓语动词的宾语,也可以作介词的宾语。
Heaskedhisgirlfriendifshehasreceivedhisletter.
3.表语从句:放在连系动词之后,充当复合句中的表语。
Theproblemisthatthefamilyisshortofmoneyrightnow.
4.同位语从句:用于对前面的名词作进一步解释,说明名词的具体内容。同位语从句一般由that引导。同位语从句一般跟在名词fact,hope,idea,news,doubt,suggestion,information,opinion,decision,discovery,truth,promise等后面。
病句辨识指发现句子的语言毛病。由于这类题型只要求辨识语病而不要求修改,所以笔者认为可以从培养划分句子成分的能力和寻找病句特征两个方面去抓好病句复习。
一、熟练而准确地划分句子成分
这是辨识病句的根本。划分句子成分如同照妖镜,一些长而难的病句在这面镜子面前原形毕露,如2013年山东卷的“当今的世界,各个国家、地区相互依存,已经形成了你中有我、我中有你的格局,是一个经济全球化的时代”,仅凭语感是很难发现其中的语病的,但是我们把主干“当今的世界……是……的时代”抽取出来后,便发现主宾搭配不当。
二、利用辨识口诀迅速找出病句
学生首先要理解《考试大纲》要求掌握的六种语病类型,然后,每种病句类型记几个典型病句以加深理解。同时还必须学会根据病句的特征辨识病句。下面是笔者总结的快速辨识病句的口诀:主干远隔防假冒;介词开头防主少;两种格式致杂糅;一面、两面须对应;多项否定防意反;多项定状语序拗;并列名词防交叉,并列动词防倒置,并列主宾看搭配;关联词语看位置,关联词语看关系;指向多方不明了,逻辑错误藏得巧,重复啰嗦须删掉。
1.主干远隔防假冒
主语与谓语、谓语与宾语(或动词与宾语)、主语与宾语相隔较远,就要谨防假主语或主谓搭配不当,谨防出现假宾语或者说动宾搭配不当、宾语中心语残缺,主宾搭配不当等问题。这种情况在高考中出现相当多。如“作为古希腊哲学家,他在本体论问题的论述中充满着辩证法,因此被誉为‘古代世界的黑格尔’”(2014·新课标全国卷Ⅰ),主语“他”与谓语“充满辩证法”之间插入介词结构,易致人顾此失彼,其实“他”并不是“充满辩证法”的主语,“论述”才是真正的主语。
一个主语后面有几个谓语,往往也会出现假主语,或曰搭配不当,如“作为一名语文老师,他非常喜欢茅盾的小说,对茅盾的《子夜》曾反复阅读,一直被翻得破烂不堪,只好重新装订”(2014·新课标全国卷Ⅱ),句子较长,“他”易被我们误认为是“一直被翻得破烂不堪”的主语,实际上真正的主语是“《子夜》”,应把“被”改为“把它”,前后主语就一致了。
2.介词开头防主少
介词结构是不能充当主语的。当句子开头出现介词,而介词结构后面又没有明确的主语的时候,我们可以判定句子缺少主语。如“近年来,随着房地产市场的发展和商品房价格的持续上涨,引起了有关部门的高度重视”(2014·山东卷),这句话由于介词“随着”出现而缺少主语。
3.两种格式致杂糅
一个句子同时使用两种格式,造成杂糅。例如“本书首次将各民族文学广泛载入中国文学通史,但就其章节设置、阐释深度等方面依然有很大的改进空间”(2014·新课标全国卷Ⅰ),这句话既想用“但就其……方面来说”,又想用“在……方面”,句式杂糅,应删“就”,或在“方面”后加“来说”。
4.一面、两面须对应
句中出现“是否、能否、有没有、要不要”等两面词,就应警惕后文有无与之对应的词语,谨防两面对一面或一面对两面。如“在深化改革的关键阶段,我们是否能够保持积极的精神状态,关系到我省经济的长远发展,关系到全省人民的福祉,我们必须防止‘精神懈怠’。”这句话中,前面“是否”具有正反两方面,后面“关系到经济的长远发展”只涉及正面,犯了两面对一面的错误。
5.多项否定防意反
当一个句子有多个否定意义的词语出现,我们需谨防否定失当而表意相反。如“好经也要提防不被念歪”,“提放”与“不”均表否定,表意相反。
6.多项定状语序拗
多项定状或定状同时出现,语序可能不当,要注意理顺语序。如“今天所投资百万元带来的效益,恐怕是五年后投资千万元也比不上的”。“效益”前的定语有三个,我们就要谨防语序不当,改为“今天投资百万元所带来的效益”。
7.并列名词防交叉
当句中出现多个并列名词时,谨防其概念交叉。如“生活用品以及床上用品都应由学生自主选购”,“生活用品”与“床上用品”概念交叉。
8.并列动词防倒置
并列的动词一般按逻辑顺序和事理顺序排列。如果几个动词排列在一起,那么我们要警惕顺序是否倒置,如“我们既要传承文化,更要创新和发展文化”中,应该先“发展”再“创新”。
9.并列主宾看搭配
如果一个动词支配多个宾语,就要看动词是否与每个宾语都能搭配;如果句中出现多个小主语,要看这些小主语与谓语是否搭配得当。如在“土地沙漠化、植被覆盖率和森林病虫害等十分严重,令人担忧”中,“植被覆盖率”与“十分严重,令人担忧”不搭配。
10.关联词语看位置
一旦句中有关联词语,我们就要看关联词的位置是否正确。关联复句前后分句如果是同一个主语,那么主语统领整句话,主语在关联词前;如果前后分句主语不同,那么后面的主语是整句话的主语,放在关联词后半部分的前面,而前面的主语放在关联词之后,前一分句构成整句话的状语。如“专家认为,我国人均饮茶量每天不足10克,加之大部分农药不溶于水,茶叶中即使有少量的农药残留,泡出的茶汤中也会农药含量极低,对人体健康影响不大”,主语是“茶汤”,前一个分句的主语是“茶叶”,将“即使”调至“茶叶”的前面,使之成为让步状语。
11.关联词语看关系
倘若句中有关联词语,我们就要看关联词语表达的逻辑关系是否成立,其中因果关系和递进关系是热点。例如“次贷危机引发的全球性金融危机带来的影响还在持续,随着经济全球化的日益深化,如何缓解就业压力已成为世界各国最大的难题”,“经济全球化的日益深化”并非“就业压力”增大的原因。
12.指向多方不明了
造成歧义的原因很多,但是近几年主要考察由语义指向多方导致的歧义。当句中出现“和”、多项定语(特别是数量词)、多项状语,就要注意这些修饰成分的语义是否可以指向两个以上的对象。如“两个目击者提供的弹壳”,“两个”即可指向“目击者”表示“由两个目击者提供的弹壳”的意思也可指向“弹壳”表示“目击者提供的两个弹壳”的意思,从而导致歧义。
13.逻辑错误藏得巧
逻辑错误往往藏得较深,不易发觉。这样的句子单从语法角度分析是没有问题的,但仔细分析就会发现有自相矛盾、不合事理、推理不合逻辑等逻辑错误。如2012全国大纲卷的“建立监督机制非常重要,企业对制度的决策、出台、执行到取得成效的每个环节都纳入监督的范围,就能切实有效地增强执行力”,凭常识,制度一般要先酝酿再出台,故“决策、出台、执行”改为“酝酿、出台、执行”。