数据清洗范文

导语:如何才能写好一篇数据清洗,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

ResearchonWebdatacleaninganditssystemframework

WangChen

(SchoolofInformationMediaandArt,JiangsuInstituteofArchitecturalTechnology,Xuzhou,Jiangsu221116,China)

Abstract:Datacleaningisaneffectivemeanstoimprovethequalityofdata.ThequalityproblemsandtheerrorsappearingwhenextractingdatafromWebareanalyzed.Accordingtotheerrortype,theattribute(includingincompletedataandabnormaldata)andrecordsonrepeat,similarrepeataredescribed.Thecorrespondingcleaningmethodisgiven.Aframeworkofdatacleaningisconstructed,includingdatapreprocessing,datacleaningenginesandqualityassessment.Whenbeingfacedwithdifferenttypesoferrors,itcancompletethetaskofcleaningdifferently.Theexperimentresultsshowthattheframeworkhasgreatgeneralityandextensibility.

Keywords:dataquality;datacleaning;attributeerror;duplicaterecords;qualityassessment

0引言

Web信息集成的目的是获取Web上的丰富数据资源,将其集成为用户或某个应用所需要的有效信息。但是从Web上抽取的大量数据,往往存在一定的数据质量问题,如拼写错误,空值,不合法数据,数据重复,以及不完整数据等等。因此必须进行数据清洗,消除数据的不一致与重复错误,提高数据的可用性,保证信息的质量,才能实现有效数据的高效查询,以及用于后续的数据挖掘与知识发现。

本文针对前期从Web中抽取到的大量数据,检测并消除其中存在的属性错误和重复与相似重复记录问题,提出一种通用的数据清洗系统框架,从而保证数据的可信度和可用性[1-2]。

1属性错误

清洗属性错误主要用来解决不同数据源之间的数据不一致问题。属性错误主要包括两部分:不完整数据和异常数据。

1.1不完整数据

不完整数据是指数据库中的某条记录的属性出现空值或缺失值的现象,如表1所示。

表1;不完整数据

这种现象主要是由数据源模式和抽取方式不同造成的,也是数据在抽取过程中出现质量问题的重要因素。如果某条记录中的关键字或者数值型属性不完整,则有可能导致错误数据模型的建立,还会引起决策支持系统的错误。因此,对于多个属性值为空或者其关键字属性为空的记录,应直接进行删除清洗。其余的不完整数据可以采用常量值替代、统计、分类和使用估算值的方法[3]进行清洗。

1.2异常数据

异常数据是指数据库中的某条记录的属性出现不精确,错误的值,或者属性值违反业务规则,以及同一属性采用不同的表现形式等现象,如表2所示。

表2;异常数据

一般采用层次聚类的方法,对异常数据进行检测与清洗。首先将数据集的记录分成若干组,使同一组的数据具有较高相似度,不同组中的数据记录差别较大,散落在外,不能归并到任何一类中的数据称为“孤立点”;然后判断是否有“孤立点”存在,若存在,则判断该孤立点是否存在错误数据,若不存在,则根据规则库再次判断是否存在异常数据;最后,对获取的错误数据进行清洗处理,修正错误。

2重复与相似重复记录

Web上的异构数据由于模式不同,数据的不完整,数据的缩写等问题,在进行Web抽取时,会获得大量重复数据,这些重复记录不但导致数据冗余,占用大量存储空间,而且还会给用户提供很多相似信息,造成检索结果的不准确性。数据清洗的核心工作就是要准确高效地检测并消除数据源中的重复数据,并进行归并。

在关系数据库中,属性值完全相同的记录,即为重复记录,它们表示同一对象;有些记录不完全相同,有些属性也不完全相同,但是它们表示同一对象,此类记录称为相似重复记录[4-5],例如表3。

表3;相似重复记录

但是数据清洗过程中,相似重复记录的检测过程非常复杂,主要通过判断记录之间的相似性来达到获得重复记录目的。具体实施为:首先优选记录集中的特征属性,设定权重值,根据权重值对记录集进行聚类分组,使相似的记录尽量排在相邻的位置;再比较各组记录中对应字段的相似度,完成字段匹配;最后通过计算各字段的权重,利用加权的方式,得到记录的相似度,当超过某一阈值,则认为是相似的,从而完成记录匹配。

3数据清洗系统框架

数据清洗系统框架主要包括:数据预处理、数据清洗引擎和质量评估三大部分,如图1所示。

图1;数据清洗系统框架模型

3.1数据预处理

数据预处理主要包括数据分析与数据标准化两个模块。

⑴数据分析模块

本模块用来对从Web中抽取到的数据进行整体分析,获得可能会出现的数据质量问题和错误类型,以便后续选择适合的清洗规则和清洗算法。

⑵数据标准化

本模块包括规范数据格式,统一数据表达方式和统一缩写三项工作,例如将日期类型的字段统一为ISO8601国际标准,并使用YYYY-MM-DD的格式[6]。

3.2数据清洗引擎

数据清洗引擎主要包括数据检测、数据清洗两大模块。

⑴数据检测模块

数据检测模块用来检测属性错误(包括不完整数据和异常数据)和重复与相似重复记录。进行统计后,获得全面的脏数据信息,并归档。其中对于重复与相似重复记录可以采用特征属性的选择、属性权重的设定、聚类排序、字段匹配和记录匹配等检测操作。

⑵数据清洗模块

对检测出的脏数据进行清洗,对不完整数据采用删除、常量值替代、统计、分类、使用估算值填充的清洗方法;对异常数据可采用聚类、基于规则库的清洗等,从而完成属性错误问题的修正;对检测到的重复记录进行归并或清除工作。

这些工作均由算法库或规则库提供的预先定义好的清洗算法和清洗规则实行。当然在实际的操作工程中,可以随时调整或更新自定义的算法和规则。对于无法自动清洗的数据,可提交给用户,由其手动处理。通常先清洗异常错误,再清洗重复记录,最后清洗不完整数据。

3.3质量评估

质量评估主要是使用包含在评估库中的评估方法和标准对数据清洗效果进行评估,并将结果反馈给用户,来检测是否达到了预定的清洗要求。通常用户需要反复的评估和清洗才能满足需求,最后获得干净数据。

4实验结果与分析

实验中所用到的数据是从亚马逊、淘宝、china-pub等网站中抽取到的12700多条图书记录所形成的关系数据集。每条记录优选12个属性,形成如表4的字段信息。

表4;图书元数据信息

说明:字段名即关系表中的属性

经过数据清洗后,脏数据与干净数据的对比如表5。

实验表明,该清洗框架可以清洗属性值错误、数据不精确、数据描述不规范等属性错误和重复记录问题,通过调用数据清洗引擎,可以对不同类型的错误,采用不同的清洗过程进行处理。能够消除大部分的错误,从而提高数据质量。

5结束语

数据清洗的目的就是利用现有的技术和手段,消除或减少数据中的错误与不一致问题,将其转化成为满足数据质量要求的数据。

本文分析了从Web上抽取到的数据存在的质量问题,给出包括不完整数据和异常数据在内的属性错误以及重复与相似重复记录的描述,并提出对应的清洗方法;设计了一个由数据预处理、数据清洗引擎和质量评估三部分共五个模块组成的数据清洗系统框架,可以针对不同类型的脏数据,完成不同的清洗任务。实验表明,该框架具有通用性和可扩展性。

参考文献:

[1]Ragm,E.,Do,H,H.Datacleaning:problemsandcurrentapporaches.

IEEEDataEngineeringBulletin,2005.23(4):3-13

[2]PairWand,RihardYWang.AnchoringDataQualityDimensions

inOntologicalFoundations[J].COMMUNICATIONSOFTHEACM,2006.39(11):86-95

[3]BatistaGEAPA,MonardMC.Ananalysisoffourmissingdata

treatmentmethodsforsupervisedlearning.AppliedArtificialIntelligence,2003.17(5-6):519-533

[4]佘春红,许向阳.关系数据库中近似重复记录的识别[J].计算机应用

研究,2003.20(9):36-37

[5]陈伟,丁秋林.数据清理中编辑距离的应用及Java编程实现[J].电脑

与信息技术,2003.17(6):33-35

一、工作目标

按照中央脱贫攻坚总体部署,结合精准扶贫、精准脱贫工作要求,摸清我镇9个涉贫村、1个社区现状,完善扶贫对象建档立卡信息,以解决数据存疑问题为主要目标,以提高加强扶贫开发数据质量为核心,实现数据“实”和“准”的目标。

二、工作内容

(一)扶贫对象

1.解决身份信息错误问题

核查并核实各行政村建档立卡贫困户身份信息,依据有效身份证件确定人员的信息,纠正系统错误数据。

2.解决基础信息错误问题

认真核对系统各项指标信息是否切合实际,与扶贫对象情况相符,着重对应扶贫对象脱贫状态和年度情况修正完善关健指标缺项漏项、指标值异常和指标逻辑入系统错误等数据。

(二)扶贫主体

1.解决结对关系错误问题

2.解决扶贫主体基础信息错误问题

核查核对第一书记驻村工作队、帮扶单位、帮扶责任人等扶贫主体的隶属关系、职务级别和联系方式等基础信息,确保帮扶干部利用个人信息,注册国家建档立卡手机APP用户时1次性通过。

(三)扶贫资金和项目

1.解决扶贫项目信息不完整问题

2.解决项目受益对象受益情况与基本状况不对称问题

核查核实基础信息仍处于“两不愁三保障”未解决、无务工、基础设施未解决等状态,却在对应的产业、基础设施、公益岗位、社会公共服务等项目中为受益户和受益村的情况,确保扶贫项目真带动,扶贫对象真受益。

三、工作步骤

(二)数据核实。3月5日至4月14日组织各包片领导、包村干部、一对一包保干部、村干部进村入户核实工作。对2015年至今的贫困村、贫困户数据信息和情况进行逐一排查。

(三)信息修正

(四)检验核查

5月6日之前,镇扶贫办将开展全镇数据清洗普查工作,针对各行政村和社区进行评定,评定成绩将列入年终千分制考核中,并针对评定优秀村给予加分表扬。

四、工作保障

(一)强化组织领导

各村要组织村干部亲自领导,抽调精兵强将,组成工作队伍,扎实开展工作。按上级要求把信息数据核对准确。如各村出现信息不准确、贫困户不满意;达不到省、州、市要求的标准;影响工作进度的将严肃处理。

(二)搞好业务培训

各行政村和社区要加强对此项工作的督促指导,及时解决并汇报工作中出现的问题,确保高质量完成数据清洗工作这项工作任务。

(三)加强人员力量

各村要将办事能力强、工作责任心强的村干部,组成数据清洗工作小组,由村书记担任组长,包村干部担任副组长;齐心协力开展数据清洗工作。

关键词:大数据;数据质量;云清洗;Map-Reduce

中图分类号:TP391文献标识号:A

DesignandImplementationofCloudCleanSystemonBigData

HUANGShenbin1,WANGHaijie1,ZHUZhenhua2

(1NetworkandInformationCenter,HarbinInstituteofTechnology,Harbin150001,China;

2SchoolofComputerScienceandTechnology,HarbinInstituteofTechnology,Harbin150001,China)

Abstract:Datacleaningisoneofthecentralissuesinbigdata.ThepaperdescribesacloudcleansystembasedonHadoopfordatacleaning.UsingMap-Reducemodel,thesystemdetectsandrepairsvariousdataqualityproblemsinbigdata.Thepaperdesignsthesystemfromthefollowingfeatures:(1)thesupportforcleaningmultipledataqualityproblemsinbigdata;(2)avisualtoolforwatchingthestatusofbigdatacleaningprocessandtuningtheparametersfordatacleaning;(3)thefriendlyinterfacefordatainputandsettingandcleaneddatacollectionforbigdata.Thecloudcleansystemisapromisingsystemthatprovidesefficientandeffectdatacleaningmechanismforbigdataineitherfilesordatabase.

Keywords:BigData;DataQuality;CloudClean;Map-Reduce

虽然已经有很多数据清洗的技术和算法被相继提出,但却并非都适用于大数据上。主要原因如下。

首先,现有的数据清洗算法的效率并不能满足大数据的需求。并行计算是大数据算法的一个常用手段。然而,除了少数实体识别的算法[2-3]外,几乎没有其他的并行数据清洗算法获得提出。具有多种数据质量问题的大数据清洗工作的整体效率往往也都不高。

其次,现有的数据清洗系统[4-7]集中于数据质量的某一方面。NADEEF[8]支持各种形式的规则,但是缺少数据清洗领域的一些重要问题如缺值填充和冲突属性的真值发现等。对于具有多种数据质量问题的大数据而言,这往往是不够高效的。究其原因,一方面多种数据质量问题需要多个不同的系统来完成各自的数据清洗工作,从而导致清洗过程需要多次的导入和导出数据;另一方面,多个数据质量问题往往可能会共享相同的操作,如去除数据冗余[9]和流通数据发现[10]即都需要实体识别。如果不同的数据质量问题均由各自的清洗系统来完成,那么这些相同的操作便将多次执行,不利于全局的优化。

最后,现有的数据清洗系统常常需要设置参数,例如不一致性检测[11]的约束规则,实体识别[12]的阈值。对于小规模数据来说,这些规则能够通过人工的观测和理解来设置。然而对于大数据,仅靠观察来设置是不合理的,而对整个数据人工的遍历一遍更是不可能的。

2云清洗系统概述

清洗大数据的一个很直观、很自然的想法便是将云计算的技术应用其中,并将计算任务分布式地分发给多个节点以提高并行度。本文设计的大数据云清洗系统采用的便是这个思路,基于Map-Reduce封装实现了数据清洗领域的各类基本问题和清洗操作,包括实体识别、不一致性检测和修复、缺值填充和真值发现。

云清洗系统基于Hadoop来实现架构,利用Map-Reduce框架系统能够高效地控制硬件资源执行分布式计算。整个系统的数据流如图1所示。图1数据流

Fig.1DataFlow

系统的数据是组织在分布式文件系统中。而输入数据则是通过文件或者数据库来提供,前者由用户上传,后者将是用户提供数据库的连接信息而由系统来访问。数据输入后存在于分布式文件系统中,而集群中节点的数据则通过分布式文件系统来访问。在清洗过程中,数据在mapper和reducer间传递,清洗结束后数据被送回到分布式文件系统。和输入类似,用户可以将清洗后的数据以文件的形式下载或者提供数据库连接信息再由系统输出到数据库中。

系统的结构如图2所示,其中包含一个Master和多个Slave节点。具体地,Master节点接收数据清洗任务的输入数据、清洗计划以及参数设置。而清洗计划即是一个清洗操作序列,由系统提供的四种清洗的基本操作构成,这四种操作分别为实体识别、不一致性检测和修复、缺值填充和真值发现,并且四种操作可以重复选择。

图2系统结构图

Fig.2ArchitectureoftheSystem

3数据清洗操作

本节将简要介绍四个数据清洗操作的功能以及基本Map-Reduce计算框架下的算法实现。

3.1清洗操作

为了使清洗系统能够复用共享的操作以提升清洗的效率,研究提取了数据质量问题中的四类基本的操作,分别是实体识别、不一致性检测和修复、缺值填充和真值发现。对其概述如下

实体识别:识别元组是否代表现实世界的同一实体。

不一致性检测和修复:检测违反规则集的元组,并修复数据使之符合规则。

缺值填充:根据其他完整的元组数据来填充元组的缺失属性值。

真值发现:选择代表同一实体的不同元组存在取值冲突时的真实取值。

这些操作涵盖了数据质量方面的大多数问题。本文的系统可以利用如上的基本操作并根据实际需求来组合形成新的数据清洗的复杂操作。

3.2算法实现

这些操作对应的算法可在Map-Reduce框架下获得实现,再并行地在各个slave上运行。限于篇幅,此处仅给出其简要介绍。

(1)实体识别。该算法有两阶段。第一阶段,构建属性索引表,使得索引表中拥有相同属性值的数据对象对应于同一个实体。这一阶段由一轮Map-Reduce实现并完成。其中的Map阶段划分主要根据属性的取值来进行数据划分,而Reduce阶段则根据属性取值来对元组决定其分群。第二阶段,完成实体的识别,执行相似度连接查询生成相似实体对集合。该阶段由五轮Map-Reduce实现并完成。其中的第一轮分别统计每个实体及每个实体对的出现次数。第二轮和第三轮分别根据同时出现在实体对中的第一个实体和第二个进行聚集,生成相似实体对集合。稍后的第四轮和第五轮则根据阈值和计算的相似度,完成实体划分。

(3)缺值填充。研究根据不同的属性取值设计了多种不同的算法类型来实现缺值填充。对于连续变量值的缺失而言,就是利用其他的属性取值通过回归来实现缺值填充。此处的回归包含三个子过程,分别是:标准化、排序和回归,每一个操作均对应一轮的Map-Reduce。具体来说,标准化阶段将所有属性进行标准化,并计算各个属性的最小值,构成最小值向量。排序则对所有元组的最小值向量计算相对大小并排序。回归将完成回归并填充缺失值。离散变量值缺失,则通过分类来实现缺值填充。分类也同样包含三个子过程,分别是:概率计算、参数聚集和缺值填充,每个操作也都对应一轮Map-Reduce。具体地,概率计算过程需要计算每个特征属性的条件概率和分类属性的边缘概率,生成概率表。参数聚集则根据概率表来聚集缺值填充需要的参数。而缺值填充主要根据聚集的参数来完成填充。

4用户功能接口

一、音乐的抒情性之咏

威尔第是一位“歌唱本位”的歌剧作曲家,一位匠心独具的旋律大师,“以声乐为主、以如歌旋律见长的意大利歌剧传统始终贯穿在他的所有作品中。”①注重旋律的音乐性抒咏是他首要的美学追求,也是他创作的个性体现。他的音乐旋律洋溢着浪漫主义的抒情气息,将以歌唱旋律见长的意大利歌剧传统发挥得淋漓尽致。

(一)旋律线条的柔和展现

众所周知,《弄臣》、《茶花女》、《游吟诗人》是威尔第中期歌剧创作最具代表性的“大众三部曲”,它们的显著特点是以丰沛的歌唱旋律展开戏剧情节,以优美流畅、清晰明朗的歌唱线条感人肺腑。不论是《茶花女》薇奥列塔的咏叹调《他也许是我渴望见到的人》抑或是《弄臣》中吉尔达的咏叹调《亲爱的名字》;还是《游吟诗人》中莱奥诺拉的咏叹调《晚风你展开翅膀》,都是脍炙人口的抒情性咏叹调。

以《他也许是我渴望见到的人》为例,这是薇奥列塔被阿尔弗莱德的真情所动而唱的咏叹调,犹如一首迷人而忧郁的圆舞曲(见谱例1)。旋律中十六分音符和十六分休止符反复间隔而呈现出“点彩”式的旋律线条,表达了薇奥列塔被阿尔弗莱德的深情所触动后内心涌起的一淙暖流,但幸福之余又有似真似幻的疑虑。这种“点彩”式的艺术手法在威尔第的创作中颇为常见,但在不同的音乐作品中体现不同的戏剧内涵(如,下文例举的《亲爱的名字》中也运用了该手法)。曲中“dolce”体现了旋律线条舒展绵长,柔和甜美,咏叹调的第二部分出现了爱情主题(见谱例2),“前半部分用f小调,加强了抒情性,后半部分转同名大调,恰到好处地表现出薇奥列塔豁然开朗的心情和爱情所产生的力量。”②深情柔美的歌唱旋律揭示了薇奥列塔善良、纯真的本质,旋律线条所透射的戏剧性意味更甚隽永,耐人寻味。

谱例1

谱例2

在威尔第晚期力作《阿依达》中,他仍然保留了以抒情气质的歌唱旋律见长的一贯创作风格。剧中《啊,我的故乡》就是一首抒情气质极浓的咏叹调,音乐细腻且富有东方色彩,一气呵成的行云流水般的旋律以及管弦乐震颤的音响和大小调的交替所迸发的激情使这首歌曲富有撼人心魄的力量。威尔第极尽雕琢润饰旋律之能事,挥洒旋律线条之流丽,突显旋律色调之鲜明,把意大利温暖明朗的歌唱性格发挥到极致。

(二)旋律色调的丰富变化

如果说旋律线条是构筑咏叹调骨架之内在元件,那么,旋律色调则是咏叹调肌肤之外在体现。旋律色调随着剧中人物角色的定位不同、人物所处的环境不同、人物内在的心理活动的状态不同,而呈现出不同的特征。因此,旋律色调的强度直接影响情感的表达,乃至暗示人物的命运遭遇。

谱例3

与《亲爱的名字》所展现的暖色调不同,《茶花女》中薇奥列塔的咏叹调《永别了,过去的美梦》体现的则是充满哀伤愁绪的冷色调。乐曲以a小调开始,起唱部分的“dolente(悲痛地)”正预示了旋律色调暗淡、哀伤、悲凉,随着调性的更替变换,主题的深入展开,音乐则呈现出不同的色彩。时而浓烈,时而暗淡,明暗的交替,虚实的隐现,既表现了主人公对情人的炽热情感,又揭示了她对命运的无奈哀叹。在两者对比之间,油然生发出戏剧性情感波澜的动态与静态起伏之和谐。曲终的a小调主和弦烘托出忧郁、沉重、绝望的悲剧色彩,暗示女主人公悲痛的人生终结。咏叹调哀婉的旋律不仅是薇奥列塔悲惨命运的人生写照,还浸染着“红消香断有谁怜”的无奈感伤之愁绪,在我们对女主人公的悲剧命运扼腕叹息之余,其音乐所蕴涵的飘逝消散的悲剧美更令人回味无穷。

如此看来,旋律色调的明暗、强弱、浓淡、隐现等能直观地反映主人公的心理状态,进而确定咏叹调的情感基调。随着歌剧情节的连续发展,它揭示了人类命运中的悲与欢、爱与恨、离与合、生与死等永恒的生命主题。

二、音乐的戏剧性之叹

音乐性与戏剧性是威尔第在歌剧创作中紧扣的艺术准绳,在注重旋律抒咏的同时他力求挖掘音乐的戏剧性意味,在戏剧性中如歌抒情。他的咏叹调不是纯粹供歌唱者炫技的手段,而是与剧情紧密关联的戏剧整体的有机组成部分。旋律作为咏叹调之灵魂,它所包含的节奏、速度、力度等音乐表现要素在威尔第的笔下凝练成纯朴真挚的音乐语言,突显出戏剧性张力,这体现了威尔第歌剧咏叹调创作的另一种美学品格:戏剧性之叹。

(一)旋律乐句的动力体现

威尔第素有“旋律大师”的赞誉,这不仅体现在他对旋律线条、色彩的娴熟把握,还体现在他改变节奏、重塑旋律型,给旋律带来节奏性律动的技巧上,这使他所写的旋律突显出戏剧性的张力,在形式和内容上都呈现出新的气象。

显然,威尔第用音乐刻画特定戏剧情景下人物的心理活动时所应用的手法是灵活多变的。既有利用旋律动机反复变化而展开音乐,如《亲爱的名字》;也有运用节奏的特性来描绘音乐,如《每逢那节日来临》;还有加强速度、力度的对比呈现不同的旋律色调来推动音乐的发展,直至获得最大的心灵深处的震撼效果,如《永别了,过去的美梦》。威尔第对于人物内心情感的细致入微的洞悉以及对于咏叹调旋律鬼斧神工般的雕琢确实令人叫绝!

(二)旋律形态的连接结构

众所周知,咏叹调具有优美的歌唱旋律,宣叙调则是承载剧情的吟诵体形式。为了保持剧情发展的连贯性,增强戏剧效果,威尔第在中后期的歌剧创作中对传统“编号体”结构及其弊端进行了改革。他逐步突破传统咏叹调的方整性结构和静止状态,使宣叙性旋律成为引入、连接、补缀、转换咏叹调中抒情旋律的“链接枢纽”。在歌剧情节发展的戏剧性大背景中,把咏叹调的抒情性片段变小至几个乐句乃至乐节,并且在其中加入戏剧性的宣叙成分,使咏叹调旋律连接的结构演变成“综合体”(Compoundform)的结构形式。其旋律连接的结构形态为宣叙性的叙事旋律与抒情性的歌唱旋律连接转换,互相渗透,彼此融合,连贯地发展于剧情中,达到音乐性与戏剧性契合的整体。于是乎,咏叹调中人物情感的抒发不再像大色块的原始泼洒,而是与剧情紧密结合的婉转起伏。

这在《奥赛罗》苔丝狄蒙娜的咏叹调《杨柳之歌》中可见一斑:此曲的四个部分中间并没有明显的界痕,而是用朗诵调连接展开的,宣叙性的因素散落在咏叹调的抒情旋律中,如:“快点,奥赛罗就要来了”、“是谁在那儿敲门”等宣叙成分使咏叹调和宣叙调的结构形式的区分变得模糊,逐渐趋向于不分段的连续性的“通连体”结构(Through-Composedform),使咏叹调既充满了歌唱性旋律,又包含着宣叙性旋律,既有咏叹调抒情性的优美绵长,又有宣叙性乐句所表达的叙事性内容,达到了歌唱性与宣叙相辉映的统一和谐之美。

结语

综上所述,威尔第无愧为歌剧殿堂里的一代巨匠,他对于咏叹调旋律的雕琢从线条、色调、运动和形态等方面入手,通过线条的婉转起伏以抒写歌唱旋律的流丽清新;通过色调的明暗隐现以寻求音色表达的圆润精致;通过节奏型的重塑组合以探究旋律乐句的动力体现;通过合理性的“综合体”链接结构以挖掘歌唱旋律的戏剧性意味,从而塑造丰美鲜活的人物形象。他笔下的女高音咏叹调既富清新明朗的歌唱性格,又处处洋溢着丰沛浓烈、热情激昂的戏剧性力量。毋庸置疑,威尔第是集抒情性与戏剧性为一体,实践了“歌剧是用音乐展开的戏剧”这一美学理想。诚然,其抒情性与戏剧性并非静止孤立,而是有机地统一于歌剧的整体表达,统一于他对歌剧传统在继承之上又实现改革和创新的这样一种音乐文化的借鉴和传承、发扬和创新的关系中。他既继承了意大利歌剧传统之精髓――以如歌的音乐旋律见长;又赋予传统以新的诠释――在戏剧性中如歌抒情,增强音乐的戏剧性内涵。因此,实现音乐的抒情性之咏与戏剧性之叹,实乃威尔第歌剧创作毕生之美学追求。

①⑤居其宏《大师威尔第与中国歌剧――纪念威尔第逝世100周年》,《人民音乐》,2001年第5期。

②储声虹《外国歌剧曲选》,北京:人民音乐出版社,2002年版第331页。③程淑安《卡拉斯在美国朱利亚音乐学院讲学集》,南京:江苏文艺出版社,2001年版第159页。

关键词:戏剧情境;剧本创作;演员;观众

一、戏剧情境与戏剧动作及悬念的关系

在剧本中,真正的戏剧悬念并非指的是观众在一无所知的情况下的盲目期待,而是指在知道一些“已知数”时,对“未知数”的具体期待。[2]在戏开场以前,观众对剧中人物、环境、事件等一无所知,观众只能是在“不知情”的情况下期待着好戏。大幕打开之后,随着剧中人物的活动,观众了解的越多,期待也逐渐集中。此时,情境交代清楚,悬念才能够一触即发。易卜生的《玩偶之家》中,剧情通过对海尔茂一家的介绍及八年前娜拉假借父亲名义借款为海尔茂治病往事的回顾完成了戏剧情境的构成。接下来柯洛克斯泰如果把借据给海尔茂,海尔茂会如何处理,夫妻的关系会发生怎样的变故,悬念在情境的合理设置下被托出。

由此,通过梳理戏剧情境与动作及悬念的关系,我们可以看到戏剧情境应居于特殊的重要地位,与之相比其他要素都在不同程度上受它的制约。

二、戏剧情境是剧本创作的关键

因此,戏剧情境的设立为剧作家在进行剧本创作时创造了无限可能,也决定了一部戏剧的行动是这样而不是那样。

三、戏剧情境与表演创作及观众的关系

斯坦尼斯拉夫斯基曾指出:“‘在假定情境中的热情的真实和情感的逼真——这便是我们的智慧所要求戏剧作家的东西’。我补充一句,我们的智慧所要求戏剧演员的,也完完全全是这个东西,所不同的是,对作家算作假定情境的,对于我们演员说来却已经是现成的——规定的情境了。让演员的注意力都转到‘规定情境’上面去吧。真实地生活于这些情境之中,‘热情的真实’就会自然而然地在你们心里产生。[3]在这里,斯坦尼清楚地指明了戏剧情境对于演员的真实热情及逼真情感的至关重要作用。

情境,不仅是演员表演艺术的前提,也是演员与观众现场交流的媒介。观众对剧中人物的认同与共鸣,一般都是以剧中人物所处的情境为媒介。[4]一部戏剧要获得成功,必须首先能够赢得观众的接受,并在情感上感染观众乃至引起观众的共鸣,这中间的关键就是戏剧情境。在一出戏的开始,观众对剧中的人物几乎一无所知,在演出的过程中,通过演员在特定情境中的表现想象背后的动机。《茶馆》闭幕前,三位老人撒起纸钱祭奠起还活着的自己的情景,令每个看过《茶馆》的观众都难以忘怀。这是因为观众已了解了三位老人的悲惨处境,所以才能感受老人内心深处的悲哀,而且被他们这种悲哀之极的荒诞行为强烈震撼,即使面对超自然现象的情境,观众也能理解。

四、结语

综上所述,戏剧情境的作用是戏剧艺术中的一个不容忽视的内容,它不仅对戏剧动作起着制约和规定的作用,同时对戏剧要素中的冲突起着“聚焦”的作用。由此,情境将剧作家、演员、观众立体地连结起,它们互为因果,相辅相成。可以说,探讨戏剧情境的作用,对戏剧创作具有理论和实践的双重意义。

[1]谭霈生.戏剧本体论[M].北京大学出版社,2009年,第120页.

[2]谭霈生.戏剧艺术的特性[M].

13cfe1.

[3]兰月新,董希琳,苏国强,等.大数据背景下微博舆情信息交互模型研究[J].现代图书情报技术,2015(5):24-33.

[4]刘峰,佐斌.群际情绪理论及其研究[J].心理科学进展,2010,18(6):940-947.

[5]Hatfield,Cacioppo,Rapson.Emotionalcontagion[J].CurrentDirectionsinPsychologicalScience,1993(2):96-99.

[6]刘志明,刘鲁.面向突发事件的群体情绪监控预警[J].系统工程,2010,28(07):66-73.

“戏剧化”并不是一个“新鲜”的提法。大众传媒从19世纪出现以来,就一直伴随着商业化和消费文化的控制和熏陶,“戏剧化”也就成为一种必然的信息表现形式。

科学技术的研究和成果的推出有其特定的规律,同样,科技信息的传播也应该有其区别于其他社会信息、政治信息的传播方式。在“信息爆炸”的大背景下,科技信息的有效传播将影响到社会发展的方方面面。例如,汶川大地震中,地震是否可以预测的问题,就被媒体运用了戏剧化的表现方法,在一定程度上造成了受众的误解和不安;同样,在中央电视台《走进科学》栏目的一些节目中,戏剧化的编排方式也引起了广泛争议,这些都说明“戏剧化”在科技传播中的普遍性和引起的种种弊端。研究这种倾向性,将有助于理解科技传播的独特规律和进行有效传播的特殊含义。

一、信息戏剧化的戏剧原理

(一)信息戏剧化的本质是信息编码的模仿性倾向

信息是符号和意义的统一体。信息传播是符号的传播,符号必须经过编码、解码、译码才能实现传播的全过程。根据传播目的的不同,编码会体现不同的倾向性。从信息到新闻,是要体现信息的事实倾向性。而在这个符号化的编码过程中,掺入戏剧元素将会使信息在进人大众传播环境中体现戏剧化的特征。亚里士多德在《诗学》中认为:“一切艺术都是模仿,戏剧也是模仿,是对人的行动的模仿。”而康德认为,艺术是建立在人的理性基础上的自由创造活动。西方美学史普遍主张艺术模仿论,即主张艺术本质上的对自然的模仿活动。因此,掺入戏剧元素,就是掺入一种模仿的倾向性,是一种在事实基础上进行了艺术加工和创造的编码,是事实的模仿而非事实本身的传播。同时,模仿的程度将反映戏剧化倾向的程度。既然模仿是艺术创造,那么添加在事实之上的创造出来(非原生)的内容越多,就表明其戏剧性越强。

(二)信息戏剧化的两种表现形式

在戏剧理论中,戏剧性分为文学构成中的戏剧性和舞台呈现中的戏剧性。我们不妨以此为标准,将信息的戏剧化表现形式也分为两种,即以文字形式出现的戏剧化表现形式,如报纸、杂志和网络文字新闻,以多媒体形式出现的戏剧化表现形式,如广播、电视和网络多媒体新闻传播方式。

(三)戏剧化对受众影响的两种表现

西南师范大学教授胡润森在《各戏剧元素之结构关系=》一文中指出,戏剧有九种构成元素,分别是戏剧台词、戏剧动作、戏剧时空、戏剧场面、戏剧情节、戏剧角色、戏剧意象、戏剧主题和戏剧节奏。

根据信息编码过程中对不同层次元素的表现和突出程度,受众会相应受到潜在和显在的影响。比如,戏剧台词、戏剧动作具有“基础性”、“具象性”、“单子性”、“原生性”特征,编码过程如果突出这些元素,将会表现出显在的影响,而戏剧主题、戏剧节奏具有“高层性”、“继生性”、“综合性”、“抽象性”特征,对受众有潜在的影响。其他介于中间。

二、科技信息选择戏剧化

科技信息来自科技活动、科技实践,是实际经验的概括和总结,符合客观规律,并以逻辑和概念等形式表现出来。科技性是科技信息的本质特征,也是传播者进行选择并进入大众传播渠道的出发点。上文论及,信息戏剧化的本质是信息编码的模仿性倾向,“模仿”是戏剧性的本质。因此,科技信息选择戏剧化也必然使其具有戏剧创作的特征。

科技信息是人进行科技实践活动后的经验总结,它虽然以逻辑和概念形式表现出来,但也是存在人的因素的。人是动作的发出者,科技信息能体现人的动作性,这就将是进行信息选择的理由之一。同理,人的意志冲突可以构成戏剧性,那么经过概念扩展,可以理解为具有“矛盾性”的科技信息将是进行信息选择的另一个理由。只不过,这里的矛盾性,不只是意志冲突,还有不同信息系统之间的矛盾等更多的矛盾范畴。

对科技信息的欲知与未知的矛盾。科技信息包罗万象,种类繁多,关系生产、生活的方方面面,运用科技信息推动生产、改进生活质量都是人的基本需求。满足这种需求、解决这样的矛盾将是进行科技信息选择的第一层意义。

科技信息自身的规律性矛盾。科学知识从研究、论证到成果推出有其自身的规律。

三、科技信息制作戏剧化

信息制作就是信息的编码过程。在编码过程中加入戏剧化的因子,就构成了科技信息传播的戏剧化效果。它分为三个层次。

(一)突出戏剧元素

例如,2008年6月10日,《隙望》周刊发表了《地震学家都做了些什么》。它的开头部分是这样的:

近二十年来,我们也在二十几次地震之前有所察觉,有一些地震也取得了减灾实效,但这个比例很低,所以这个预报很难,地震预告没有过关。

汶川大地震发生之后,在学术界、互联网上也流传着这样的声音:我国西部也有许多地震监测的台站,这次大地震前就没有发现一点异常,就没有什么先兆吗大地震前我们对大自然诸多预兆是否太大意我国地震科研的整体水平究竟怎样我们何时才能准确预报地震

然而,随着灾情的加剧,人们更加迫切地想了解和地震有关的一切。

再看中央电视台《走进科学》的一期节目。它的开头是这样的:

(二)运用戏剧结构

(三)渲染戏剧性效果

戏剧性效果在电视栏目中体现得更为明显。例如,上文提到的《走进科学》栏目《雷击之后》,受众在悬念的引导下,在“雷击之后”这样题目的直接“干预”下,所接收到的科技信息被添加了“戏剧性”的效果。解说词、背景音乐等强化了受众是在等待一个谜团的揭开,而不是等待一个科学知识的传授。它的主题也相应地发生了“戏剧化”的改变,科技栏目成了讲述“悬疑故事”。

关键词:穆旦诗歌客观化抒情模式戏剧化抒情手法

诗人穆旦在20世纪40年代声名辉煌而命运多舛,他的创作生命华丽然而十分短暂。30年代,金克木、卞之琳等提倡和实践“智慧诗”,主张诗歌应该“极力避免感情的发泄而追求智慧的凝聚”,穆旦继承了这一传统,用自己的诗歌实践宣告了智性与的感融合的美,才是诗人心灵最动人的呼唤。①九叶诗人往往排除主观抒情,而将意图情感隐退到幕后,注重个人内心的发掘,含蓄理智。作为九叶诗人中最具现代诗风的一个,穆旦诗歌更加复杂多义,形成了一种理性间离的客观化抒情模式。这一抒情模式的形成则是有赖于文本中大量戏剧化抒情手法的采用,其中包括多种具体的戏剧化手法,特定的戏剧情境,以及巧妙的戏剧结构。

一、戏剧独白、对白

戏剧独白能够增加诗歌的客观性,在特定的没有听话人的情况下倾诉,事件的过程在诉说中得到完整清晰的呈现,读者以第三者的身份超然物外,冷耳旁听诗中的独白,在对独白者语言的冷静分析中想象整个情境,领悟诗人的旨趣。因此,内心独白使诗歌获得了客观化的抒情效果。如创作于1941年的诗作《我向自己说》:

我不再祈求那不可能的了,上帝,……因为越来越显出你的威力,/从学校一步就跨进你的教堂里,/是在这里过去变成了罪恶,/而我匍匐着,在命定的绵羊的地位,//不不,虽然我已渐渐被你收回了,/虽然我已知道了学校的残酷,/在无数的绝望以后,别让我/把那些课程在你的坛下忏悔,//虽然不断的暗笑在周身传开,/而恩赐我的人绝望地叹息,/不不,当可能还在不可能的时候,/我仅存的血正毒恶的澎湃。

穆旦诗歌习惯于抽象的思考和表达,诗人似乎屈服于上帝安排的命运,但是“庄严的神殿不过是一种猜想”(《潮汐》)。虽然将会有无数的痛苦和绝望,但是与生俱来的对于权威的怀疑又让他产生一线希望,那是复杂而痛苦的希望。痛苦更在于诗人怀疑的不仅仅是上帝,也包括他自己。“我仅存的血正恶毒的澎湃”,曲折晦涩的词句刻画出了矛盾分裂的“我”内心的焦虑,渴望自我蜕变和成长。对上帝的一番独白,开拓了诗人的心理领域,也增加了诗歌的厚度。

采用戏剧对白手法的诗歌,通常虚拟两个或两个以上的角色进行对话,或以抒情主人公“我”与另一虚构角色的对话展开。全诗表面上意在刻画对白双方或多方人物的心理特征,并展示戏剧场面及情节过程,实质上藉此客观性的叙述,来间接传递出自身的情感与思索。这种对话的方式经常出现在穆旦的诗歌当中。

无论独白抑或对白,戏剧话手法的采用让诗人从诗中走出,隐退到幕后,以虚构人物的语言为依托,承载诗人的意志和情感,并最终转化为诗的经验,从而形成间接性的抒情方式、客观化的抒情口吻及抒情效果。

二、戏剧情境

戏剧情境即人物活动的戏剧场景和特定的人物关系,是戏剧的情势与境况,是剧中人物生存与活动的特殊环境,它促使人物产生行为动机,导引人物行动的刺激力和推动力的滋生。戏剧情境就是促使戏剧性产生、发展的条件,促使人物积极行动起来,并促使戏剧性必然很快产生的戏剧情境。在现代戏剧理论中,情境甚至是戏剧的本质所在。

穆旦的《华参先生的疲倦》设置了一幕含义颇深的戏剧情境。那是炮火轰鸣的战争年代,一对敌人在诗人笔下出现。华参先生和杨小姐在别人的介绍下见面,“微笑着,公园树荫下静静的三杯茶/在试探空气变化自己的温度”,“谈着音乐,社会问题,和个人的历史”,华参先生却始终游离于谈话之外,时时返回内心世界,游走在漫无边际的飘忽思绪中:对“曾经爱过”的追忆,对爱情中存在的不洁因素的冷静分析,对那些无伤大雅的细小阴谋、策略的微妙自得和自嘲。而表面上和程序上的工夫不忘做得圆熟完满,“我必须机警,把这样的话声放低:你爱吃樱桃吗?不。你爱黄昏吗?/不。”最后在约定再会中结束,谈话成为例行公事的敷衍、细小的攻守策略和无话找话的尴尬的拼凑组合。“孤独的时候,安闲在陌生的人群里,/在商店的窗前我整理一下衣襟,/我的精神是我的,没有机会能够放松。”在这场无关爱情的约会中,逐渐弥散开来的是一种生存的沉闷、空虚和寂寥感,普通人在大时代中的疲惫厌倦、不在状态和生存的脱序错位感因体现了普泛的现代生存感受而产生打破时空的共鸣。

三、戏剧结构

戏剧结构也是九叶诗人广为采用的戏剧化手法之一。这类诗歌以矛盾冲突为中心组织完整的戏剧情境,在较为完整的开端、发展、、尾声中展示丰富复杂的诗歌内涵,通常都有严整的构架和丰富的诗思。

穆旦的《诗八首》属于中国传统中的“无题”一类的爱情诗,但是穆旦以超越生活层面的理智,对自身和人类恋爱的情感及其过程,进行了充满理性的分析和客观化的处理。穆旦对于客观化抒情的钟爱可见一斑。诗歌以“我”、“你”和造物者“上帝”(“主”)三者之间相互的声息消长、磨合抗衡为线索,分为初恋、热恋、宁静、赞歌四个部分,完整地抒写和礼赞了人类的爱情,也包括诗人自己的复杂丰富的爱情历程。

诗的开始“我”的热烈和“你”的冷静形成矛盾,使得“我们相隔如重山”;超越了理性控制进入热恋的阶段,“你我”之间获得了爱的狂热和惊喜;宁静的“沉迷”和对人类爱情更为深入抽象的凝想;直至尾声对人类爱情的最终归宿的礼赞。如果采用叙事手法,这样的长诗难免会带有散文化的倾向,这种类似“起承转合”的戏剧性结构,增大了诗歌的容量,又简洁紧凑,使诗歌文本非常有张力。

袁可嘉提出“现实、象征、玄学的综合传统”的诗歌现代化的创作原则,穆旦成为实现这一倾向的“自觉地努力,担当伟大的寂寞与严肃的工作”的诗人。在新诗现代化的进程中,穆旦和九叶诗人作出的贡献是巨大的。虽然也有过“我曾经迷误在自然底梦中,/我底身体由白云和花草组成,/我是吹过林木的叹息,早晨底颜色,/当太阳然给我刹那的年轻”这样清新柔美的诗句,但是诗人理性深刻的玄想、曲折晦涩的表达,也给诗歌的解读带来了巨大的压力。在如今文化多元化的大环境下,诗歌逐渐成为诗人过度“私人化写作”的牺牲品,而难以被广大读者接受。伴随诗歌相对沉寂的状态,诗歌标准也出现了混乱,重新审视穆旦对新诗现代性传统的构建,对我们而言是一种警示。

注释:

①孙玉石.中国现代诗导读(穆旦卷).北京:北京大学出版社,2007.

[1]钱理群,温儒敏,吴福辉.现代文学三十年.北京:北京大学出版社,1998.

关键词:学习情境;算法库;数据结构;算法代码

AccordingtotheLearningEnvironmentDesignoftheDataStructureAlgorithmsLibrary

LIYu-mei

(SipingProfessionCollege,Siping136002,China)

Abstract:Thispaperdescribesthesituationoflearningasthemainbodyofthealgorithmslibrarydesignidea,mainfunctionandapplicationofrelevanttechnology,focusedonthedesignoflearningcontext,the"datastructure"ofthealgorithmisdividedintosevenlearningcontexts,foreachlearningsituationhasindependentlearningobjectives,algorithmdesign,codedisplayexercise,practiceetc..AlgorithmlibraryisinthePBintegrateddevelopmentenvironment,theuseofPowerScriptlanguagedevelopmentiscomplete,thebackstagedatabaseusingAccess.

Keyword:learningenvironment;algorithm;datastructure;algorithmcode

随着教学改革的不断深入,如何提高《数据结构》课程的教学效果成为困扰讲授本课程教师的一个重要问题。而《数据结构》教学过程中教学重点和难点是算法,算法的种类繁多、编写有一定的难度,不同的算法中有许多相近或相似的地方,使得学习者掌握起来感到很困难。针对这种情境,经过多年的研究与实践,本人认为采用情境教学法比较有效。于是决定开发一个基于学习情境的数据结构算法库。

1基本思想

2数据结构算法库系统功能模块

1)系统管理模块

本模块包括用户基本信息管理,数据备份及数据恢复。主要实现用户基本信息的添加、删除,保存,查询,备份数据库形成备份文件及从后台备份文件中进行数据恢复等功能。

2)算法基本信息管理模块

本模块以网格方式和自由表方式进行算法基本信息的操作,主要实现算法基本信息的插入,删除,更新,查询,打印,排序等功能。

3)算法代码管理模块

主要实现算法代码的插入、删除、修改已存在的算法代码、保存算法代码、导入[1]、清除、打印,可以在下拉列表框中选择算法名称即可显示代码并查看运行结果等功能。

4)算法运行环境模块:

本模块主要包括运行环境简介、TC软件安装,TC运行环境、VC++6.0安装,VC++运行环境的挂接,只要安装了相应软件就可进行相应运行环境。

5)学习情境设计

学习情境一线性表:将线性表算法分成顺序表、链表、线性表应用三类

学习情境二栈:将栈算法分成顺序栈、链栈、栈应用三类,

学习情境三队列:将队列算法顺序队列、链队列、队列应用

学习情境四二叉树:将树算法:二叉树常用算法、二叉树应用算法分成二类

学习情境五图:将图算法分成二类:图的存储结构、图的遍历算法

学习情境六查找:将查找分成两类:、无序表的查找、有序表的查找

学习情境七排序:将排序算法分成插入排序算法、选择排序、交换排序

6)系统帮助模块

本模块主要是为了方便用户的使用提供了详细的帮助功能,用户可以通过帮助了解系统如何使用,有疑问可以查看帮助,同时在帮助中点击右键会弹出快捷菜单,可复制、粘贴帮助中的文本信息及代码。

3应用技术

1)数据窗口[2]的应用

在本系统中大量使用了数据窗口控件,包括基本信息的显示,浏览,算法代码的显示,查询,学习目标的显示及习题实践的制作等都是通过数据窗口来实现的。PB在数据窗口对象中提供了丰富的数据显示方式,可以满足各种不同的需要。开发人员可以将对数据的增加、删除、修改、询等功的按钮放置在数据窗口的内部,简化了程序设计。

2)数据查询

在数据结构算法库中,综合查询是主要功能,可以按所算法的名称、学习情境及算法功能等进行综合查询[3]。同时本窗口还可完成记录定位、打印查询结果等功能。查询的方法很多,有通用查询,模糊查询,精确查询,动态查询[4]等,本系统主要采用动态查询的方法来完成信息的查询。

3)自动配置ODBC数据源

在PB中要使用数据库,必然要通过ODBC接口[5]来实现,配置好数据源后,便可在程序代码中连接数据库并对数据库进行各种操作。那么如何才能在代码中实现对ODBC数据源的配置呢?其实,Windows中所有的ODBC数据源在系统注册表中都有记载,只要对注册表的项目进行相应的修改即可实现。在本系统中,建立一个全局函数,取名为f_odbc,设置3个参数,类型均为string型,三个参数分别代表当前工作路径及数据库文件名,系统目录名和数据源名。具体函数代码略

在应用程序的open事件中调用此函数并用代码连接数据库

stringcurrentdir,sysdir

currentdir=space(256)

currentdir=getcurrentdirectory()

sysdir=space(256)

GetSystemDirectory(sysdir,256)

f_odbc(currentdir+"\datastruct.mdb",sysdir,"data20")/*调用自动配置数据源函数*/

SQLCA.DBMS="ODBC"

SQLCA.AutoCommit=False

SQLCA.DBParm="ConnectString='DSN=data20;UID=;PWD='"

4)调用外部应用程序[6]

在本算法库中涉及算法的运行环境,要执行这些算法需要调用TurboC或VC++外部程序,这里用的是RUN()命令。同时在系统中还提供了TC和VC++6.0软件的安装功能。

4结论

本算法库是以《数据结构》课程的算法部分为基础进行的研究与设计,采用个案研究的方式,在学习情境中对算法信息和算法代码及运行结果进行管理及分析,从而提高学生的算法设计能力,本算法库具有很强的实用价值。

[1]李体新,李兰友.PowerBuilder8.0中数据导入技术的实现[J].微机发展,2004,(11).

[2]李政,任秀丽,董延华,等.PowerBuilder10.0应用基础与实例教程[M].北京:中国水利水电出版社,2006.

[3]李元松.PB开发过程中几个常见问题的解决技巧[J].武汉化工学院学报,2004(1).

[4]张长伟.PowerBuilder中动态SQL的实现[J].浙江万里学院学报,2004(5).

关键词:重庆市;居民消费;消费函数

一、引言

改革开放以来,重庆市居民的生活水平有了很大改变,正处于从温饱型向小康型转变的关键时期。但是,作为中国西部地区唯一的直辖市,重庆在经济发展的过程中同样出现了居民消费支出逐步下降的情况。因此,对重庆的居民消费进行研究就有着很重要的意义。因此,根据持久收入模型和生命周期模型,本文对重庆居民自改革开放以来的的消费变化进行分析。

二、数据的选取

本文的数据选取1998年到2014年的人均纯收入和人均消费支出,如表1所示。

三、重庆市居民消费函数分析

(一)建立生命周期理论模型及其分析

C=αY+βA(1)

其中,式(1)中C表示消费;Y表示收入;A表示非人力资产净值,用公式表示如下:

A=A0+Y0-C0(2)

即上期储蓄与上期初资产净值之和即为期初的资产净值。另外,由于:

C0=αY0+βA0(3)

将式(3)代入式(2),得到

C=αY+(β-α)Y0+(1-β)C0(4)

上式中,C为当期消费;Y为当期收入;C0为上期消费;Y0为上期收入。

重庆居民的人均消费支出和人均纯收入如表1所示。此时,另Y为纯收入,C为消费支出,利用软件Eviews按照式(4)进行回归计算,结果如下:

C=0.892Y-1.354Y0+1.526C0

(5)

从回归结果得出,R2=0.993,α=0.892,β=-0.324,代入式(1)得

C=0.892Y-0.324A(6)

从以上结果可以看出,回归方程的拟合度比较好,被解释变量受到解释变量的明显影响,进一步较好地验证了生命周期理论。对回归模型的结果进行分析,从而可以得出如下结论。

1.重庆居民的消费与收入表现出正比关系,即重庆居民的消费支出随着收入的提高而不断增加。从结果看出,重庆居民收入的边际消费倾向相对较高,达到0.892,进而说明居民开始资产积累,用作生命周期消费的资产积累还不足,因此,居民比较多的收入增量主要用于消费。

2.重庆居民的当期消费与期初非人力资产净值表现出反比关系,即重庆居民的消费支出随着年初资产的增加而不断减少。从结果看出,重庆居民的资产存量的边际消费倾向是-0.324,也就是说年初资产存量每增加1元,当年消费支出就会减少0.324元。因此,重庆居民在一定的收入水平下用于生活消费的支出由于储蓄和投资增加而不断下降。

3.重庆居民的现期消费与滞后消费表现出正比关系。从结果看出,滞后消费系数是1.526,说明重庆居民的当前消费在一定程度上会受到过去消费的影响。

4.从结果来看,重庆居民的本期收入是影响消费的一个最主要因素。如果要提高居民的消费水平,关键是增加居民的收入。

(二)建立持久收入理论模型及分析

弗里德曼的持久收入理论认为,人们在计划自己的消费水平时主要是根据长期的持久收入,而不是根据短期的可支配收入,即持久消费CP表示为持久收入YP的函数,具体如下:

其中,YP表示当期持久收入;Y表示当期实际收入;YP0表示上期持久收入;0

C=CP+Ct(9)

暂时消费Ct表现出了不规律的变化,将其归入随机项V之内,将式(7)和式(8)代入式(9),得到:

C=kθY+k(1-θ)YP0+Ct(10)

另外,因为CP0=KYP0,C0=CP0+Ct0

所以,最后推理得到:

C=KθY+(1-θ)C0+v(11)

将重庆市居民的滞后人均消费和人均纯收入当作解释变量,人均消费当作被解释变量,其中数据如表1所示。利用Eviews软件,按照式(11)进行回归,结果如下:

C=0.835+0.036C0

(4.5)(0.215)(12)

R2=0.987

从回归结果来看,滞后消费的系数没有通过t检验,即作为解释变量的滞后消费基本不具有统计上的显著性,因此,上述模型无法成立。从数学角度来看,重庆居民自改革开放以来的消费行为不适合利用持久收入理论模型来做解释。暂时收入与持久收入无法准确区分、公式的推导过程中有很多假设等因素可能是造成该情况的原因。但是,还是可以看出,消费与实际收入呈现正比关系,即影响重庆居民消费的一个最主要因素是实际收入。

从以上生命周期理论模型及持久收入理论模型的分析结果可以看出,重庆市居民消费的主要影响因素是收入。

由于消费受到收入的显著影响,因此,重庆扩大居民消费需求的主要途径就是通过调整居民收入的分配比例,进而提高居民收入,同时,重庆要努力提高消费者的收入预期,增强消费者信心。

[1]马光辉.中国消费与经济增长关系的实证分析[J].山东经济,2006(02).

THE END
1.深度学习数据清洗的目的mob649e81673fa5的技术博客深度学习的成功依赖于高质量的数据。在深度学习之前,数据清洗是一个至关重要的步骤。本文将详细介绍数据清洗的目的,流程及实现步骤,帮助初学者更好地理解这一过程。 数据清洗目的 数据清洗的主要目的是去除噪声和不一致的数据,确保输入到深度学习模型中的数据是准确和高效的。具体包括: https://blog.51cto.com/u_16175512/12697067
2.如何在数据分析中进行数据清洗?四、格式内容清洗一般采集数据的方式有两种:一种是系统采集,在这种情况下因为数据格式是提前预设,所以数据格式一般情况是不会存在偏差;另一种是通过人工收集或者人工填写,那么这种数据格式和内容上就会存在问题,比如说:字段显示格式不一致、内容中存在无法计算的字符等情况,造成数据偏差。那么久需要对数据进行格式的清洗https://aiqicha.baidu.com/qifuknowledge/detail?id=17001272656
3.数据清洗浪费时间,是没有意义的。()刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供数据清洗浪费时间,是没有意义的。()A.对B.错的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转化为在线题库,制作自己的电子错题本,提高学习效率https://www.shuashuati.com/ti/5a725202edec42f58aa12db4f0643b47.html
4.什么是数据清洗,数据清洗的原理,各种数据包的意义。数据清洗顾名思义就是能清洗出号码中的不可用号码,和以往传统的号码匹配不同,最新型的清洗方式是系统拨测清洗,精准度不仅高速度还特别快。企业仅仅需要做的就是把号码导入系统,完成检测以后新的号码会自动被导出、分类。这样不仅能够使企业的号码库保持最新,更能使企业未来的发展道路顺畅。 https://www.jianshu.com/p/82ee0adec35e
5.Discuz!阿里云清洗违规内容大量数据断点清洗组件(apoylDiscuz阿里云清洗违规内容 大量数据断点清洗组件,阿里云清洗违规内容:实现主题和回帖后台自动提交内容到阿里云内容安全并且清洗违规内容自动进入回收站或者进入重审。请看具体功能概述及应用功能部分截图更直观。 备注:必须开通阿里云内容安全1.0(so easy);部分功能需要https://addon.dismall.com/plugins/apoyl_aliyunaiclean.90872.html
6.高中信息技术项目式数字化学习资源的设计内容因此,本次结合教材中的“共享单车”项目情境,构建一份对学生有用且有意义的项目式数字化学习资源。从问题定义开始引入——即预测某市某一区域内自行车共享项目的自行车租赁需求。接着,根据问题采集相关数据,进行初步清理(俗称数据清洗)[10]。之后,基于问题定义和采集的数据,进行可视化分析,最终形成报告。通过提供一个生https://tpd.xhedu.sh.cn/cms/app/info/doc/index.php/92574
7.《数据采集与清洗》课程教学大纲.docx想预览更多内容,点击免费在线预览全文 免费在线预览全文 PAGE 1 《数据采集与清洗》课程教学大纲一、课程基本信息课程编号:12162 课程名称:数据采集与清洗英文名称:Data Collection and Cleaning 课程类型:专业课课程要求:必修学时/学分:32/2 (讲课学时:24 实验学时:8)先修课程:程序设计语言、数据结构与算法、数据库https://max.book118.com/html/2022/0226/8016111055004060.shtm
8.数据清洗对数据分析的影响是什么?数据清洗对于数据分析的影响是显著的。它可以提高数据质量,揭示隐藏模式和关联,减少误差和偏差,提高数据的一致性和可比性,同时增强数据的可用性和可理解性。因此,在进行数据分析之前,务必进行适当的数据清洗和预处理,以确保得到准确、可靠且有意义的分析结果。 https://www.cda.cn/view/203652.html
9.什么是数据清洗?面对常见的数据清洗问题,有哪些解决方法?答案是——数据清洗。简单来说,数据清洗就是对数据进行审查和校验的过程,目的是删除重复信息、纠正存在的错误,并提供数据一致性。如何有效进行数据清洗,走好数字化转型的每一步,是企业要思考的重要命题。 一、数据清洗的意义. 众所周知,在数据分析报告中,未经清洗的数据很可能会导致错误的结论,降低报告的可信度。而https://www.fanruan.com/bw/doc/180930
10.有效的高频数据一定要经过清洗和对比3、真正可以说明问题的高频数据,一定是经过清洗及对比过的高频数据: 1)高频数据一定要具有经验意义,其前提是可提供参考的样本容量足够多、样本时间范围足够长; 2)数据口径问题往往会造成“伪预期差”:譬如流量及存量混淆的问题、量纲需要齐平的问题以及阶次统一的问题。 https://wallstreetcn.com/articles/3477240
11.数据清洗涵盖了哪些方面?探索数据处理的全貌与重要步骤此外,数据安全问题也是数据清洗中需要重视的方面。在数据清洗过程中,可能涉及敏感数据,必须采取数据加密、访问控制和安全审计等措施,确保数据的保密性和完整性。 结论:数据清洗的重要性与实践意义 数据清洗作为数据处理过程中不可或缺的步骤,对于保证数据质量和有效进行数据分析具有至关重要的意义。 https://www.zhaocaifu.cn/article/99497.html