本发明属于大数据环境下的神经网络客流预测技术领域,具体指代一种大数据环境下基于递归神经网络(rnn)优化算法的地铁客流预测方法。
背景技术:
轨道交通在规划初期会进行中长期客流预测,但由于客流预测内容和预测条件的复杂性,其客流预测结果与实际运营客流统计值相差较大,实际运营中预测数据的可参考性比较差。
准确地预测地铁客流数据,对地铁运力安排、未来的发展和建设、功能的规划都有着至关重要的作用。因此,准确预测地铁客流量就成为了地铁运营管理中的一个重要课题,是地铁资源有效配置的根据。
神经网络(neuralnetworks)是一个高度复杂的非线性动力学习系统,作为对复杂非线性系统的逼近器,具有自学习、自组织及泛化能力,在预测领域有很大的优势。
递归神经网络(recurrentneuralnetwork,rnn)是神经网络的一种,继承了神经网络在函数逼近上具有自学习、自适应、容错等优点,克服了网络不收敛、收敛速度慢的问题,加上在大数据环境下,海量的数据为递归神经网络(rnn)提供了充足的训练样本,在预测精度方面也有较大提高。
技术实现要素:
针对于上述现有技术的不足,本发明的目的在于提供一种基于大数据分析的地铁客流预测方法,以解决现有技术中常用的地铁客流量预测方法预测结果与实际运营客流统计值相差较大,实际运营中预测数据的可参考性比较差的问题。
为达到上述目的,本发明的一种基于大数据分析的地铁客流预测方法,应用于轨道交通的客流预测,包括如下步骤:
1)从客流数据库中提取客流数据,并将其导入大数据存储系统;
2)从上述的大数据存储系统中读取每天分时客流数据和/或每天累计的客流数据;
3)根据上述的每天分时客流数据和/或每天累计的客流数据利用rnn模型进行客流预测建模,并进行优化,得到客流预测数据;
4)根据上述的每天分时客流数据和/或每天累计的客流数据与客流预测数据,持续优化预测模型参数,提高下一次预测的准确度。
优选地,所述的步骤3)进一步包括:根据所述的每天分时客流数据和/或每天累计的客流数据进行基础日客流预测建模。
优选地,所述的步骤3)进一步包括:根据所述每天分时客流数据和/或每天累计的客流数据进行基础周客流数据建模。
优选地,所述的步骤3)进一步包括:根据所述每天分时客流数据和/或每天累计的客流数据进行基础月客流数据建模。
优选地,所述的步骤3)进一步包括:根据所述每天分时客流数据和/或每天累计的客流数据进行季节性客流数据建模。
优选地,所述的步骤3)进一步包括:根据所述每天分时客流数据和/或每天累计的客流数据进行路网结构客流数据建模。
优选地,所述的步骤3)进一步包括:根据所述每天分时客流数据和/或每天累计的客流数据进行线网结构客流数据建模。
优选地,所述的步骤3)进一步包括:根据所述工作日客流数据和非工作日(双休日及国定节假日)客流数据分别进行客流预测建模,得到工作日客流预测数据和非工作日客流预测数据。
优选地,所述大数据存储系统读取地铁线路实际发生的客流数据和客流预测数据优化预测模型参数,得到优化后的预测模型参数。
本发明的有益效果:
本发明基于递归神经网络(rnn)技术,具有自学习、自适应、容错等优点,在大数据存储系统源源不断的海量数据训练下,建立预测模型参数,并根据系统自身预测的客流数据与实际发生的客流数据进行比对,持续优化预测模型参数,提高客流预测数据的精确度。
附图说明
图1为本发明预测方法的流程图。
图2为本发明基于rnn的客流预测模型图。
图3为rnn模型图。
图4为rnn模型展开图。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
参照图1,图2所示,本发明的一种基于大数据分析的地铁客流预测方法,应用于轨道交通的客流预测,包括如下步骤:
1)从地铁售检票系统客流数据库中提取客流数据,并将其导入大数据存储系统;
3)根据上述的每天分时客流数据和/或每天累计的客流数据利用rnn模型进行客流预测建模,并进行参数优化,得到客流预测数据;在建立的模型中,共有三层:输入层、隐藏层和输出层;xt-1,xt-2,xt-3为输入层三个历史同期时刻t-1,t-2,t-3的客流数据,yt-1为输入层上一时刻预测的客流数据,是模型中的一个反馈值,用以提高预测准确度。yt为输出层t时刻客流预测值。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行基础日客流数据建模。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行基础周客流数据建模。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行基础月客流数据建模。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行季节性客流数据建模。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行路网结构客流数据建模。
所述方法中,根据所述每天分时客流数据和/或每天累计的客流数据进行线网结构客流数据建模。
所述方法中,根据所述工作日客流数据和非工作日客流数据进行客流预测建模,得到工作日客流预测数据和非工作日客流预测数据。
所述方法中,根据所述大数据存储系统读取地铁线路实际发生的客流数据和客流预测数据优化预测模型参数,得到优化后的预测模型参数。
模型参数计算过程如下:
参照图3,其为rnn模型图,展开后得到图4。
st=tanh(uxt+wst-1)
如果隐藏层节点个数为100,字典大小c=8000,参数的维度信息为:
xt∈r8000
yt∈r8000
st∈r100
u∈r100×8000
v∈r8000×100
w∈r100×100
使用交叉熵作为损失函数,如果有n个样本,损失函数可以写为:
损失是交叉熵,可表示为:
其中为t时刻的估计客流,为总客流,et为t时刻损失,e为总损失,对总损失求w的偏导数为:
进一步可以将et表示为:
根据链式法则和rnn中w权值共享,可以得到:
w即为模型中所求的参数。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。