人工智能深度学习下运维日志分析的趋势解读与应用实践个人文章

本次学术论坛我们邀请了云智慧算法实习生、北京航空航天大学博士在读生郭同学为我们从学术界角度简要介绍该领域与深度学习结合的近期进展。

一、日志研究概述

四、总结

日志数据由系统运行产生,它详尽描述了系统大规模内部事件以及用户的意图。随着大规模IT系统的快速发展,日志数据的数量已经增长到传统方法难以分析的程度。除此之外,日志的标签获取与标注也比较困难。下图展示了从代码到日志的过程,相同系统的日志也会产生个性化内容,我们可以在代码中定义任何我们想要的系统反馈。

为解决上述瓶颈,运维人员尝试通过集成人工智能算法来增强IT运维能力,由此诞生过一批基于传统机器学习算法。近些年,随着计算算力发展和数据体量增大,深度学习技术开始被用于日志分析领域,研究者们认为半结构化的日志消息也包含部分系统语义,类似于自然语言语料。因此研究者们纷纷采用语言模型对日志数据进行建模分析,例如LSTM,Transformer等。为解决标签难以获取问题,一批研究者采用自监督、无监督,弱监督、半监督等不需要完整标签的方法,例如近期出现的Log领域的Bert等。也有采用迁移学习、集成学习、持续学习等不同的学习方式去各方面高效提升运维效率。总而言之,研究者们正在深挖深度学习在该领域的研究和应用价值。

对于日志的研究大致可以分为三个方向:LogCompression(日志压缩)、LogParsing(日志解析)、LogMining(日志挖掘)。对于日志压缩,我们研究如何在不丢失重要信息的基础上高效压缩日志。日志解析就是从软件日志中自动提取事件模板和关键参数,日志挖掘中包含了各种任务,包括日志异常检测,日志告警等,挖掘的主要目的也是为了提高系统的可靠性。下图给出近期论文的数量和方向,我们可以发现论文数量逐年上升且大部分论文聚焦于日志挖掘方向。

海量日志数据之间语义相似性较高,实际需求需要将日志表示。因此学者期望对日志提取出固定的模版/模式以求代表整个日志数据库。经调研,当前日志异常检测方法大都需要日志解析这一步,原因在这边简述。

上图展示了日志模版提取过程,从上到下依次是原始日志,解析后的日志模版,结构化好的日志,最后将结构化好的数据送入下游各种日志挖掘任务。详细来说,L1、L2、L3、L4、L5表示五条原始日志,我们经过日志解析算法(Drainparsing)提取出三个模板:T1、T2、T3。经过Mapping后我们得到了五条结构化好的日志,即粉色框中的L1~L5。日志解析会将我们认为日志中无关的信息去除,例如Timestep、ID等。常见的解析算法:Drain(基于树结构相似度)Spell(最长公共子序列)AEL(常数和变量的发生频率)IPLoM(迭代分区策略,根据消息长度、令牌位置和映射关系等)。

2020年后的深度日志异常检测框架大都有三个部分:日志解析模块->特征编码器->分类器/解码器。这一部分将给大家介绍部分深度学习框架。

Deeplog:Anomalydetectionanddiagnosisfromsystemlogsthroughdeeplearning.

如下图所示,模型分为训练和测试两阶段,在训练阶段,原始日志经过日志解析后得到模板,随后经过LSTM网络学习表征,预测下一条日志的模板。在测试阶段,测试数据输入模型后得到预测的模板结果,如果预测的模版不在Topk个模版内,那么该条日志就被判为是异常的。

Robustlog-basedanomalydetectiononunstablelogdata.

该模型基于监督学习,模型使用基于注意力的双向LSTM架构。采用Drain进行日志数据解析,特征提取器采用Word-to-Vector和TF-IDF加权技术生成日志表征。模型将正常和非正常日志数据都用于训练,最后分类器来判断日志是否是异常。

Hitanomaly:Hierarchicaltransformersforanomalydetectioninsystemlog.

模型也是基于有监督学习,采用了基于Transformer的架构。日志解析器依旧采用Drain,在模式解析中,模板往往不会保留日志原始的数值信息,但是该模型将丢失的数值信息一并送入模型中编码,最大程度的保存了原始日志的信息,这也就是该工作的创新点所在。

Self-attentiveclassification-basedanomalydetectioninunstructuredlogs.

模型是有监督学习,采用了基于Transformer的架构。这篇工作的创新点在于没有用日志解析器,而是将整个原始的日志送入编码器编码,这会在最大程度上保留原始语料的信息,但是实际情况中的检测效率也会大大受影响。

TRANSLOG:AUnifiedTransformer-basedFrameworkforLogAnomalyDetection.

该模型也是基于监督学习,不同于上述模型几乎不变的框架,本工作在日志异常检测的思路上进行重建,主要贡献:

模型的框架图如下所示,主要分为两阶段:Pretrainging和Adapter-basedTuning。首先将所有的解析好的日志事件序列输入到预先训练好的语言模型中(这里我们采用了BERT模型)以提取表示。随后采用Transformer编码器,在高资源源域数据集上进行训练,来获得共享语义信息,然后对于目标数据源,我们冻结编码器的参数,只调整目标域数据集上的Adapter的参数。这样我们就达到了将知识从源数据集转移到目标数据集上的目的。

我们比较了六种不同的方法,在三个公开数据集上进行测试,最终我们的算法都获得了SOTA(最优表现)。同时我们参数量减少了将近百分之95%。

通过我们在智能运维行业中的深耕经验以及前沿技术的调研,我们总结了日志领域发展的以下三个趋势:由于行业普遍存在日志本身的标签获取较难的现象,无监督或者弱监督的深度学习方法将大量涌现,帮助该领域人员在无标签的数据情况下更好的从事实际研究和落地发展;而且随着运维领域多模态的发展,引入外部知识,例如知识图谱,亦或者运维数据中的调用链、指标等数据类型来扩充日志本身的原始信息,因此会出现很多基于自监督的方法和多种模态数据相结合的方向,朝着运维一体化更好的发展;随着运维数据体量不断增大,类似于自然语言领域中Bert的这种大型模型逐渐体现其性能,结合预训练和微调的学习范式,一个学习各种运维知识和日志模式的大模型将有很大机会充当AIOps的研究典范。

近年来,在AIOps领域快速发展的背景下,IT工具、平台能力、解决方案、AI场景及可用数据集的迫切需求在各行业迸发。基于此,云智慧在2021年8月发布了AIOps社区,旨在树起一面开源旗帜,为各行业客户、用户、研究者和开发者们构建活跃的用户及开发者社区,共同贡献及解决行业难题、促进该领域技术发展。

社区先后开源了数据可视化编排平台-FlyFish、运维管理平台OMP、云服务管理平台-摩尔平台、Hours算法等产品。

可视化编排平台-FlyFish:

部分大屏案例:

我们秉承MakeDigitalOnline的使命,致力于通过先进的产品技术,为企业数字化转型和提升IT运营效率持续赋能。

THE END
1.研究日记我是如何在一夜之间完成那篇关键论文的研究日记:我是如何在一夜之间完成那篇关键论文的? 昨晚,我提笔写下了生命中最重要的一篇论文。它不仅仅是一份报告,更是我对知识深入探索的见证。我想分享一下,那些激动人心的时刻,以及我是如何在压力之下,创造出这份精彩纷呈的工作。 从早晨到午夜,我几乎没有休息过。但每一次深呼吸,都让我感觉更加专注。我知道https://www.nmligkeir.cn/lv-se-sheng-huo/105945.html
2.详尽解析,形题研究工作总结报告模板格式与撰写攻略小课题工作报告模板格式 1、本课题于20xx年6月向济宁市教科室申请立项,并制定了详尽的研究方案,20xx年7月,我们成功举行了开题会并正式启动研究工作,现将主要工作汇报如下:本课题的研究旨在更新教师的教学观念,构建小学数学课堂中学生自主创新学习的教学模式,持续优化教学目标,营造一个民主、平等、和谐的师生关系,以及http://m.benbenshu.com/9476F857b7CB.html
3.学术工作报告模板精准导向研究成果的展现与分析在现代学术界,个人工作报告不仅是对已完成研究任务的总结,也是重要的沟通工具,它能够帮助研究者有效地传达自己的研究成果。因此,如何设计一个高效、专业的个人工作报告模板成为了一项关键任务。 个人工作报告模板的意义 个人的工作报告模板是一个系统性的框架,它可以确保所有必要信息得到准确无误地记录和呈现。通过遵循这https://www.rzwmsye7.cn/news/732870.html
4.系统日志html模板,系统日志模板提取方法研究系统日志(syslog)是应用系统记录的, 蕴含着大量的信息, 可以记录系统已经发生的行为, 并按照某种规范表达出来. Syslog可以用于系统异常的诊断、建立系统工作流程等, 然而直接针对海量的非结构化日志进行分析计算是不可行, 应对其做适当的处理, 以加快后续的分析效率. 现有研究工作证明, 提取日志模板是十分有效的日志处https://blog.csdn.net/weixin_39793638/article/details/118318954
5.研究报告组员日志模板.docx研究报告组员日志模板.docx,研究报告组员日志模板 1. 项目信息 项目名称: 项目起止时间: 项目负责人: 项目成员: 组员1: 组员2: 组员3: … 2. 日期 日期: 星期: 3. 工作内容 任务: 目标: 时间: 4. 重要事件 事件1: 描述: 影响: 解决方案: 事件2: 描述: 影https://m.book118.com/html/2024/0327/8112115050006051.shtm
6.专业精致的研究日志模板让科研输出成为艺术品,精致科研生活从 LaTeX 开始,LaTeX 工作室提供 LaTeX 专业服务,十年经验沉淀,只为让您的作品精致、专业、有品位。精品资源与模板下载,排版服务,技术支持,定制开发等服务。联系我们:latexstudio@qq.comhttps://www.latexstudio.net/index.php/index/details/index/mid/3715.html
7.班委管理日志——班级管理的一项新探索育人经验首先,召集各班班委进行开会研讨,充分调查了解各班班委在开展班级管理工作中的重点和难点,并广泛听取各班班委的意见和建议,为即将开始的班委管理日志模板的设定奠定基础。 2.拟定日志模板 在做好充分前期调研的基础上,着手拟定班委管理日志的模板,模板主要从日常出勤情况、上课情况、上课出现的问题及初步解决措施情况、找https://dxs.moe.gov.cn/zx/a/fdy_bjtj_yrjy/220112/1738298.shtml
8.关于规范安徽农业大学科技小院工作日志的通知各培养学院、各相关科技小院:为扎实做好科技小院人才培养工作,引导科技小院研究生重视工作日志的撰写,更好发挥科技小院工作日志的功能,现将安徽农业大学科技小院工作日志撰写模板发给你们(附件),请各相关单位及研究生遵照执行。工作日志是真实、全面反映科技小院研究http://yjs.ahau.edu.cn/info/1009/20204.htm
9.继续教育研修日志优秀范文个人研修日志通用模板继续教育研修日志是记录个人参加继续教育、专业培训、研修活动的情况和收获的记录。它不仅是对自己学习的总结与回顾,还能为今后的职业发展提供证明和参考。以下是关于继续教育研修日志优秀范文,以及个人研修日志通用模板的相关内容,可供有需要的朋友来参考和借鉴。 继续https://wenku.puchedu.cn/45001.html
10.工作日志模板115篇(全文)工作日志模板1 第1篇 班主任网络工作日志 班级;二年级六班 班主任: 四实小2013级6班2014-08-23 16:27:27 各位家长,你们好!暑假临近结束,望各位调整好孩子的作息时间,督促完成假期作业,为开学做好准备!并时刻提醒孩子的假期安全。四实小2013级6班2014-09-01 12:11:25 各位家长:你们好,自今日起我们实行秋季https://www.99xueshu.com/w/fileudol2mag.html
11.科研立项科研日志模板.doc科研立项科研日志模板大学生科研作品立项项目研究日志项们在 9 月 8 号中午召开了一个小型会议,会议的主要内容是交流一下各自在家乡进行调研的收。从队长王善良开始,每个人都讲了进度总结了自己的暑假调研经历。最后由殷之生同学将这些经历记录下来,并将它们整理好,以便以后写论文时用。具体结论也将以论文的形式https://www.taodocs.com/p-713818660.html
12.实训日志模板(精选4篇)篇2:实训日志模板 这学期,学院和老师通过研究讨论,分析各方面的因素,结合实际情况,决定让我们2009工商管理专业的同学为期两个星期的社会实践课程。这对于即将进入社会的大四的学生来说,无疑是最好最恰当的选择,这可以让我们对社会有个初步的了解,也为今后走入社会做好前期的准备。以下是我每天的工作日志: https://www.360wenmi.com/f/filearb233hu.html
13.工作计划及日志记录表excel模版下载这是一套工作计划及日志记录表格excel模版下载,喜欢的人都来下载吧。该文档为工作计划及日志记录表格excel模版下载,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看 上传者:weixin_38674409时间:2020-12-08 Excel表格+Word文档各类各行业模板-时间研究记录 表.zip https://www.iteye.com/resource/weixin_38609693-13569749
14.AIX:错误日志51CTO博客error log entry(错误日志记录):系统错误日志中的记录,这些记录是用来描述硬件和软件故障或操作者消息的。一个错误日志记录格式化报告的信息描述,包括的信息由:错误类型(type)、错误类(class)、可能的原因和推荐的处理操作。总之,错误记录模板构成了错误日志模板库(Error Record Template Repository)。 https://blog.51cto.com/eric1026/1915238
15.实习报告,实习日志写作模板实习报告,实习日志写作模板 邮箱:fosiw@qq.com 实习挂靠、实习证明、三方协议 线上实习、实习简历、实习报告 在踏入社会、步入职场之前,实习经历无疑是大学生们不可或缺的一课。通过实习,我们不仅能够将理论知识与实践相结合,更能在实际工作中积累经验、提升自我。然而,实习结束后,如何撰写一份既全面又深刻的实习https://www.fosiw.cn/fosiw/vip_doc/28915858.html
16.实习日志怎么写?最新实习日志写作格式模板指导最新实习日志写作格式模板 篇2 由于前两天所写的计划书要等到下午才能得到曹总的点评,所以上午的任务比较轻松。我一直都在看关于vi设计的一些网上搜索的资料和从学 校带来的书籍。既然没什么特别的任务就唯有加强自己的理论知识,以备在以后的项目研究过程中运用。 https://www.liuxue86.com/a/4389296.html
17.AI写作助手工作日志撰写攻略:全面解答制作优化与实用技巧3. 借鉴优秀日志模板 在撰写工作日志时,可借鉴部分优秀的日志模板。这些模板往往具备清晰的结构和优美的语言,可帮助您增进日志优劣。 4. 定期回顾与总结 撰写工作日志的目的在于回顾和总结。在撰写进展中,要定期回顾已写日志,以便发现难题和改进。 写作助手是一款非常实用的工具能够帮助我们更高效地完成写作任务。以下http://www.tsxnews.com.cn/2024falv/aixuexi/65341.html