业界首个!快手提出亿级别多模态短视频百科体系快科技

团队从快手海量短视频中挖掘出亿级别知识类视频,并对其进行了结构化,构建了千万级词条和知识点视频百科体系。“快知(Kuaipedia)”的提出有助于学界推动AI通过多模态信息理解世界知识,且在产业界落地有较大想象空间。

介绍

百科全书(Encyclopedia),可以追溯到希腊和罗马,也是17-18世纪法国启蒙运动的一个杰出的成果。知识百科通常是指一个是概要介绍人类全部知识或某一特定领域或学科的工具书或纲要,在互联网急速发展的当下,网络百科成为知识新的载体,如维基百科、百度百科等。但这些百科通常以图文、表格为载体,比较难以表达一些需要生动演示的知识,比如教程(How-to)类知识。图一展示了使用图文讲述“柴犬”-“怎么画”这一知识的困境。而通过短视频,我们能够很好地对这些知识进行一个阐释和学习。

图一:图文在how-to类知识上知识传递的困境,图文来自短视频的帧截图

参考国家标准[2],我们将事实(What)、原理(Why)类知识归结为科普知识,技能(How)类归结为教程知识,在快手海量的视频中挖掘出高质的知识视频。此外,我们将短视频中抽取的知识主体以词条形式呈现(如柴犬),并抽取视频中讲解的该词条具体的知识点(如柴犬-挑选、柴犬-护食纠正等),最终构成了一个短视频的百科知识体系,如图二所示。

图二:快知——多模态短视频百科概览

“快知(Kuaipedia)”的提出有以下几个贡献:

1、“快知”的定义:我们开创性地定义了一个全新的多模态知识百科库,以词条、知识点、知识类短视频以及它们间的关系共同构成。这是业界首个结构化的多模态短视频百科。

2、构建大规模短视频百科的方法:我们提出使用知识视频识别、词条知识点挖掘、多模态知识链接的组合来构建大规模的短视频百科。并开创性提出“多模态知识链接”任务,作为传统实体链接的一个外延和扩展。

3、富有潜力和想象空间的应用:在学术上,“快知”以崭新的知识点短视频化组织形式,能够突破目前机器仅靠图文知识图谱(KG)理解世界知识的上限,在KG的一些下游任务如实体链接、实体分类,或者NLP、CV等内容理解下游任务上,有非常大的潜力。在产业界,“快知”这样的形式能够助力短视频平台进行高效地运营、组织内容,提升用户对知识的理解与消费效率。

技术概览

为了实现上述的短视频百科结构化,核心技术包括以下三个主要步骤,如图三所示。

1、知识视频识别:通过多模态视频预训练模型,理解并识别海量视频中知识类视频;

2、词条和知识点挖掘:通过多源知识库融合“自顶向下”构建词条体系,再通过对用户搜索query挖掘“自底向上”构建词条与知识点关系,形成词条知识点树;

3、多模态知识链接:创新性地扩展传统“实体链接”任务,提出通过多模态内容理解技术将视频链接到词条(如柴犬)的某一个知识点(如护食纠正)上的“多模态知识链接”任务。

图三:快知构建技术链路

应用

首先,“快知(Kuaipedia)”这样的多模态短视频百科体系,在学术界对于推动AI理解世界知识的技术发展有极大的潜力。一方面,“快知”突破图文和表格的局限,通过更丰富的知识点和短视频来描述某一个实体或者概念,这种方式能够推动多模态知识图谱技术的发展。另一方面,这些知识点和短视频有助于AI更好地理解世界知识,尤其是一些图文难表述的How-to类知识,这种多模态知识能够增强AI对世界的理解,对KG、NLP、CV等领域的下游应用都很有帮助。我们在CCKS实体链指的任务上,证明“快知”多模态知识的简单引入就能有效提升BERT在实体链接和在实体分类上的性能。

图四:快知在健康场景落地

除健康外,“快知”还覆盖了教育、美食、三农、亲子、法律、科技、金融等众多领域的知识内容,有着较大的应用潜力。

结语

面对泛知识类内容在短视频行业的发展前景,我们提出了“快知(Kuaipedia)”多模态短视频百科体系,从存量的海量短视频内容入手,通过多模态知识图谱构建技术挖掘出亿级别高质量的知识视频,并将知识内容结构化,构建业界首个大规模体系化的短视频百科知识库,其在学术界和产业界有较大的潜力和想象空间。

作者介绍

第一作者:潘浩杰

快手MMU知识图谱中心成员,快知项目负责人,本硕毕业于浙大和港科大,曾在阿里云PAI负责大规模NLP算法与框架,在ACL、EMNLP、KDD、AIJ等顶会顶刊中发表10余篇论文,多项国内和美国专利,详见知乎。2021年加入快手。

通讯作者:付瑞吉

快手MMU知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后。曾担任科大讯飞AI研究院副院长,获吴文俊人工智能科技进步奖一等奖。在ACL、EMNLP、Coling、IJCAI、TASLP等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利四十余项。2021年加入快手。

合作老师:刘铭

教授/博士生生导师,哈尔滨工业大学计算学部。先后主持国家重点研发计划项目课题、国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、黑龙江省面上基金等多项基金项目。获黑龙江省科学技术一等奖,哈尔滨市科技成果,第六届全国青年人工智能创新创业大会一等奖。近年来以第一作者或通讯作者发表CCFA/B类论文20余篇,参编教材一部,英文译著一部。担任NLPCC2020、CCKS2020、COLING2022知识图谱领域主席,CCKS2019出版主席、CCKS2021评测主席、CCKS2022讲习班主席。

THE END
1.宪法小知识视频 鉴古知今 循法而行 琼瑶 我不想听天由命 我国成功发射海哨一号卫星 坚持改革和法治相统一 何依婷宣布怀孕 琼瑶告别视频 宝宝树CEO愤而退员工群 今日人民币对美元中间价报7.1934元 洪小铃官宣结婚怀孕 华为Mate 70 Pro+跌落测试 雪场回应因滑雪太好要求出示证明 作家琼瑶自杀身亡 男子深夜上班途中偶遇https://m.163.com/v/video/VWHL6CFAH.html
2.法律文件咪咕视频查看法律文件方法详解咪咕视频里面不仅提供了各种视频给大家收看,而且各位也可以通过软件来查看法律文件。还有一些朋友们不知道咪咕视频如何查看法律文件,那么接下来各位就跟随小编一起来看看咪咕视频查看法律文件方法。 第一步,选择页面右下方【我的】图标点击进入; 第二步,选择界面中【我的设置】图标点击进入; https://g.pconline.com.cn/x/159/15981248.html
3.火山小视频成老百姓心中的“百科全书”?这都归功法律工作者的入驻火山小视频成老百姓心中的“百科全书”?这都归功法律工作者的入驻!_北京时间 很多人都不知道,就是这样戴着大大的眼镜、用不紧不慢的语速在火山小视频科普法律知识的许婷律师,其实还担任着多家上市公司及知名企业刑事辩护主力律师的职务呢。 当下,短视频因超强的娱乐性而深受普通民众的喜爱。就在大家都以为短视频只https://m.btime.com/item/07fl77c91msp447eets9ajsh4ea
4.#智慧档案形堂#智慧档案@融安特@兰台之家法律视频法律视频:#三分钟档案百科 本期内容与您一起学习最新施行的《档案法实施条例》#智慧档案小课堂#智慧档案@融安特@兰台之家https://tv.sohu.com/v/cGwvOTg2NDYxMy81NDk3MDg1Njkuc2h0bWw=.html
5.这部“社会生活百科全书”,你了解吗?▲这部“社会生活百科全书”真的来了!视频来源:南方日报 我国民法典编纂完成实施时起,我们就进入了民法典时代。作为新中国第一部以法典命名的法律,《民法典》具有里程碑的意义。 全国人大宪法和法律委员会委员、中国社会科学院学部委员孙宪忠提到,在我国法律体系中,以“法典”命名法律,这还是第一次,甚至从它严密的http://news.hnr.cn/rmrtt/article/1/1335807703280390144
6.购房人入住后发现房子已被拍卖怎么办4、购房人还可以考虑通过法律途径维权。如果上述方法无法解决问题,购房人可以选择通过法律途径维权。购房人可以委托律师起诉开发商,要求其承担相应的法律责任,并要求法院判决恢复自己的合法权益。同时,购房人还可以要求开发商赔偿自己的经济损失和精神损害。 相关百科视频 http://www.loupan.com/bk/163010.html
7.萌娘百科:方针以独立站点名义在萌娘百科内创建页面描述事物,应在七日内完成页面整改或移动至其他站点。对于逾期未完成的,维护人员应删除对应页面。除前述存废方式外,若有管理员或STAFF认定应当进行页面存废处理的其他情形,亦可选用合适方式进行。 涉及到违反内容管理方针或其他法律法规的页面,维护人员应立即删除并视情形提报监督员https://zh.moegirl.org/%E8%90%8C%E5%A8%98%E7%99%BE%E7%A7%91:%E6%96%B9%E9%92%88
8.央视网视频八集纪录片:《鉴史问廉》视频简介:(来源:百度百科) 《鉴史问廉》是由中共河南省纪律检查委员会、中央电视台、河南省新闻出版广电局、河南电视台联合摄制的大型历史文化纪录片。该片以中华传统文化为视野,以“廉”为核心,以“清、勤、慎”为主题,从历史的兴衰之道中探寻廉政文化的力量,为盛世鸣警钟,为时代举镜鉴。 https://jiwei.upc.edu.cn/2015/0701/c15195a216394/page.htm
9.专题网信普法进网站社会上述添加侮辱性字句的行为经“百度百科”编辑审核发布并保留至2018年7月;其父代表作一直未恢复。赵某某认为该行为侵害其父及家人的名誉权,百度公司对词条编辑的审核存在过错,应承担停止侵害、恢复原状、赔礼道歉、赔偿损失等法律责任。详情>> 网络诈骗花样多 检察官提醒您:不听不信不转账!http://www.cqqnb.net/society/2019/0909/130680.html
10.会计百科会计网2025年涉税服务相关法律讲师推荐,听谁的课比较好? 2025年涉税服务实务哪个老师讲课讲得好? ACCA待遇好吗?多久能考完? ACCA考季时间是什么时候?要花多少钱? 大三时期适合报考FRM证书吗?一起了解! 2025中级经济师报名时间预告,附报考流程! ACCAF1多少分通过?考不过可以补考吗? ACCA考试P阶段难度高吗?附备考建议!https://www.kuaiji.com/
11.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub深夜脱口秀能否适应互联网视频的逻辑? 622 俄乌战争阴影下的维基百科 2022/10/11 维基百科:俄罗斯政府眼中的刺头; 战争打响后,威胁屏蔽维基百科; 除了屏蔽之外,俄罗斯还有这些手段. 621 记者与“公民侦探”合作 2022/10/6 对国会山骚乱的调查; 媒体与公民侦探之间的合作与桥梁; https://github.com/Newslab2020/Contents/blob/master/premium.md
12.百科视频百科高清原创视频下载携程超级假期|夏日旅行百科全书Dir 广告片-互联网服务 广告片-旅游 Hello 制造 等 17 位创作人 Hello 制造制作 AK摄影指导 梦芷影像调色师 孙海晨DIT 民法典 法律 法制 中华人民共和国民法典AE模板 来自 新片场素材 播放:3.2w 人气:3543 时长:02:51 了不起的匠人 | 木版年画 短视频-生活记录 知了青年https://www.xinpianchang.com/search/36305
13.金融视频百科投资理财视频百科金投网整理提供黄金、白银、期货、能源、保险视频百科等相关视频内容,提高大家对金融基本知识和投资理财基本知识的了解。https://www.cngold.org/video/
14.文化大百科视频CCTV节目官网CCTV3文化类电视栏目。以“探寻文化轨迹、索引中国文化精髓”为宗旨,以演播室主持人播报加专题片的基本形式,旁征博引,图文并茂。集知识性、科学性、趣味性、参与性、服务性于一身,是现代影视版的百科全书。https://tv.cctv.com/lm/whdbk/videoset/
15.百科全说湖南卫视百科全说百科全说,生活小常识,健康常识,电脑常识,生活小窍门,民间偏方,饮食常识,法律常识等生活中的百科知识.http://bk.wdsjz.com/
16.首页商学院大百科视频站MBA学校视频,海外MBA,还是中国MBA?脱产还是在职?联考GRK还是GMAT?选中欧、清华、北大、人大、复旦、交大、曼彻斯特、HEC、INSEAD、马赛?商学院大百科WhichMBA.net是365天不落幕的MBA课程展览会,帮您寻找最合适的MBA、EMBA和各类管理课程。网站专业提供国内外EMBA、MBAhttp://video.whichmba.net/
17.Lifeofvids视频素材网简介→MAIGOO百科Life of vids是一个基于众多摄影师自发分享的视频和图片素材网站。站内提供了许多精美的高清无版权视频,这些视频涵盖了各种不同的主题和场景,包括自然风光、城市景观、人物生活、旅游摄影等等,很适合作为视频的B-roll使用。网站现阶段可免费使用,没有限制,可以应用于个人或商业用途。详细https://www.maigoo.com/citiao/1063585.html
18.112集乐乐课堂历史大百科趣味视频百度网盘下载版权声明 本页内容为互联网公开发表整理,我们未提供任何视频、音频以及文档等实体文件下载,如有侵权来信即删,邮箱5460xnz@126.com,如你发现或认为链接存在违规侵权,触犯您所在地法律的结果,请立即向所属链接(百度网盘,新浪网盘等文件托管机构)举报。点击提取码下载 提取码:62i3 亲子豆:20个100%有效,有疑问+V:http://qinzi.ren/m/jiankangshipu/2022/0301/15504.html
19.www.mynesensor.com/aplhtml39195.htm二,欧美性爱小草视频,舒服了22p 三,日本和尚电视剧是什么,男生坤坤插进女生甜甜圈里 四,熟女乱仑小说,唐三的坤坤戳在小舞的坤坤里而不是他 五,露小内裤奶头白丝jk美女图片,午夜天堂扣逼吃鸡巴 六,白虎嫩高中生,日本人妻少妇精品视频专区 七,欧美一级A片免费区 http://www.mynesensor.com/aplhtml39195.htm
20.www.cjkj88.com/aplpage57441.html国产裸体美女无遮挡裸色视频网站 系花女神,忘情啪啪,8mAV 95.73MB 945好评 爱搞传媒在线直播 stepmomfuck 精东影视文化传媒有限公司女演员 457.80MB 361好评 直人黄片 国产又大又猛又粗又长的视频 范冰冰BB操BB 253.16MB 56好评 蘑菇视频智库百科 轮流灌注无码网站 https://www.cjkj88.com/aplpage57441.html