高通CVPR神研究:视频处理计算量降低78%,教卷积层自己“挑像素”,卡成PPT的视频纵享丝滑

图像领域,已经限制不住AI算法大牛们的身手了。

毕竟日常生活中,无论是视频通话、还是网课直播,都涉及大量的视频处理算法。

但如果这些算法性能不高的话,视频就会出现卡顿、降低分辨率的情况,体验极差。

(想象视频通话时,画面卡成PPT的情况,已经开始生气了……)

因此,降低视频算法计算量,一直是国内外AI视觉算法大牛们致力研究的问题。

它们教算法模型学会了自己“省算力”,将视频处理算法的计算效率提升了几倍不止,性能也并不下降!

教AI自己省算力,计算量-78%

用卷积神经网络处理视频,其实是一个计算量巨大的任务。

这里的“计算量”并非指视频大小,而是卷积处理图像的方式——将图像完整地“扫”一遍。

但真正的视频,往往存在大量变化不大的场景(甚至10帧内只有一只手在动):

这种情况下,如果还将每个像素都处理一遍……仿佛已经感受到GPU在燃烧了。

那么,能否教AI学会高效“偷懒”,不浪费任何多余的算力呢?

当然可以,而且有2种方法。

在第一篇论文中,提出了名为Skip-Convolutions(跳跃卷积)的新型卷积层,它能将前后两帧图像相减,并只对变化部分进行卷积。

没错,就像人的眼睛一样,更容易注意到“动起来的部分”。

很快啊,计算量一下子从10.2GMACS(每秒10^9次定点乘累加计算)降到了0.4GMACS,不到原来的4%!

注意,不止是上面的姿态估计,这个卷积层适用于任何神经网络算法,包括光流、语义分割、分类任务等。

在最新的语义分割任务中,相比于经典视频AI算法HRNet,这个算法就将计算量减少了78%,延迟降低65%,性能还不下降。

而第二篇论文采用了一个新方法,让AI模型“自行控制计算量”。

论文提出了一个名为FrameExit的网络,由多个级联分类器组成,可以随着视频帧的复杂度,来改变模型所用的神经元数量。

在视频前后帧差异大的时候,AI会用整个模型计算;前后帧差异小的时候,则只用模型的一部分计算。

也就是说,要是某一帧看起来不需要复杂计算的话,用更小的模型处理就够了。

相比于其他模型,这种方法最高甚至能提升5倍的性能。

同时,神经网络检测的精确度(mAP)不仅没有下降,甚至还增加了!

目前,第二篇论文已经入选CVPR2021的Oral。

看来我们又能用上更多性能更棒的手机视频应用了。

手机视频应用,性能超级加倍

这两项AI视频感知技术,高通已经在研究落地了。

不得不说,即使是落地的方向,也都是我们平时手机视频应用的刚需。

除了能优化视频处理算法以外,这类感知技术还能让更多AI视频模型被用到手机上。

首先是针对视频处理算法的优化。

例如,对于我们常见的线上视频会议、网课等视频通话场景来说,如果视频处理算法模型不好,实时通话的质量就会非常差。

甚至可能因此出现卡顿的情况,然后直接掉帧,比语音通话的观感还差。

但如果用上这类视频感知技术,AI就能对视频中的部分像素进行智能处理,极大地降低视频通话所需的图像计算量,让通话过程变得更流畅。

又例如,我们的手机在对视频文件进行智能剪辑处理时,往往会出现耗电量大、文件加载慢的问题。

但如果用这类算法对视频剪辑应用进行处理,不仅能优化算法本身,还能让剪辑过程变得更加丝滑。

事实上,也正是由于这类视频感知算法,让更多AI模型能被应用到手机中。

不止是一段视频,就连其中的特殊帧也能被暂停,并做成一段很有意思的视频:

又例如,各大AI视觉论文中常见的图像增强算法,以往主要是针对拍照实现,无法被应用到视频中。

但现在,由于视频计算量的下降,它已经能用在实时视频拍摄中了,甚至包括视频会议这样的场景。

以OPPOFindX3Pro的夜景摄影为例,正常拍摄下逆光、或是夜景的视频效果,在AI的计算下也能将脸看得清清楚楚:

甚至就连我们常见的视频智能稳定、视频插帧,之所以能应用到手机视频上,也离不开视频感知算法对智能帧间对比、超分辨率算法等技术的加持。

例如,这是vivoX60Pro+的视频智能稳定效果:

事实上,上面这些已经被应用到手机中的AI黑科技,背后都有着骁龙888的算力和处理性能支持。

也就是说,高通已经将不少AI视频处理算法,从“几张纸”的论文变成了实际的手机视频应用。

“隐形”AI黑科技,身边其实就不少

不止是手机应用,在这些算法的加持下不断“进阶”。

在智慧医疗、智能工厂、XR等“未来”场景逐渐成为现实的背后,同样有着无数的AI黑科技。

以我们常见的VR设备为例,由于有了AI算法的加成,摄像头也能实现由内向外更精准的追踪。

结合5G进行视频传输后,有了AI加持的VR设备,不仅能给孩子们进行科普教育、还能让医生能够给病患更细致地讲解病情。

利用东大集成研发的“小码哥”进行扫描后,医生就能快速获取全部信息,及时进行诊断。

又例如,利用AI+边缘计算+5G,就能做出替代人眼进行质量检测和瑕疵识别的智能化数字生产线,让工厂节省大量人力成本。

不仅如此,工业搬运机器人也能通过5G+AI,对摄像头所收集的视频流数据在云端或边缘侧进行智能分析,从而实现远程操控。

但用户并不需要了解其中的每一个细节。

因为,高通这样的前沿科技公司,正将这些技术难点一一攻克。

△高通在AI方向的应用布局

然后,再以产品的方式呈现出来,让每一个用户都能无差别地享受最新科技突破。

黑科技有多复杂?

那不是大多数用户需要考虑的。

两篇CVPR2021论文地址:

—完—

原标题:《高通CVPR神研究:视频处理计算量降低78%,教卷积层自己“挑像素”,卡成PPT的视频纵享丝滑》

THE END
1.超级计算app推荐超级计算器新版本/安卓版/中文版/手机版超级计算app推荐-超级计算器新版本/安卓版/中文版/手机版 在这里用户将会找到超级计算器,软件功能计算方面的精准度非常的高,而且算的又快又准。在学习中将求解方程式都会为大家提供最详细的求解步骤,计算公式也会给出最精准的结果。涵盖的算数方面的功能非常的专业。https://www.juxia.com/sjwy/heji-15635.html
2.计算机计算器全能王下载2024安卓手机版如发现版本老旧,欢迎邮件反馈tousu@liqucn.com,或移步计算机计算器全能王官网下载最新版 介绍 计算机计算器全能王,集计算器、亲戚计算器、指南针、房贷计算器、五险一金、进制转换、肥胖计算器、重量计算器、大写转换、长度计算器、体积计算器、字节计算器、面积计算器、温度计算器等为一体,功能强大,方便好用,简单https://m.liqucn.com/os/android/rj/160651.wml
3.计算机求和函数:让计算机变“算盘”1. 每个人在日常生活中都会使用计算器或者算盘进行加法运算,这是一种非常基本且普遍的数学操作。而在计算机中,也有类似的求和函数,可以帮助计算机进行加法运算。计算机求和函数到底是如何工作的呢? 2. 我们需要明确一点,计算机是一种非常聪明的工具,但它并不具备人类的理解能力。计算机是通过一系列的指令和算法来完http://www.2it2.com/jsj/21096.html
4.神之亵渎2怎么计算武器伤害武器伤害计算方法介绍导读神之亵渎2游戏里收集的一些装备其实是可以进行组合的,有些小伙伴可能不太清楚怎么计算武器伤害,这里给大家带来了神之亵渎2武器伤害计算方法介绍。 神之亵渎2武器伤害计算方法介绍 游戏中所有叠加方式 神之亵渎2游戏里收集的一些装备其实是可以进行组合的,有些小伙伴可能不太清楚怎么计算武器伤害,这里给大家带来https://www.9game.cn/news/8703188.html
5.因岳加成面板计算方法因岳最强辅助组合在很多地方就业【因岳加成面板计算方法】因岳最强辅助组合在很多地方就业,很多小伙伴不懂得输出式神【因岳加成面板】怎么计算,这里给大家普及一下计算方法。阴阳师攻略https://ds.163.com/feed/626ec4c18d5cee000137a65b/
6.[神手定位]24059大乐透复式中奖计算推荐复式,近期很靠谱前区三胆:01,26,32[中32],前区五胆:01,17,23,26,32[中32],推荐前12+后3[命中3+0],推荐复式7+3[命中1+0],20码大底[中06,10,13,32]。 [神手定位]大乐透第24059期最新预测 项目预测内容近7期准确率 前区三胆01,03,3129%7中2 http://www.78500.cn/dlt/yc/10466641.html
7.喜用神按照计入藏支计算,用神在藏干有用吗想要掌握喜用神按照计入藏支计算的奥秘吗?让我们深入探讨这一神秘的玄术,并了解如何应用于实际生活中。 解析乾造、戊辰、己未、丙戌、癸巳、大运 根据八字推算,丙火日元坐https://www.k366.com/bazi/219555.htm
8.神经网络的基本原理2.6. 神经网络的学习过程 对于神经网络的学过程,大致分为如下的几步: 初始化参数,包括权重、偏置、网络层结构,激活函数等等 循环计算 正向传播,计算误差 反向传播,调整参数 返回最终的神经网络模型 参考文献 [1] 英文版:UFLDL Tutorial [2] 中文版:UFLDL教程zhiyonghttps://blog.csdn.net/google19890102/article/details/49736619
9.cs231n课程笔记:神经网络(一)在计算模型中,我们假设峰值信号的准确时间点不重要,是激活信号的频率在交流信息。基于这个速率编码的观点,将神经元的激活率建模为激活函数(activation function) f,它表达了轴突上激活信号的频率。由于历史原因,激活函数常常选择使用sigmoid函数 σ,该函数输入实数值(求和后的信号强度),然后将输入值压缩到0-1之间。在https://www.jianshu.com/p/2ec4bf59e8bb
10.新算力新赋能新未来——第十八届CCF全国高性能计算学术年会在云长风破浪会有时,直挂云帆济沧海!中国高性能计算正以前所未有的速度、能力、魄力和干劲,赋能千行百业的数智化转型升级,描绘算力经济时代的新蓝图。https://www.leiphone.com/news/202212/wFIpcO5bA7UvOAL9.html
11.易错题精析第9讲神奇的计算工具和有趣的算式(讲义)小学数学四年第9讲 神奇的计算工具和有趣的算式(讲义) 小学数学四年级上册易错专项练(知识梳理+易错汇总+易错精讲+易错专练) 1.计算器的构成。 计算器一般由电源、开关、显示屏、键盘和内部电路等几部分构成。 2.计算器的使用方法。 先按开机键,再按数字键,然后按运算符号键,再按数字键,最后按“ = ”显示结果。 3.有https://www.zxxk.com/soft/34787763.html
12.神指计算器(com.tqkj.calculator)3.7.4应用神指计算器的两大功能是计算和记账,总体而言就是很实用接地气,都是日常生活会碰到的。https://www.coolapk.com/apk/com.tqkj.calculator
13.神指计算器下载神指计算器3.5.5下载神指计算器安卓手机最好用的计算器,是重庆神指奇动网络有限公司推出的一款有记账功能的智能计算器,不仅满足日常计算需求还可以运用公式进行其他计算,记账功能也很实用哦~应用简介:神指计算器是重庆神指奇动网络有限公司出品的一款带有记账功能的智能计算器https://www.fxxz.com/azsoft/219282.html
14.神脑洞游戏第364关答案神脑洞364关怎么过【请计算以下题目。100+100=】这是《神脑洞游戏》第364关题目,具体该怎么过呢?还不清楚的小伙伴和小编一起看看接下来给大家带来的《神脑洞》游戏第364关答案攻略吧!>>https://app.3dmgame.com/mip/gl/176387.html