在手机当道的今天,未来的相机会何去何从?
编者按:本文转自公众号雨眠随想,作者邓雨眠,原DJIMavic系列的创始人,在大疆主导立项和设计MavicPro和MavicAir后,离职创业成立了自己的产品设计公司LeapXDesign。极客公园获权转载,未经原作者同意禁止二次转载。
最近二十年,相机行业发生了天翻地覆的变化。笔者作为摄影爱好者一直尝试使用各类相机,也作为前大疆的设计主导和产品经理亲历过无人机和手持云台的发展,积累了一些思考。在手机当道的今天,未来的相机会何去何从?今天我们来探讨一下。
在预测未来前,先回顾一下过去的发展轨迹。下面这幅产量图,灰色代表胶片相机,蓝色绿色都是数码相机:
是因为数码相机的画质更好吗?
并不是,03年的数码相机大约只有三百万像素,照片的清晰度和宽容度都不如胶片。主要原因是产品的使用方便性/易用性有了数量级的提高。
同时还有两个很大的进步:
这也就导致了大部分人只要有手机就够了,不需要再单独买相机。这是智能手机出现后的图表:
黄色代表智能手机,对普通数码相机形成绝对碾压,把原本蒸蒸日上的传统相机企业打得措手不及(从2000年高速增长到2010年后就一落千丈)。注意,此时手机相机的画质也是不如普通数码相机的。
人是很懒的动物,大部分都愿意为了方便而牺牲质量。(这在其他行业也屡见不鲜,比如音乐和电影,如今大部分人都不会再去买音质画质更好的CD/蓝光碟,而会选择在网上点播严重压缩过品质的mp3/视频。)
这也是破坏性技术变革的特征之一:性能较差,前期利润率低,但能满足低端市场需求。市场培养起来后,由于量大有充足的研发资源投入,再逐渐实现性能反超(目前数码相机的画质和性能已经超越了胶片相机,而发达地区也能够在网上点播无损音乐或者4KHDR格式的视频),如图所示:
套用上面的图表来看消费级相机行业,可以得出:
这也揭示了相机发展的另一条线索:
那么我们可以推断,未来推出的相机将会拥有强大的处理芯片和人工智能,可以做出复杂的决策,甚至自主完成拍摄和后期整个流程。
这和汽车的发展路径非常相似,从一开始的纯机械手动挡汽车,到自动挡配有简单的辅助功能(ABS防抱死,TCS牵引力控制等),到配有ADAS高级驾驶辅助系统(自适应巡航,车道偏移报警,碰撞避免等),最后到未来的全自动驾驶。目前市面上大部分汽车还是L0-L2的水平,只能做一些辅助的决策,而驾驶最重要的决策:方向和加减速,还是由人来决定。
对于摄影来说,光圈快门等基本决策,只能决定一张照片是否合格,而真正决定一张照片是否优秀,最重要的拍摄决策其实是构图(相机空间位置和镜头指向),以及按下快门的时机。拍摄者需要根据自己经验,审美,以及想象力来预测,将相机放置在什么位置,镜头对着哪个角度,取哪个区域的画面,在哪个瞬间按下快门,会产生精彩的照片。通俗的讲就是要有「发现美的眼睛」。
而最重要的后期决策其实是:选照片。摄影师以审美和眼光,来判断哪张照片拍得好,再进一步用合适的风格去调色处理。
这些因素是一般人拍不出精彩照片的原因所在,也是目前主流相机爱莫能助的。所以不少人虽然拥有昂贵器材,却依然拍不出好的作品。
因此,目前对普通人来说,拍摄的两大痛点是:
1.缺乏眼光,想象力和拍摄技巧,难以拍出精彩照片/视频
如果下一代产品能解决这两个痛点,就能颠覆现在的相机。现在的产品已经做到了让每个人都能拍的目标,那么下一代产品就是要做到让每个人都能拍好,甚至不需要人拍。而做到这一点的,可能不是传统相机公司,而是人工智能/机器人领域的公司。
模仿自动驾驶标准,下面我给相机的智能化分了级别:
比如索尼目前推出的自动快门功能:只要打开相机app,手机就会开始分析动作和笑脸等,在后台自动拍摄若干照片,等你手动拍摄完毕后,可以和自动拍摄的做比较和选择。
△如Sony宣传图中,右下角是手动拍摄的,由于人的反应延时,已经错过了最精彩的时机,而前三张自动捕捉就更好
而在computationalphotography这方面,Google目前走在了前面,除了自家的pixel手机用很差的硬件(单摄像头)就达到了很高的拍摄质量外,Google相册也提供了很多自动后处理的功能。你拍摄的任何内容,都会在后台被自动分析和处理,比如:
这一切都完全不需要用户干预,会在后台自动完成,用户只需要保存自己喜欢的成品就可以。这个方向发展下去,只要做到足够智能,基本上就可以解决目前相机的第二个痛点。这个App(GooglePhoto)在Android和iOS上都能下载,评价很高,感兴趣的同学可以翻墙尝试。
讲完手机,我们来分析一下目前几个新品类消费级相机(运动相机,360全景相机,无人机,手持云台相机)的优势劣势和未来的潜力,也许在这之中会出现下一个颠覆者。
运动相机以GoPro为代表,是体积小,防水耐摔的鱼眼镜头相机,广泛用于极限运动(冲浪,滑雪,潜水,山地车)等容易造成一般相机损坏的场景。由于能轻易安装到各处,可以拍出很多独特的视角。更多用于拍摄视频。属于户外运动达人展示自己的必备器材,但对于一般人来说,使用频率很低,比较鸡肋。
从GoPro2002年创立到现在,产品和市场基本成熟稳定,之前一大痛点是视频在剧烈运动中抖动的问题,目前新一代产品也已通过机内数字视频防抖(EIS)功能很好的解决了。(有趣的是大疆刚刚进入了这个市场,且看之后会有什么新的发展)
剩下最大的痛点,是「拍摄一时爽,剪辑火葬场」,一次拍摄动辄几小时的视频素材,剪辑的工作量巨大(光看一遍素材就要几小时),可能需要几天。导致有大量拍摄的视频是直接进硬盘吃灰,白白浪费,降低下一次使用的积极性,让使用低频的问题雪上加霜。就连我之前进行直升机滑雪拍的视频,放了快两年了也没有剪辑,只处理了照片(上图),之后也几乎没有再用GoPro。
GoPro也意识到了这个问题,收购了剪辑软件公司推出了Quik这个App,方便用户在手机上剪辑视频,同时也具有自动剪辑的功能。然而体验依然不理想,需要将大量视频从GoPro传到手机,而自动剪辑的智能程度依旧停留在比较智障的水平。
消费级的手持云台相机以大疆的OSMO系列为代表,是将云台与相机结合的新物种,通过三轴机械云台,可以过滤掉任何手持和运动过程中产生的抖动,保证拍出平稳的视频,适合Vlogger(视频博主)等业余视频制作者,也可以做为专业视频工作者的补充相机(Bcamera)。由于机械云台不耐摔不防水,因此只能适用于一般生活场景,不适合极限运动。在数字视频防抖(EIS)已经做得越来越好的情况下,机械增稳对于一般用户也不是刚需。
目前这个产品的主要卖点是「视频增稳」,但这个产品形态在未来有着更大的可能性。
1.哪个是应该拍摄的主体?
2.主体放置在画面中的什么位置?
3.环境中其他物体哪些是无关干扰应该排出在画面外,哪些有助于表达主题而应该留在画面里?
第一点相对简单,一般用户拿着产品正对着方向的一般就是,这时候通过人脸识别/物体识别再进一步锁定就可以。稍难的主要是第2,3步,因为涉及到审美判断,根据情况不同,会有不同的选择。下面以我拍的几张照片为例介绍一下摄影构图的逻辑:
△而原图是这样的,可以看到周围有其他的人和船,在这里他们为干扰项,于是被排除出画面外。
这些都是摄影师在拍摄时需要根据场景,被摄主体,以及自己的审美和创作意图去做的判断和决策。如果AI能做到,就能让云台相机自主拍出比一般人类水平更高的照片/视频,革命掉普通的相机,也可以拓宽很多以前没有的使用场景,比如:
只是目前的产品都还比较智障,搭载的算力和智能都远远达不到这些要求,还停留在不论三七二十一通通把主体放在画面中间的水平。
无人机相当于搭载了云台相机的飞行平台,不仅可以调整镜头角度,还可以移动自身的位置,相当于拥有了完全自主构图的物理可能性。只要足够智能,就可以达到L4的水平:完全自动拍摄。这是目前所有其他相机所没有的潜力。
要达到这点,无人机首先要能自主并且绝对安全地在各种环境中自由移动,不能撞到障碍物,更不能伤人。目前大疆无人机已有一些简单的自动飞行功能,如避障,巡航,跟踪等,但可靠性距离完全自主还相距遥远,需要人类操作员密切注意运行情况,否则很容易发生事故,大概是L2的水准。而美国SkydioR1无人机,通过搭载NVIDIAJetson的AI处理芯片和13个相机,让环境感知和理解的能力大大增强(甚至可以在树林中灵活穿行),自主飞行达到了L3的级别,但牺牲了便携性,续航,抗风性,画质,以及售价(2000美元),属于剑走偏锋,不适合普通消费者。
以我在南美用MavicAir拍的两张宣传照片做例子:
△这是普通的视角,由于小艇左边有冰川,于是选择把无人机飞到小艇右边,以冰川作为背景拍摄。如果无人机在小艇左边,那拍出来的背景就会是普通的大海蓝天,效果便差多了。同时,看到碧蓝地海面上浮动的大片洁白冰块,想象到如果从正上方往下俯拍,会出现很有意思的图案纹理,于是又出现了下面这张截然不同的照片:
下面是我在青海给MavicAir做高原测试时顺便拍的照片:河水在沙地上形成的河道仿佛一只飞翔的青鸟。这种构图就需要人的联想能力。如果只是普通往下拍,而没有青鸟的主题,这张照片就失去了意思。
上面的决策过程对人类来说自然简单,对于现在的AI来说却是非常困难的,尤其是审美,想象和联想的能力。这是需要将人文艺术和科技深度结合的领域,能做到的公司屈指可数。
目前大疆无人机也有一些简单的自动拍摄功能,如把人物放在中间并跟踪拍摄,和一些预设的拍摄轨迹(环绕,飞远,飞高等),也能拍出精彩的视频。但在什么情况下用什么模式,从什么角度拍效果好,还是需要人来判断,无人机只会机械地去执行。不过我相信,在未来无人机会成为一个自主摄影师的角色,可以全自动拍摄出精彩内容。到时连遥控器都不是必须的,人只需要下很笼统的指令如「拍一下那座山」,「给我和这个冰川合个影」就可以了。而那时无人机甚至会像摄影师一样给人下指令,如「请往左边走一点」,「朝右边看」,「确定到哪都要挥舞丝巾吗?2040年已经不流行这个了」。
消费级全景相机以Insta360为代表(GoPro也有,但价格过高),主要通过缝合正面背面各一个鱼眼相机镜头拍摄的图像,产生360度无死角的照片/视频,再通过后期裁剪,也可以输出普通视角的内容。由于拍摄时不需要考虑镜头指向,非常方便,但是同时也造成后期的处理和剪辑比普通相机麻烦很多。不同的创新玩法很多,也造成使用全流程比普通相机复杂,是一把双刃剑,目前还属于非常小众的范畴。
不过这也是在未来很有潜力的相机形态。
其次,因为有360度的视野,没有视角限制,天然适合做EIS(电子增稳),并可以通过裁剪来自由取景,也相当于兼有云台相机的功能,在搭配上足够的智能后就可以自主构图(现在手机上也逐渐搭载了超广角镜头,也有这部分潜力)。
它目前主要有两个大的短板:
1.画质较差:因为本身传感器尺寸就小(1/2.3寸左右),全景视野裁剪到正常视野又会大大降低分辨率,再加上全景镜头畸变,就导致全景相机的画质是目前所有品类中最差的。而以目前的技术,要通过硬件(光学,传感器)来提升画质,成本和体积一下子就会超出消费级的范围。
2.后期剪辑非常麻烦,因为拍摄的时候是把360度视角全部摄入,因此后期还要在软件里先进行人工取景,才能开始正常的剪辑工作。虽然后期自由度非常大,可以玩出花来,但是相应的工作量大,对技术要求也很高,不适合一般消费者。反正我只剪过一段10s的视频之后就不想再剪了。
这些在未来是可以解决的,自主取景和自动剪辑之前已经讨论过,而画质其实也可以通过人工智能提高,目前也已经有了一些前沿的结果,可以看看下面这些通过机器学习后期提升图片分辨率的Demo:
△这是Google的RAISR(RapidandAccurateImageSuperResolution),左边是原图,中间是传统插值法提升分辨率,右边是机器学习算法提升后的图。
这个Google的技术更夸张一点,叫PixelRecursiveSuperResolution,可以将马赛克还原成图像。就是将最右边的原图打上很重的马赛克(变成左图),再让AI去猜测和还原成中间的图像,可以看到和原图已经很接近。
话说回来,本文对未来的设想离现实还有距离,人工智能要达到人类审美和自主创作的能力也还需要很多年,更别说要集成在消费级便携产品上了。在可以遇见的未来,手机还会是绝对主流的相机,其他独立相机只能作为辅助的角色。值得欣慰的是,在手机相机,无人机/云台相机,和全景相机方面,华为,大疆和insta360等硬件企业(但软件和AI企业还不够)目前都走在了世界的前列,国内也还有初创公司在做新相机的方向,未来可期。
8
用极客视角,追踪你不可错过的科技圈.
聊科技,谈商业。
公司地址:北京市朝阳区酒仙桥路4号751D·Park正东集团院内C8座105室极客公园