在手机上通过摄像头识别外界事物,这样的体验像极了我们人的眼睛。
从PC时代到智能手机时代,搜索一直是人们日常生活中最常见的需求之一。根据CNNIC的报告,截至2019年6月,我国搜索引擎用户规模有6.95亿,其中手机搜索更是达到了6.62亿,占比95%以上。
互联网上的内容与资源非常丰富,只要用户善于利用搜索引擎,便几乎可以找到任何想要的信息。在百度App,当用户直接点击搜索框右边的相机图标,对准想要搜索的事物,不管是数学题、英文、条形码,都能直接识别。
目前,得益于人工智能技术的飞速发展,我们已经可以通过手机摄像头识别多样事物。翻译App可以直接识别看到的文字、购物App可以识别商品,也有专门针对花草树木的识别软件。但用户的一大痛点在于,人们通常需要找到对应的工具才能识别单独品类的事物。
而百度作为一个综合类的搜索引擎,当然不会只把目标放在单独的几个领域。「识万物」正是这样一个综合类的识图引擎,在手机上通过摄像头识别外界事物,这样的体验像极了我们人的眼睛。
「动态多目标识别」是百度识图具备的一项独特优势,它突破性地应用了Lens技术,也更便于实现产品与用户间的创新型交互。
由于省去了拍照、上传等步骤,百度App的识图体验变得十分顺畅,用户只要举起手机对准要识别的事物,它的信息就会即刻出现在手机屏幕上,点击即可查看。
随摄像头的移动,百度App会在实时追踪已识别的物品同时,识别新进入画面的物品。用户从而可以更快捷地利用百度识图同时获取多元信息。
百度识图通过利用视觉识别能力,串联起用户旅行、购物、观影等不同场景时产生的认知诉求,它能识花、识商品,也能识别影视剧信息。
在精准识别的基础上,借助百度移动生态提供的信息和服务,用户还可进行多平台比价、直接下单购买等后续操作。由此,用户想要的信息都自然聚合在一起,并且不需要事先选择品类、领域,可以说是「一气呵成」,而搜索体验也不再止步于单一的识别结果,获取信息更为丰富。
以生活中常见的数码产品为例,百度识图可以识别出品牌、型号、价格等信息,还会给出购买链接,方便用户直接下单购买。
另一个实用的使用场景则是识别各种化妆品、药品上的包装文字。很多药妆来自国外,一长串外文,打字输入颇为麻烦,使用识图功能就简单许多。识别出品牌和型号后,用户可以直接通过OCR来复制包装上的文字,方便进一步编辑。在该场景下,用户也可以选择直接进行文字翻译,所有的有效信息,在一个页面就能全部获得,无需其余复杂操作。
此外,百度识图目前已经可以识别超过1000万种物品,其中包含了20000多种植物以及上百万种美妆产品。在此基础上,百度识图还支持超过30种场景的智能判断,可以针对被识别物品的不同,提供相应的扩展信息和服务。
百度识图的背后还有很多强大的技术,而通过百度App的「识万物」功能,用户感受到的只是简单与便捷,这就是技术的最终目的。
随着5G、AI技术、手机相机的发展,智能产品在满足用户价值的同时,也在不断开拓、延伸用户需求。未来,手机识图还将释放更多能量。如果我们把目光放更远,将这些能力从手机转移到可穿戴设备中,比如智能眼镜,也许未来就真的会出现像科幻片中那样的场景,眼睛一扫所有事物信息全部展现在眼前。
2
用极客视角,追踪你不可错过的科技圈.
聊科技,谈商业。
公司地址:北京市朝阳区酒仙桥路4号751D·Park正东集团院内C8座105室极客公园