该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能,包括人脸识别、文字识别、表格识别、红酒识别、货币识别、地标识别、手势识别、商标识别、果蔬识别、菜品识别等图片识别功能,以及黑白图像上色、图片风格变换等图像处理的功能。
1系统框架
开发语言:javascript
测试环境:Andriod9.0
2.4小程序开发界面
如下图,标红处需要填入注册时获得的APPID。
2.5程序总体结构
driving_license.js:功能逻辑模块
driving_license.wxss:页面样式文件
driving_license.wxml:页面布局文件
driving_license.json:页面配置文件
3程序功能实现说明
4测试效果
以下选取了部分图片识别的测试效果:
4.1菜品识别
4.2车型识别
4.3地标识别
4.4动物识别
4.5红酒识别
4.6货币识别
4.7植物识别
4.8黑白图像上色
4.9清点人数
4.10通用物体与场景识别
5测试结论
5.1识别能力
根据拍摄照片,识别图片内容,广泛应用于娱乐类APP,自助结算等业务场景中。目前图像识别具备的识别能力如下:
品牌logo识别:识别4万种商品logo,支持定制logo图库
植物识别:识别2万多种通用植物和近8千种花卉
动物识别:识别近8千种动物
菜品识别:识别超过近九千种菜品,支持定制菜品图库
地标识别:识别5万中外著名地标、景点
果蔬识别:识别近千种水果和蔬菜
红酒识别:识别数十万中外红酒名称及详细介绍
货币识别:识别国内外常见货币,支持正反面、纪念钞
车型识别:识别3千款常见车型,可返回车型百科信息
营业执照识别:识别各版式营业执照所有关键字段
增值税发票识别:识别增值税普票或专票所有30个字段
驾驶证识别:识别机动车驾驶证正本所有9个字段
车牌识别:识别蓝牌、绿牌、单/双行黄牌等类型车牌
手写文字识别:识别图片中的手写数字、手写中文
表格文字识别:识别表头、表尾及每个单元格的文字内容
人脸检测:返回人脸框与关键点,识别多种人脸属性
手势识别:识别24种常见手势,支持自拍、他人拍摄
5.2特色优势
1)图像识别功能丰富
支持多种垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,基于百度海量数据,持续丰富接口返回内容信息。
2)识别准确性高
基于百度丰富的海量数据,利用深度学习技术及精准的算法迭代模型,不断提高准确性。
3)工作稳定性好
提供24小时云端高稳定服务,宕机率低,故障恢复快,单图毫秒级响应,服务可用性高达99.95%。
4)支持定制化识图
支持根据不同的业务场景定制客户专属的AI识图能力,满足非通用场景下的业务需求。例如品牌logo,菜品识别均可自定义库。
5)支持获取百科信息
支持识别结果中返回百度百科的内容,让客户业务功能更完善、内容更丰富。