如何快速将百度大脑AI技术内置智能小程序中

时间 2019-11-26

标签如何快速百度大脑技术内置智能程序繁體版

原文原文链接

实现效果：html

该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能，包括人脸识别、文字识别、表格识别、红酒识别、货币识别、地标识别、手势识别、商标识别、果蔬识别、菜品识别等图片识别功能，以及黑白图像上色、图片风格变换等图像处理的功能。java

1 系统框架算法

小程序将经常使用功能按Ai技术分为五大类：文字识别、语音技术、图像技术、视频技术和天然语言处理（NLP）,而后根据具体功能再进行细分。本文主要介绍百度AI开放平台计算机视觉方面服务产品的测试过程及效果。经过微信小程序实现API调用。小程序将用户上传的图片提交给百度AI服务，返回识别结果。所有功能都在小程序客户端完成，不须要服务器，适合我的开发者学习调试使用，同时也为商业应用提供相应解决方案。json

开发平台：微信开发者工具 V1.02小程序

开发语言：java script微信小程序

测试环境：Andriod 9.0服务器

2 微信小程序开发过程微信

2.1注册微信小程序微信开发

注册地址：https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CNapp

注册成功后在开发->开发者ID里找到AppID，这是开发微信小程序所须要的身份标识。而后填写服务器域名，须要用到的均要填上，以下图。

2.2 小程序的配置已基本完成，下一步须要下载开发工具了，微信本身开发的IDE，下载地址是：
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

2.3小程序开发文档：https://developers.weixin.qq.com/miniprogram/dev/framework/

2.4小程序开发界面

以下图，标红处须要填入注册时得到的APPID。

2.5程序整体结构

Pages下的每一个文件夹对应实现一种AI功能。添加新的AI功能，好比添加驾驶证识别功能，在根目录的全局配置文件app.json中增长："pages/ driving_license/ driving_license" ，会自动建立相关页面文件夹，其内部结构以下：

driving_license.js：功能逻辑模块

driving_license.wxss：页面样式文件

driving_license.wxml：页面布局文件

driving_license.json：页面配置文件

3 程序功能实现说明

想了解微信小程序中百度API接口的调用过程，请参看我以前的帖子：

营业执照识别：https://ai.baidu.com/forum/topic/show/956171

增值税发票识别：https://ai.baidu.com/forum/topic/show/956168

车牌识别：https://ai.baidu.com/forum/topic/show/956167

手写文字识别：https://ai.baidu.com/forum/topic/show/956153

图像风格转换：https://ai.baidu.com/forum/topic/show/956135

文字识别：https://ai.baidu.com/forum/topic/show/954152

iOCR财会版：https://ai.baidu.com/forum/topic/show/956136

固然，还有更多百度AI服务功能能够陆续添加，按照以上文章连接所提供的方法稍做修改便可。有兴趣的同窗能够试试。

4 测试效果

如下选取了部分图片识别的测试效果：

4.1菜品识别

4.2 车型识别

4.3地标识别

4.4动物识别

4.5红酒识别

4.6 货币识别

4.7 植物识别

4.8 黑白图像上色

4.9 清点人数

4.10 通用物体与场景识别

5 测试结论

5.1识别能力

根据拍摄照片，识别图片内容，普遍应用于娱乐类APP，自助结算等业务场景中。目前图像识别具有的识别能力以下：

品牌logo识别：识别4万种商品logo，支持定制logo图库

植物识别：识别2万多种通用植物和近8千种花卉

动物识别：识别近8千种动物

菜品识别：识别超过近九千种菜品，支持定制菜品图库

地标识别：识别5万中外著名地标、景点

果蔬识别：识别近千种水果和蔬菜

红酒识别：识别数十万中外红酒名称及详细介绍

货币识别：识别国内外常见货币，支持正反面、记念钞

车型识别：识别3千款常见车型，可返回车型百科信息

营业执照识别：识别各版式营业执照全部关键字段

增值税发票识别：识别增值税普票或专票全部30个字段

驾驶证识别：识别机动车驾驶证正本全部9个字段

车牌识别：识别蓝牌、绿牌、单/双行黄牌等类型车牌

手写文字识别：识别图片中的手写数字、手写中文

表格文字识别：识别表头、表尾及每一个单元格的文字内容

人脸检测：返回人脸框与关键点，识别多种人脸属性

手势识别：识别24种常见手势，支持自拍、他人拍摄

5.2 特点优点

1）图像识别功能丰富

支持多种垂类业务场景的细粒度图像识别，精准识别超过十万种物体和场景，基于百度海量数据，持续丰富接口返回内容信息。

2）识别准确性高

基于百度丰富的海量数据，利用深度学习技术及精准的算法迭代模型，不断提升准确性。

3）工做稳定性好

提供24小时云端高稳定服务，宕机率低，故障恢复快，单图毫秒级响应，服务可用性高达99.95%。

4）支持定制化识图

支持根据不一样的业务场景定制客户专属的AI识图能力，知足非通用场景下的业务需求。例如品牌logo，菜品识别都可自定义库。

5）支持获取百科信息

支持识别结果中返回百度百科的内容，让客户业务功能更完善、内容更丰富。

做者：wangwei8638