EasyDL经常使用概念

目录前端

  1. 模型与模型类型
  2. 模型训练相关
  3. 模型效果相关
  4. 模型部署相关
  5. 数据相关

模型与模型类型

EasyDL支持7类模型训练,包括图像分类、物体检测、图像分割、声音分类、文本分类、短文本匹配(仅专业版支持)、视频分类。算法

图像分类

可识别一张图中是不是某类物体/状态/场景,适用于图片中主体或者状态单一的场景. image.png服务器

物体检测

可识别图中每一个物体的位置、名称,适合有多个主体、或要识别位置及数量的场景 image.png网络

图像分割

对比物体检测,可识别图中每一个物体的名称、位置(像素级轮廓)并计数,适合图中有多个主体、须要识别主体位置或轮廓的场景 image.png学习

声音分类

可识别音频中是什么类型的声音,多应用于生产或泛安防场景中监控异常声音等 image.png大数据

文本分类

可判断一段文本是否属于某一个自定义的类别,适用于文本筛选、文本归类、文本聚合等多种应用场景 image.png优化

短文本匹配

可支持定制模型判断两段短文本的类似度,如在客服问答场景中,支持用户经过训练短文本匹配的模型,可以快速识别出知识库中与用户问题类似的相关问题,并推荐出相应的答案,快速提高客服问答效率。spa

视频分类

定制视频分类模型,能够分析视频的内容,识别出视频内人体作的是什么动做,物体/环境发生了什么变化 image.png操作系统

模型训练相关

AutoDL Transfer

AutoDL Transfer模型是百度研发的AutoDL技术之一,结合了模型网络结构搜索、迁移学习技术、并针对用户数据进行自动优化。与通用算法相比,训练时间较长,但更适用于细分类场景。例如,通用算法可用于区分猫和狗,但若是要区分不一样品种的猫,则AutoDL效果会更好.net

ERNIE

预训练模型ERNIE(艾尼)是百度基于用户大数据训练的拥有当前业内最好效果的中文语义表示模型。ERNIE(艾尼)预训练模型,已累计学习10亿多知识,可以助力各NLP任务快速提高效果。平台内置了最新的ERNIE2.0,并提供了ERNIE2.0-Base、ERNIE2.0-Large两个版本供用户选择。

模型效果相关

准确率

图像分类/文本分类/声音分类等分类模型的衡量指标,正确分类的样本数与总样本数之比,越接近1模型效果越好

F1-score

对某类别而言为精确率和召回率的调和平均数,对图像分类/文本分类/声音分类等分类模型来讲,该指标越高效果越好

精确率(Precision)

对某类别而言为正确预测为该类别的样本数与预测为该类别的总样本数之比

召回率(Recall)

对某类别而言为正确预测为该类别的样本数与该类别的总样本数之比

top一、top2…top5

在查看图像分类/文本分类/声音分类/视频分类模型评估报告中,top1-top5指的是针对一个数据进行识别时,模型会给出多个结果,top1为置信度最高的结果、top2次之…正常业务场景中,咱们一般会采信置信度最高的识别结果,重点关注top1的结果便可。

mAP

mAP(mean average precision)是物体检测(Object Detection)算法中衡量算法效果的指标。对于物体检测任务,每一类object均可以计算出其精确率(Precision)和召回率(Recall),在不一样阈值下屡次计算/试验,每一个类均可以获得一条P-R曲线,曲线下的面积就是average

阈值

物体检测模型会存在一个可调节的阈值(threshold),是正确结果的断定标准,例如阈值是0.6,置信度大于0.6的识别结果会被看成正确结果返回。每一个物体检测模型训练完毕后,能够在模型评估报告中查看推荐阈值,在推荐阈值下F1-score的值最高。

模型部署相关

公有云API

模型部署为Restful API,能够经过HTTP请求的方式进行调用。

设备端SDK

模型部署为设备端SDK,可集成在前端智能计算硬件设备中,可彻底在无网环境下工做,全部数据皆在设备本地运行处理。目前支持IOS、ANDROID、WINDOWS、LINUX四种操做系统及多款主流智能计算硬件。

本地服务器部署

模型部署为本地服务器部署,可得到基于定制EasyDL模型封装而成的本地化部署的方案,此软件包部署包开发者本地的服务器上运行可以获得与在线API功能彻底相同的接口。

软硬一体方案

目前EasyDL支持两款软硬一体硬件,包括EasyDL-EdgeBoard软硬一体方案及EasyDL-十目计算卡。经过在AI市场购买,可得到硬件+专项适配硬件的设备端SDK,支持在硬件中离线计算。

数据相关

智能标注

智能标注为一套人机交互的协做标注方式,目前EasyDL物体检测训练任务支持智能标注,在手工标注少许数据后,系统会从数据集全部图片中筛选出最关键的图片并提示须要优先标注。一般状况下,只需标注数据集30%左右的数据便可训练模型。与标注全部数据后训练相比,模型效果几乎等同。

>> 访问 PaddlePaddle 官网,了解更多相关内容    

相关文章
相关标签/搜索