AI数据标注行业面临的5大发展困局丨曼孚科技

根据艾瑞咨询发布的行业白皮书显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,预计2025年市场规模将突破113亿元,行业年复合增加率达到了23.5%。​安全

做为人工智能产业的基石,数据标注行业正在从幕后走向前台,将来前景无限广阔。服务器

然而,正如黎明前是一片无尽的黑暗同样,数据标注行业在蓬勃发展的背后也面临着诸多困局,这些困局已成为阻碍行业发展最大的绊脚石。机器学习

1. 人力成本突出ide

数据标注虽然披着人工智能的“外衣”,可是本质上仍然属于劳动密集型产业。工具

目前,国内从事数据标注行业的人群已达上千万,这其中90%的从业人员为数据标注员,这些数据标注员分散在大大小小的标注团队内。学习

以一个20人全职的小标注团队为例,平均天天每一个人的人力成本大约在100-200元,每月仅仅在人力成本上的消耗就达到了6万-12万,而一个周期在半个月以上的标注项目可能总合同金额不过几万元而已,这样的结果就是不少标注团队营利甚微或是压根就没法营利。人工智能

事实上,不少标注团队的管理人员已经意识到人力成本对于团队发展的威胁,可是却不多有人选择以裁人的方式来减小此类成本,甚至不少团队顶着亏损的风险不断加人,缘由无他,做为劳动密集型产业的数据标注行业,有足够的人力才能保证吃得下大项目,越是裁人越是没法接到高利润的大项目,拾人牙慧捡一些小资源,团队最终面临的可能就是解散的局面。blog

2. 标注效率低下资源

在人力成本没法大规模减轻的局面下,摆在数据标注团队面前最可行的方式就是提升标注效率。部署

经过招聘熟练度较高的数据标注员,或是使用高效率的标注工具能够作到在短期内有效提高标注效率,可是到了真正实施的阶段,不少人却发现并非如此简单。

一方面,熟练度较高的高素质数据标注员在行业内还是稀缺状态,尤为是随着AI公司对于标注数据的场景化需求愈来愈高,这种缺口将愈来愈大。举个简单的例子,在语音标注领域,目前有不少英文标注项目,可是熟练掌握英语的数据标注员却稀少。

另外一方面,行业内缺少一款高效率的数据标注工具。目前不少标注团队使用的是开源标注工具,此类工具虽然可以知足基本的标注需求,可是在效率、准确度上已经远远知足不了当下AI公司的需求。

AI数据标注行业面临的5大发展困局丨曼孚科技

3. 准确率难以知足AI公司需求

人工智能行业内有一个简单但很重要的共识:数据集质量的高低直接决定最终模型质量的好坏。

机器学习依赖海量标注数据的投喂,这些数据质量的高低将对AI最终可否顺利落地产生关键性影响。

目前不少AI企业都意识到了这点,并在标注数据质量上提出了新的要求。举个例子,以往标注数据的准确率达到了95%便可知足AI企业的需求,可是目前就需求达到99%,甚至是99.99%。

然而,目前至关多的标注企业没法知足这样的需求,缘由正如上面所说,一方面数据标注员能力良莠不齐,另外一方面标注工具质量低下。

4. 数据安全性存疑

数据标注行业既然与“数据”有关,那么安全性必定是不少企业关注的重点。

在安防领域,由于涉及到须要采集标注不少人脸等私密数据,所以确保数据的安全性成为了不少项目方的硬性需求。

从数据的采集、数据的标注,再到数据的保存,每个环节都必须保证数据不被泄露、不被窃取,这对于不少团队来讲都是没法作到的事情。

一方面,不少团队没有本身独立研发的标注平台,仍使用开源工具或者是在开源工具的基础上略做修改,使用这种开放的平台如何保证数据的安全性?

另外,不少企业在标注与储存数据的过程当中,出于成本的因素使用的仍然是公有服务器,这对于许多安防领域的企业来讲,很明显是没法达标的。

5. 欠缺场景化标注能力

随着人工智能技术开始大范围落地应用,AI公司对于标注数据的场景化要求正变得愈来愈高。

以汽车自动驾驶为例,相关汽车厂商对于标注场景要求愈来愈精细化,一些复杂的长尾场景诸如闯红灯车辆、横穿马路的行人、路边违章停靠的车辆等等出现的频率开始增多,至关多数据标注团队没法知足AI企业相似的标注需求。

AI数据标注行业面临的5大发展困局丨曼孚科技
汽车自动驾驶标注场景(来源:曼孚科技数据标注平台)

这一方面与数据标注团队欠缺定制化服务能力有关,另外一方面也与标注团队使用的标注工具功能简单化有关。在AI大规模落地的时代背景下,没法知足项目方的需求即意味着面临被淘汰的风险,提高场景化、定制化标注能力是摆在不少标注团队面前至关现实的需求。

针对以上困局,曼孚科技从现实出发,作出了以下的努力:

  1. 专业团队打造优质数据服务平台,服务成本下降30%以上;

  2. 独立自研SaaS数据标注平台,预标注技术加持下标注效率可提高4倍以上;

  3. 实时精确估算与AI辅助筛查,数据精确至99%以上;

  4. 支持私有云部署,实时监测增强安全保护;

  5. 定制化场景搭建,7X24小时快速技术响应。

经过以上努力,曼孚科技致力于为客户提供高水准、高效率、定制化、场景化的数据标注服务体验。曼孚科技旗下的数据采集标注一站式解决方案平台正在自动驾驶、安防、VR/AR、无人机、新零售、AI教育、工业机器人等相关领域悄然改变着这个世界。

尽管当下数据标注行业面临的困局已经影响了总体产业的蓬勃发展,但正如曼孚科技的愿景同样,咱们将凭借自身努力,用数据解放AI的一切可能。

相关文章
相关标签/搜索