不管大企业或小公司,在面向公众提供的服务中,内容的合规审查都是重中之重。以往这主要依赖人工审核,耗时长久且成本高昂。html
好在随着 AI 技术的发展,咱们已经能够用程序自动检测识别用户向平台上传的各种内容,检测其中是否包含不合规内容,进而根据检测结果酌情采起必要措施。服务器
本文将经过一个真实案例,向你们介绍如何利用 Amazon Rekognition 服务自动检查图像内容,实现快速、高效、低成本的图像合规审查。架构
Amazon Rekognition 是一项基于机器学习(ML)技术的图像与视觉分析服务,可帮助用户识别图像及视频中的对象、人物、文本、场景及活动,并同步检测出是否存在不当内容。Amazon Rekognition 文本检测功能则可以从图像及视频中识别并提取出文本内容。例如,在图像共享与社交媒体应用中,咱们可使用图像内文本所包含的关键字实现图像索引以及可视化搜索。在媒体与娱乐类应用中,你们还能够根据屏幕上的文本,例如广告、新闻、体育赛事比分以及字幕等等,对视频内容进行分类。机器学习
如下截屏,展现了一个提取图像内文本的具体示例。分布式
在本文中,咱们将展现 REA Group 如何经过使用 Amazon Rekognition Text in Image 功能的 DetectText API,为其房地产列表创建起自动化图像合规审查解决方案。函数
REA Group 是一家专门面向房地产与实业资产的跨国数字广告公司。该公司已经拥有20多年市场发展历史,业务遍及澳大利亚、马来西亚、香港、泰国、印度尼西亚、新加坡以及中国。REA Group 在亚洲的业务包括多个领先门户网站品牌,如 iproperty.com.my、squarefoot.com.hk、thinkofliving.com,同时在新加坡与印度尼西亚持有99 Group的大量股份。REA Group 还在印度持有 Move, Inc 与 PropTiger 公司的可观股份。他们主要为消费者提供房地产购买、出售与租赁服务,同时发布各种房产新闻、装修技巧以及生活方式层面的内容。天天都有数百万消费者访问 REA Group 网站。学习
REA Group 提供基于搜索的门户网站,房地产销售商经过该门户上传在售的房地产图片,从而向消费者提供普遍的可搜索选择。但 REA Group 发现,经销商上传的图像每每不符合使用条款要求。其中部分图片包含商标或联系方式,这可能致使潜在的客户流失问题。为此,他们曾创建起专门的审核小组,以人工方式处理图像中的不当内容。但因为每日图像上传量过大,增长的审核过程每每令房产资料的发布时间延后达数天之久。测试
为此,REA 团队开发出一套图像合规性系统,可自动检测图像中存在的各种不合规状况并及时通知卖方。最初,他们在 Amazon Elastic Compute Cloud(Amazon EC2)上训练了本身的 ML 模型,检测商标与联系方式。但这套模型出现大量误报,特别是在联系方式细节检测方面表现不佳。为了进一步提升模型的准确率,他们须要在模型训练与优化方面投入大量精力。为了知足项目目标并以及时间要求,该团队须要一套易于实施的解决方案,为业务提供必要的准确率支持。优化
考虑到这一目标,他们决定扩展示有ML模型,并在工做流程中引入 Amazon Rekognition Text in Image,以此提升检测准确率并减小误报。他们还添加了更多业务规则,分解到自研模型和 Amazon Rekognition 的各类预测,从而实现决策自动化。网站
为了进一步优化推理基础设施的运营成本,REA 团队还采用一个基于事件驱动的架构来管理商标和联系方式检测模型中的推理引擎,这是利用AWS Lambda来实现的。这种方式不只提升了其基础设施资源的使用效率,也在知足业务目标的同时显著节约了运营成本。
这套解决方案以无服务器栈为基础,以下图所示。其中图像上传经 Amazon API Gateway 到面向 Amazon Simple Storage Service(Amazon S3)的上传 API,上传事件会触发以Lambda函数实现的工做流,运行一系列用于自动决策的机器学习模型和业务规则。
整个事件驱动工做流以下所示:
数据科学与工程负责人 Mohammad Alauddin 表示,“随着业务的增加,提高效率已经成为影响咱们扩展规模的重要因素。咱们的团队也开始集思广益,思考如何在更好地服务于客户的同时,保持团队的高效率。经过 AWS Lambda 与 Amazon Rekognition 在 AWS 应用机器学习,咱们增长了平台上高质量合规列表的数量,同时减小了列表的审核时间与成本。此外,咱们不只在规定的时间表内完成项目,并将误报数量减小了超过56%。”
你们能够在 Amazon Rekognition 控制台上根据业务要求测试 Amazon Rekognition 的图像文本识别效果。关于 Amazon Rekognition 文本检测 API 的更多详细信息,请参阅 Amazon Rekognition 说明文档。