美团做为全球最大的本地生活服务平台,拥有由遍及全国的市场人员所拍摄的众多门脸招牌图片数据。每张图片都是由全国的不一样我的,采用不一样设备,在不一样地点,不一样时间和不一样环境下所拍摄的不一样目标,是可贵的能够公正评价算法鲁棒性和识别效果的图片数据,挑战也很是大。算法
近年来业界围绕着文字检测和文字识别提出了许多有效的算法和技术方案。因为以前公开的数据集广泛以英文为主,所以所提出的技术方案对中文特有问题关注不足。表如今以中文为主的实际应用场景中,这些技术方案的结果与应用预期差距较大。以美团掌握的某典型中文图片数据为例,在6000张图的图片数据集上(已去除文字没法辨识的图片),测试了国内最知名的三个AI开放平台,按字段统计识别率分别是94%,91% 和 86%,通过努力咱们也只达到 98%。中文OCR在实际应用场景的表现并不乐观。微信
在这次 ICDAR2019上,咱们挑选出很能表明中文特色的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有天然场景文字识别中广泛存在的拍照角度、光照变化等干扰因素。咱们但愿经过竞赛引发同行们对中文识别的关注,群策群力解决中文识别的实际问题。测试
国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,专一于文本领域的识别与应用。ICDAR大会每两年举办一次,目前已发展成文字识别领域的旗舰学术会议。为了提升天然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于2003年设立了鲁棒文本阅读竞赛(“Robust Reading Competitions”)。至今已有来自89个国家的3500多支队伍参与。spa
ICDAR 2019将于今年9月20-25日在澳大利亚悉尼举办。 美团今年联合国内外知名科研机构和学者,提出了"中文门脸招牌文字识别"比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。设计
美团本次公开的数据,由遍及全国的市场人员所拍摄的众多门脸招牌图片组成,共25000张。每张图片是由彻底独立的不一样我的,采用不一样设备,在不一样地点,不一样时间和不一样环境下所拍摄的不一样商家。该数据集以中文文字为主,也包含必定数量的英文和数字,英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本。是可贵的用于研发和评估中文识别技术的数据集。其中,20000张图片用于训练,2000张用于验证,3000张用于测试。图片
本次门脸招牌识别,共定义了 4 个任务,分别以下:rem
颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。
比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。
奖金详细以下:文档
扫描下方二维码,直接进入报名连接报名。字符串
报名连接地址: http://rrc.cvc.uab.es/?ch=12
报名连接二维码: get
参赛答疑邮箱:mtdptech@meituan.com(邮件标题请注明 “ICDAR2019”)
加入参赛交流微信群
步骤1:微信添加 “MTDPtech02” 为好友(昵称:美美),或扫描下方二维码直接添加:
步骤2:回复美美 “ICDAR2019”,则会自动将您加入ICDAR2019-ReCTS技术交流群