内容概要:一项关于漫画文字自动翻译的研究,引起了热议,由两位东京大学博士组成的 Mantra 团队发布了一篇论文,目前已被 AAAI 2021 收录,该 Mantra 项目旨在为日本漫画提供自动化的机器翻译工具。
原创:HyperAI超神经框架
关键词:机器翻译 情感识别 漫画 AI工具
最近,由东京大学 Mantra 团队、雅虎(日本)等机构联合发布的《Towards Fully Automated Manga Translation 实现漫画全自动翻译》_(论文地址https://arxiv.org/abs/2012.14271)_论文,引起了学界和二次元界的关注。学习
如图所示:左一为日文原版, 自动化输出英文版(右二)和中文版(右一)测试
Mantra 团队成功地实现了将漫画的中的对话、气氛词、标签等文字自动识别,并作到了区分角色、联系上下文,最后将翻译文字准确替换、嵌入气泡区域。字体
有了这个翻译神器,估计翻译组、追漫的小伙伴们都该偷着乐了。优化
在科研方面,目前该篇论文已经被 AAAI 2021 接收,研究团队还开源了一个包含五部不一样风格(幻想、爱情、战斗、悬疑、生活)的漫画,所组成的翻译评估数据集。spa
OpenMantra 漫画翻译评估数据集翻译
论文地址:_https://arxiv.org/abs/2012.14271_blog
数据格式:带注释的 JSON 文件和原始图像图片
数据内容:1593 个句子、848 个场景、214 页漫画
数据大小:36.8 MB
更新时间:2020 年 12 月 7 日
下载地址:_https://hyper.ai/datasets/14137_
在产品化方面,Mantra 计划上线封装好的自动翻译引擎,不只面向出版社提供漫画的自动化翻译与发行服务,也会发布面向我的用户的服务。
下面是咱们从 Mantra 官方推特上选取的日漫《周边男子》的部分翻译成果,这部多格、轻耽美风格的漫画,以生活经常使用的数码设备拟人化为背景,充满欢乐与基情:
《周边男子》日文原版及自动化机器翻译的中英文版本
具体的实现步骤,Mantra 研究团队在论文《Towards Fully Automated Manga Translation 实现漫画全自动翻译》中进行了详细的解释。
第一步 定位文字
在实现漫画自动化翻译的第一步,就是提取文字区域。
但因为漫画的特殊性,来自不一样角色的对话、效果拟声词、文字标注等等,都会展示在一幅漫画图片里,漫画师会用气泡、不一样的字体、夸张的字体来展示不一样效果的文字。
漫画中的手绘、异形文字的识别成为了难点
研究团队发现,因为漫画中的这些各类字体和手绘样式,即便使用最早进的OCR 系统(例如 Google Cloud Vision API),在漫画文本上的表现很不理想。
所以,团队开发了针对漫画优化的文本识别模块,经过检测文本行和识别每一个文本行的字符来实现对异形文字的识别。
第二步 内容识别
在漫画中,最多见的文字就是角色之间的对话,对话文字气泡还会被切割成多块。
这就要求自动化机器翻译须要准确区分角色,还得联系上下文注意主语的衔接、避免重复,这都对机器翻译提出了更高的要求。
点击放大查看场景分类、文本顺序和情感识别流程
在这一步中,要经过上下文感知、情感识别等方式来实现,在上下文感知中,Mantra 团队用了文本分组、文本阅读顺序、提取视觉语义三种方式,实现了多模态的上下文感知。
第三步 自动嵌字
Mantra 这一自动化引擎,不只可以区分角色、联系上下文准确翻译之外,还很好地解决了漫画翻译中的耗时最久、人力成本最高的环节——嵌字。
在嵌字这一环节中,首先要擦除嵌字区域,再进行嵌字,因为日文、中文、英文字符的形态、拼写、组合、连读方式都不同,因此这一环节的难度也尤为大。
在这一步中,须要进行:页面匹配→检测文本框→文字气泡的像素统计→拆分链接的气泡→语言间的对齐→文字识别→上下文提取。
实验: 数据集与模型测试
在论文中的实验部分,Mantra 团队提到目前并无包含多种语言的漫画数据集,因此他们建立了 OpenMantra(已开源) 和 PubManga 数据集,其中OpenMantra 用于评估机器翻译,包含 1593 个句子、848 个场景画面和 214 页漫画,Mantra 团队已经请专业翻译人员将数据集翻译成英文和中文。
OpenMantra 漫画翻译评估数据集
(同上文)
论文地址:_https://arxiv.org/abs/2012.14271_
数据格式:带注释的 JSON 文件和原始图像
数据内容:1593 个句子、848 个场景、214 页漫画
数据大小:36.8 MB
更新时间:2020 年 12 月 7 日
下载地址:_https://hyper.ai/datasets/14137_
PubManga 数据集用于评估构建的语料库,该数据集包含注释:1)文本和框架的边框;2)日语和英语的文本(字符序列);3)框架和文本的阅读顺序。
为了训练模型,团队准备了 842097 对日文、英文版的漫画页面,共 3979205 对日语-英语的句子。具体的方法能够阅读论文,最终的模型效果评估由人工完成,Mantra 团队邀请了五位专业的日文-英文翻译人员,以专业的翻译评估程序给句子打分。
目前该篇论文已经被 AAAI 2021 收录,产品化的工做也在稳步推动中,从 Mantra 团队的推特中,咱们看到已经有很多漫画成功使用了 Mantra 进行自动化机器翻译。
这样的宝藏项目,是由两位东京大学的博士生完成的,CEO石和祥之介 (Shonosuke Ishiwatari),CTO 日南凉太(Ryota Hinami) 同在东京大学博士毕业,在 2020 年创立了 Mantra 团队。
Mantra CEO 石和祥之介(左)和 CTO 日南凉太(右)
CEO 石和祥之介,是东京大学信息科学系本科 2010 级入学,博士毕业于 2019 年。他主要专一于天然语言处理领域的研究和开发,包括机器翻译和字典生成,也是本篇论文的第二做者。
值得一提的是,石和祥之介的研究经验丰富,不只曾经在 CMU 交流访学,还曾于 2016-17 年在位于北京的微软亚洲研究院实习半年,当时他在MSRA 首席研究员刘树杰团队从事 NLC (Natural Language Computing) 天然语言计算的研究。
CTO 日南凉太石和祥之介同年入学,专一于图像识别领域。在 2016-17 年同期和石和祥之介,一同在微软亚洲研究院实习。
这样的一对技能互补的小伙伴,完成了 Mantra 的大部分工做,是否是从发量到成果都很让人羡慕呢?
若是想了解更多关于 Mantra 的信息,你们能够访问论文(_https://arxiv.org/abs/2012.14271_)、项目官网_(https://mantra.co.jp/)_或下载数据集_(https://hyper.ai/datasets/14137)_,进行进一步研究。