如何在语音字幕生成软件 “字幕助手“ 中配置使用有道ASR引擎

随着科技进步、信息技术和交通运输方面取得的发展,现在世界上不同种族、不同国家、不同语言的人之间交流越来越方便了。在视频这个领域,外文的需求也越来越强烈了。

字幕助手是一款根据音频自动识别生成字幕的辅助软件。和其他同类型的软件比较,具有不用登录注册、不用上传、完全免费、流程简单、易于使用等优点。

字幕助手本身支持对多语种进行识别,默认使用百度的语音识别引擎识别中文。百度语音识别引擎分为普通版和极速版。普通版虽然可以识别多个语种,但是它的识别的效果不是很好。极速版只支持中文,按照官方文档,极速版比普通版识别速度快2倍准确率高15%。在字幕组手中其它语种的识别主要是依靠有道智云的识别引擎来实现的。有道本身在英文词典和翻译方面比较有经验,但是根据不同网友的反应,有人认为有道的识别准确些,有人认为百度识别准确一些,也有人觉得科大讯飞的语音识别的准确些。我个人是习惯使用百度的语音识别,感觉比较准确一些。我觉得这个是和你经常使用哪个语音引擎有关,这些不同的平台在帮你翻译的同时,可能也在收集你的声音进行一些深度学习和模型训练。有的人可能对自己的隐私会比较在意,那就要慎重的使用这些语音平台了。但是任何事情都是多面性的,你在提供你的个人信息的时候,可能也获得了更方便的更有效率的东西。

我今天看到一句话: “We shape our tools and then the tools shape us.” 。人类为了更加富足和安全的生活,学习使用工具并对大自然进行改造,改变并没有让所有人收益,物质的丰富反而让人变得越来越贪婪,现在有些人就渴望回归自然。说不清楚人工智能和社会的发展到底会让我们的世界变成什么样。但是我觉得在我们在享受科技进步的时候,去思考一些这样的东西是没有坏处和必要的。

好了,话不多说。我们来看一下如何用申请有道的API,并在字幕助手中进行设置。

首先,我们打开有道智云的官网: http://ai.youdao.com

需要我们注册和登录,这些很简单不详细说了,多种登录方式,建议使用微信登录,因为除了新用户送50外,微信用户还送50体验金。

在有道智云里面的配置需要分成三步,这就是和百度的主要区别,百度一步就能创建,来看看有道怎么创建。

第一步,就是创建应用,目的就是有道接口类型等信息:

图片

和百度不同的是这里要注意,你的接入方式选择API:

图片

第二步,就是创建实例:

图片

要注意一点就是这个接口类型选择短语音识别:

图片

第三步,就是把这个语音识别的实力和我们的应用通过绑定关联起来:

图片

图片

最后呢 就可以在我们的字幕助手中配置使用了。

PS:字幕助手有管网了: fasttitle.side4u.cn

============================

[孙亖]如何在语音字幕生成软件 “字幕助手“ 中使用有道ASR引擎


在这里插入图片描述