详解Android SDK1.6中Text-To-Speech(TTS)语音朗读

时间 2019-11-05

标签详解 android sdk1.6 sdk text speech tts 语音朗读栏目 Android 繁體版

原文原文链接

TextToSpeech简称 TTS，是Android 1.6版本中比较重要的新功能。将所指定的文本转成不一样语言音频输出。它能够方便的嵌入到游戏或者应用程序中，加强用户体验。
在讲解TTS API和将这项功能应用到你的实际项目中的方法以前，先对这套TTS引擎有个初步的了解。android

对TTS资源的大致了解：异步

TTS engine依托于当前Android Platform所支持的几种主要的语言：English、French、German、Italian和Spanish五大语言（暂时没有咱们伟大的中文，至少Google的科学家们尚未把中文玩到炉火纯青的地步，先易后难也是理所固然。）TTS能够将文本随意的转换成以上任意五种语言的语音输出。与此同时，对于个别的语言版本将取决于不一样的时区，例如：对于English，在TTS中能够分别输出美式和英式两种不一样的版本（由此看出Google的作事风格真够细致，而正由于如此估计Google不加入中文的另一种理由是中文的方言太多了）。electron

能支持如此庞大的数据量，TTS 引擎对于资源的优化采起预加载的方法。根据一系列的参数信息（参数的用法将在后边有详细的介绍）从库中提取相应的资源，并加载到当前系统中。优化

尽管当前大部分加载有Android操做系统的设备都经过这套引擎来提供TTS功能，但因为一些设备的存储空间很是有限而影响到TTS没法最大限度的发挥功能，算是当前的一个瓶颈。为此，开发小组引入了检测模块，让利用这项技术的应用程序或者游戏针对于不一样的设备能够有相应的优化调整，从而避免因为此项功能的限制，影响到整个应用程序的使用。比较稳妥的作法是让用户自行选择是否有足够的空间或者需求来加载此项资源，下边给出一个标准的检测方法：ui

Intent checkIntent = new Intent();
checkIntent.setAction(TextToSpeech.Engine.ACTION_CHECK_TTS_DATA);
startActivityForResult(checkIntent, MY_DATA_CHECK_CODE);
若是当前系统容许建立一个 “android.speech.tts.TextToSpeech” 的Object, 说明已经提供TTS功能的支持，将检测返回结果中给出“ CHECK_VOICE_DATA_PASS ” 的标记。若是系统不支持这项功能，那么用户能够选择是否加载这项功能，从而让设备支持输出多国语言的语音功能“Multi-lingual Talking”。“ACTION_INSTALL_TTS_DATA” intent将用户引入Android market中的TTS下载界面。下载完成后将自动完成安装，下边是实现这一过程的完整代码 (androidres.com) ：this

private TextToSpeech mTts;
protected void onActivityResult(
int requestCode, int resultCode, Intent data) {
if (requestCode == MY_DATA_CHECK_CODE) {
if (resultCode == TextToSpeech.Engine.CHECK_VOICE_DATA_PASS) {
// success, create the TTS instance
mTts = new TextToSpeech(this, this);
} else {
// missing data, install it
Intent installIntent = new Intent();
installIntent.setAction(
TextToSpeech.Engine.ACTION_INSTALL_TTS_DATA);
startActivity(installIntent);
}
}
}
TextToSpeech实体和OnInitListener都须要引用当前Activity的Context做为构造参数。OnInitListener（）的用处是通知系统当前TTS Engine已经加载完成，并处于可用状态。spa

根据需求设置语言参数：操作系统

早在Google I/O大会上，官方给出了一段关于应用这项功能的鲜活体验，将翻译结果直接经过五种不一样国家语言的语音输出。加载语言的方法很是简单：翻译

mTts.setLanguage(Locale.US);
上边代码表示当前TTS实体加载美式英语。其参数并无指示某种语言的名称，而是利用国家代码来表示，这样作的好处是不但能够肯定语言的选择，并且能够根据地区的不一样而有所区别。例如：英语做为最普遍被应用的语种，在多个不一样的地区都有必定的差异。判断当前系统是否支持某个地区的语言资源，能够经过调用isLanguageAvailable()方法的返回值，根据返回值的描述来选择正确的处理方式。让应用某些绚丽功能的应用程序更加健壮，这个是贯穿整个开发过程都要考虑的技术环节。下边是一些应用实例 (androidres.com) ：orm

mTts.isLanguageAvailable(Locale.UK))
mTts.isLanguageAvailable(Locale.FRANCE))
mTts.isLanguageAvailable(new Locale("spa", "ESP")))
若是返回值是 “ TextToSpeech.LANG_COUNTRY_AVAILABLE ” 说明所选择的地区被包含在当前TTS系统中。若是系统中已经建立了TTS实体，那么能够利用isLanguageAvailable()方法来替代 Start “ACTION_CHECK_TTS_DATA ” intent 检测。当没法找到任何可用资源匹配所指定的参数时，将会返回 “ TextToSpeech.LANG_MISSING_DATA ”的结果。下边给出另外两个返回其它不一样状态信息的例子：

mTts.isLanguageAvailable(Locale.CANADA_FRENCH))
mTts.isLanguageAvailable(new Locale("spa"))
两个语句的返回值均为 “ TextToSpeech.LANG_AVAILABLE ” 。第一个是检测当前系统是否支持加拿*****语，因为系统在资源库中没法找到这个地区的法语分支，其含义是仅支持这项语言（法语），而不支持当前地区的语言分支。

另外，相比于上面强制用户应用预约的语音设置，更加提倡利用Locale.getDefault()方法根据用户默认的地区设置来选择合适的语言库。

执行Speak的具体方法：

根据上边的介绍，基本实现了TextToSpeech的初始化和参数配置。下面是一个有关闹钟的应用实例，利用Speak()方法能够直接在应用程序中发挥强大的语音功能。没错，用起来就是这么简单：

String myText1 = "This Translation is from androidRes.com";
String myText2 = "I hope so, because it's time to wake up.";
mTts.speak(myText1, TextToSpeech.QUEUE_FLUSH, null);
mTts.speak(myText2, TextToSpeech.QUEUE_ADD, null);
TTS Engine的工做原理：

每一个独立的应用程序均可以单首创建一个TTS实体，而他们须要执行的语音消息列队（Queue）都统一由TTS Engine管理和语音合成。

名词解释：

synthesize [ˈsɪnθəsaɪz] DJ ['sɪnθəˈsaɪz] KK：to produce sounds, music or speech using electronic equipment （音响）合成

utterances [ˈʌtərəns] DJ [ˈʌtərəns] KK ：说话方式，语音/语调。

每一个独立的TTS实例管理语音消息列队请求的优先级和顺序等。当引用 “TextToSpeech.QUEUE_FLUSH” 调用Speak（）方法时，会中断当前实例正在运行的任务（也能够理解为清除当前语音任务，转而执行新的列队任务）。引用 “TextToSpeech.QUEUE_ADD”标签的发音任务将被添加到当前任务列队以后。

为语音任务关联Stream Type：

在Ａｎｄｒｏｉｄ操做系统中全部的Ａｕｄｉｏ　Ｓｔｒｅａｍ任务都是经过ＡｕｄｉｏＭａｎａｇｅｒ类来实现，而它会针对不一样的Ｓｔｒｅａｍ　Ｔｙｐｅ来改变语音的播放模式。StreamＴｙｐｅ能够理解为语音的播放属性，这个属性是用户根据本身的须要在系统中配置的应用方案。若是将语音任务都清楚的分门别类，能够方便的统一管理相同类别任务的属性。基于上一个Alarm Clock例子的基础上，将Speak()方法的最后一个Null参数替换成具备实际含义的数值。这个参数的类型是HashMap，若是但愿将当前的Stream Type设置为系统中Alarm类型，对上一个例子稍做改动：

HashMap myHashAlarm = new HashMap();
myHashAlarm.put(TextToSpeech.Engine.KEY_PARAM_STREAM,
String.valueOf(AudioManager.STREAM_ALARM));
mTts.speak(myText1, TextToSpeech.QUEUE_FLUSH, myHashAlarm);
mTts.speak(myText2, TextToSpeech.QUEUE_ADD, myHashAlarm);
应用语音功能的Completion Callback：

TTS中的Speak()的是异步调用，不管应用QUEUE_FLUSH 或者QUEUE_ADD做为参数均可以经过定义Listener监听当前任务的完成状态。能够利用这个方法追加Speak()执行以后的一些额外操做。下接下来的例子中，当完成第二次Speak()方法调用以后，利用OnUtteranceCompletedListener接口来调用其它方法：

mTts.setOnUtteranceCompletedListener(this);
myHashAlarm.put(TextToSpeech.Engine.KEY_PARAM_STREAM,
String.valueOf(AudioManager.STREAM_ALARM));
mTts.speak(myText1, TextToSpeech.QUEUE_FLUSH, myHashAlarm);
myHashAlarm.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID,
"end of wakeup message ID");
// myHashAlarm now contains two optional parameters
mTts.speak(myText2, TextToSpeech.QUEUE_ADD, myHashAlarm);
下边是定义Listener的代码，相似与监听按钮或者其它View Events的方法。在这里将会把Speak()中HashMap参数传进Listener中，做为条件的判断依据：

public void onUtteranceCompleted(String uttId) {
if (uttId == "end of wakeup message ID") {
playAnnoyingMusic();
}
}
“烘焙”当前实时的语音数据：

看到烘焙两个字，就会让人联想到香喷喷的面包。软件开发要关注因而否能够最大限度的实现资源的复用，特别是针对资源有限的手机应用平台。那么对于TTS这么奢侈的应用如何才能更高效的使用资源呢？此次一块儿来体验比烘焙面包更加让人激动的功能，将TTS Engine输出的Audio Stream做为永久的音频文件保存在当前的存储空间中(SDCard)。这样能够对须要重复播放的某些语音内容实现快速的回放功能，从而实现国际倡导的“减排”目的，能省就省吧！在下边的例子用经过TTS的synthesizeToFile方法，将合成的语音Stream保存在参数所指定的地址中。

HashMap myHashRender = new HashMap();
String wakeUpText = "Are you up yet?";
String destFileName = "/sdcard/myAppCache/wakeUp.wav";
myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, wakeUpText);
mTts.synthesizeToFile(wakuUpText, myHashRender, destFileName);
当完成以上操做以后会收到系统的完成通知，同时能够像其它音频资源同样，经过android.media.MediaPlayer方法来播放。但这有悖于TextToSpeech的应用流程，能够将刚刚输出的语音资源经过addSpeech()的方法将其语音和文字描述一同存储于TTS库中。

mTts.addSpeech(wakeUpText, destFileName);
在当前的TTS Instance中，任何利用Speak()方法执行相同内容的调用都将复用刚刚所生成的音频文件。若是资源丢失或者SDCard等存储设备移除，那么系统将再次经过TTS Engine合成所指定的语音内容。

mTts.speak(wakeUpText, TextToSpeech.QUEUE_ADD, myHashAlarm);
回收TTS：

当肯定应用程序再也不须要TTS的相关功能后，能够在Activity的OnDestroy()方法中调用shutDown()释放当前TTS实体所占用的资源。