Android添加百度语音合成API使用(亲测踩坑)

今天要使我的app说话,因此要使用到语音合成,安卓自带的语音合成技术好像并不支持中文,因此采用国内的api,其中有百度,科大讯飞,文章是采用了百度的api,亲测踩坑之后已经可用。

1、注册开发者账号,百度开发者平台http://ai.baidu.com/tech/speech/tts,然后点击免费试用,里面可以有创建应用。

 

2、填写包名要写安卓项目的包名,注册之后会有AppID、API Key、Secret Key,这些要进行相应替换。

 

包名看这儿:

3、申请好了就进入SDK下载:

4、下载好了解压出来有一个demo文件,可以直接演示,这里直接使用源文件加入我们的安卓项目中,首先将百度的jar包导入,路径在app/libs,关于导jar包可以参考我另一篇文档https://blog.csdn.net/jyfbug/article/details/88421221。导入后如下:

5、接下来将app/src/main里面的assets和jniLibs复制到我们项目的文件夹下,将app/src/main/com.baidu.tts.sample下的control、util、listener文件夹和MainHandlerConstant.java复制到我们项目对应文件夹下,复制后我的项目结构如下所示:

6、这里有一个大坑就是在control、listener、util中的import的包都是原来的包,所以我们要手动进去改成我们的包的路径,这里以一个做演示

改成自己的项目路径:

7、建立工具类SpeakVoiceUtil.java(在原来的MiniActivity.java中改变),此后可直接调用,需要注意的也是路径问题(改成自己项目路径),代码如下

package com.example.jy.myapplication;

import android.Manifest;
import android.content.Context;
import android.content.pm.PackageManager;
import android.media.AudioManager;
import android.os.Bundle;
import android.os.Handler;
import android.os.Message;
import android.support.v4.app.ActivityCompat;
import android.support.v4.content.ContextCompat;
import android.support.v7.app.AppCompatActivity;
import android.util.Log;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;

import com.baidu.tts.auth.AuthInfo;
import com.baidu.tts.chainofresponsibility.logger.LoggerProxy;
import com.baidu.tts.client.SpeechSynthesizer;
import com.baidu.tts.client.SpeechSynthesizerListener;
import com.baidu.tts.client.TtsMode;
import com.example.jy.myapplication.control.InitConfig;
import com.example.jy.myapplication.listener.MessageListener;
import com.example.jy.myapplication.listener.UiMessageListener;
import com.example.jy.myapplication.util.AutoCheck;

import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

public class SpeakVoiceUtil {
    private static final String TEXT = "欢迎使用百度语音合成,请在代码中修改合成文本";

    // ================== 初始化参数设置开始 ==========================
    /**
     * 发布时请替换成自己申请的appId appKey 和 secretKey。注意如果需要离线合成功能,请在您申请的应用中填写包名。
     * 本demo的包名是com.baidu.tts.sample,定义在build.gradle中。
     */
    protected String appId = "15739764";

    protected String appKey = "F1rdyysEveEd9ojhUcfNm3Fk";

    protected String secretKey = "7HS2Gcq9QVp9xGTuNU6C1adunodnYX9W";

    /**
     * TtsMode.MIX; 离在线融合,在线优先; TtsMode.ONLINE 纯在线; 没有纯离线
     */
    private TtsMode ttsMode = TtsMode.ONLINE;

    /**
     * ================选择TtsMode.ONLINE  不需要设置以下参数; 选择TtsMode.MIX 需要设置下面2个离线资源文件的路径
     * 重要!请手动将assets目录下的3个dat 文件复制到该目录
     */
    private static final String TEMP_DIR = "/sdcard/baiduTTS";

    /**
     * 请确保该PATH下有这个文件
     */
    private static final String TEXT_FILENAME = TEMP_DIR + "/" + "bd_etts_text.dat";

    /**
     * 请确保该PATH下有这个文件 ,m15是离线男声
     */
    private static final String MODEL_FILENAME = TEMP_DIR + "/" +
            "bd_etts_common_speech_m15_mand_eng_high_am-mix_v3.0.0_20170505.dat";

    /**
     * ===============初始化参数设置完毕,更多合成参数请至getParams()方法中设置 =================
     */

    protected SpeechSynthesizer mSpeechSynthesizer;
    // =========== 以下为UI部分 ==================================================

    private static SpeakVoiceUtil speakVoiceUtil;

    public static SpeakVoiceUtil getInstance(Context context) {
        if (speakVoiceUtil == null) {
            synchronized (SpeakVoiceUtil.class) {
                if (speakVoiceUtil == null) {
                    speakVoiceUtil = new SpeakVoiceUtil(context);
                }
            }
        }
        return speakVoiceUtil;
    }

    public SpeakVoiceUtil(final Context context) {
        initTTs(context);
    }

    /**
     * 注意此处为了说明流程,故意在UI线程中调用。
     * 实际集成中,该方法一定在新线程中调用,并且该线程不能结束。具体可以参考NonBlockSyntherizer的写法
     *
     * @param context
     */
    private void initTTs(Context context) {
        // 日志打印在logcat中
        LoggerProxy.printable(true);
        boolean isMix = ttsMode.equals(TtsMode.MIX);
        boolean isSuccess;
        if (isMix) {
            // 检查2个离线资源是否可读
            isSuccess = checkOfflineResources();
            if (!isSuccess) {
                return;
            } else {
                print("离线资源存在并且可读, 目录:" + TEMP_DIR);
            }
        }
        // 日志更新在UI中,可以换成MessageListener,在logcat中查看日志
        SpeechSynthesizerListener listener = new MessageListener();

        // 1. 获取实例
        mSpeechSynthesizer = SpeechSynthesizer.getInstance();
        mSpeechSynthesizer.setContext(context);

        // 2. 设置listener
        mSpeechSynthesizer.setSpeechSynthesizerListener(listener);

        // 3. 设置appId,appKey.secretKey
        int result = mSpeechSynthesizer.setAppId(appId);
        checkResult(result, "setAppId");
        result = mSpeechSynthesizer.setApiKey(appKey, secretKey);
        checkResult(result, "setApiKey");

        // 4. 支持离线的话,需要设置离线模型
        if (isMix) {
            // 检查离线授权文件是否下载成功,离线授权文件联网时SDK自动下载管理,有效期3年,3年后的最后一个月自动更新。
            isSuccess = checkAuth();
            if (!isSuccess) {
                return;
            }
            // 文本模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE, TEXT_FILENAME);
            // 声学模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE,
                    MODEL_FILENAME);
        }

        // 5. 以下setParam 参数选填。不填写则默认值生效
        // 设置在线发声音人: 0 普通女声(默认) 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>
        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "0");
        // 设置合成的音量,0-9 ,默认 5
        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "9");
        // 设置合成的语速,0-9 ,默认 5
        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "5");
        // 设置合成的语调,0-9 ,默认 5
        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "5");

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer
                .MIX_MODE_DEFAULT);
        // 该参数设置为TtsMode.MIX生效。即纯在线模式不生效。
        // MIX_MODE_DEFAULT 默认 ,wifi状态下使用在线,非wifi离线。在线状态下,请求超时6s自动转离线
        // MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线,非wifi离线。在线状态下, 请求超时1.2s自动转离线
        // MIX_MODE_HIGH_SPEED_NETWORK , 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
        // MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线

        mSpeechSynthesizer.setAudioStreamType(AudioManager.MODE_IN_CALL);

        // x. 额外 : 自动so文件是否复制正确及上面设置的参数
        Map<String, String> params = new HashMap<>();
        // 复制下上面的 mSpeechSynthesizer.setParam参数
        // 上线时请删除AutoCheck的调用
        if (isMix) {
            params.put(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE, TEXT_FILENAME);
            params.put(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE, MODEL_FILENAME);
        }
        InitConfig initConfig = new InitConfig(appId, appKey, secretKey, ttsMode, params, listener);
        AutoCheck.getInstance(context).check(initConfig, new Handler() {
            @Override
            /**
             * 开新线程检查,成功后回调
             */ public void handleMessage(Message msg) {
                if (msg.what == 100) {
                    AutoCheck autoCheck = (AutoCheck) msg.obj;
                    synchronized (autoCheck) {
                        String message = autoCheck.obtainDebugMessage();
                        //                        print(message); // 可以用下面一行替代,在logcat中查看代码
                        Log.w("AutoCheckMessage", message);
                    }
                }
            }

        });

        // 6. 初始化
        result = mSpeechSynthesizer.initTts(ttsMode);
        checkResult(result, "initTts");

    }

    /**
     * 检查appId ak sk 是否填写正确,另外检查官网应用内设置的包名是否与运行时的包名一致。本demo的包名定义在build.gradle文件中
     *
     * @return
     */
    private boolean checkAuth() {
        AuthInfo authInfo = mSpeechSynthesizer.auth(ttsMode);
        if (!authInfo.isSuccess()) {
            // 离线授权需要网站上的应用填写包名。本demo的包名是com.baidu.tts.sample,定义在build.gradle中
            String errorMsg = authInfo.getTtsError().getDetailMessage();
            print("【error】鉴权失败 errorMsg=" + errorMsg);
            return false;
        } else {
            print("验证通过,离线正式授权文件存在。");
            return true;
        }
    }

    /**
     * 检查 TEXT_FILENAME, MODEL_FILENAME 这2个文件是否存在,不存在请自行从assets目录里手动复制
     *
     * @return
     */
    private boolean checkOfflineResources() {
        String[] filenames = {TEXT_FILENAME, MODEL_FILENAME};
        for (String path : filenames) {
            File f = new File(path);
            if (!f.canRead()) {
                print("[ERROR] 文件不存在或者不可读取,请从assets目录复制同名文件到:" + path);
                print("[ERROR] 初始化失败!!!");
                return false;
            }
        }
        return true;
    }

    public void speak(String string) {
        /* 以下参数每次合成时都可以修改
         *  mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "0");
         *  设置在线发声音人: 0 普通女声(默认) 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>
         *  mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "5"); 设置合成的音量,0-9 ,默认 5
         *  mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "5"); 设置合成的语速,0-9 ,默认 5
         *  mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "5"); 设置合成的语调,0-9 ,默认 5
         *
         *  mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer
         *  .MIX_MODE_DEFAULT);
         *  MIX_MODE_DEFAULT 默认 ,wifi状态下使用在线,非wifi离线。在线状态下,请求超时6s自动转离线
         *  MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线,非wifi离线。在线状态下, 请求超时1.2s自动转离线
         *  MIX_MODE_HIGH_SPEED_NETWORK , 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
         *  MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
         */

        if (mSpeechSynthesizer == null) {
            print("[ERROR], 初始化失败");
            return;
        }
        int result = mSpeechSynthesizer.speak(string);
        print("合成并播放 按钮已经点击");
        checkResult(result, "speak");
    }

    private void print(String message) {
        Log.d("SpeakVoiceUtil",message);
    }

    private void checkResult(int result, String method) {
        if (result != 0) {
            print("error code :" + result + " method:" + method + ", 错误码文档:http://yuyin.baidu" +
                    ".com/docs/tts/122 ");
        }
    }

    public void cancelResource() {
        if (mSpeechSynthesizer != null) {
            mSpeechSynthesizer.stop();
            mSpeechSynthesizer.release();
            mSpeechSynthesizer = null;
            Log.d("SpeakVoiceUtil","释放资源成功");
        }
    }

}

8、直接在别的类里面使用方法SpeakVoiceUtil.getInstance(getApplicationContext()).speak(string);即可,string即为说的话。

9、项目打包可参考我的另一篇文章https://blog.csdn.net/jyfbug/article/details/88526965