最近有需求,在原有的h5新闻页面顶部添加一个语音播报功能,播放出当前页的文章,要两个方案,一个免费的一个收费的。就开始了解在线语音合成,最后决定免费用百度,收费的用讯飞。这篇将百度语音合成api的使用javascript
原本的思路是在线请求,而后返回音频播放,而后了解到不管是百度的仍是讯飞的一次转换数量都有限,这样的话分割文章会返回多个语音,而后上面的进度条就是一条语音的进度条,这样不行,后来想到先合成多个mp3音频,而后再合并成一个,那样在线合成会很慢。
最后就采用在上传文章时候一并上传合成好的MP3音频,而后一块儿上传到服务器,也就是一个html文章对应一个mp3,只需给路径就能够。这样就是一个完整的音频,进度条也就正确了。html
其实发这个博客也想问问你们,若是在线的话如何解决慢的问题,或者有什么别的办法,还有就是打开文章时候得加载一个MP3文件很慢,如何使用缓存技术,没有弄过。但愿弄过的 说一下,或者给出一些相关文章在评论中。谢谢QAQjava
第一步:先去百度ai开放平台登陆:(http://ai.baidu.com/),而后点击控制台,进去建立一个应用,就会看到appID和API Key,这两个值后面会用到。
第二步:点击下载 [百度官方demo],下载下来后解压,下面的目录就是java语言的语音合成,里面有四个类,分别是jquery
speech-demo-master\speech-demo-master\rest-api-tts\java中的四个类
ConnUtil.java、
DemoException.java
TokenHolder.java
TtsMain.java
咱们只须要修改TtsMain中的appKey
和secretKey
的值,填写你建立应用后,显示的值。执行main就能够生成一个文件了。web
下面就是我修改后的TtsMain和control类以及请求的jsp,PS:我将四个文件放在一个文件中了
TtsMain.javaajax
import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.PrintWriter; import java.net.HttpURLConnection; import java.net.URL; import org.json.JSONException; public class TtsMain { // 填写网页上申请的appkey 如 $apiKey="g8eBUMSokVB1BHGmgxxxxxx" private final static String appKey = "你的"; // 填写网页上申请的APP SECRET 如 $secretKey="94dc99566550d87f8fa8ece112xxxxx" private final static String secretKey = "你的"; // text 的内容为"欢迎使用百度语音合成"的urlencode,utf-8 编码 // 能够百度搜索"urlencode" // 发音人选择, 0为普通女声,1为普通男生,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女声 private final static int per = 0; // 语速,取值0-15,默认为5中语速 private final static int spd = 5; // 音调,取值0-15,默认为5中语调 private final static int pit = 5; // 音量,取值0-9,默认为5中音量 private final static int vol = 5; // 下载的文件格式, 3:mp3(default) 4: pcm-16k 5: pcm-8k 6. wav private final static int aue = 3; public final static String url = "http://tsn.baidu.com/text2audio"; // 能够使用https private static String cuid = "1234567JAVA"; public static void run(String txt,int order) throws IOException, DemoException, JSONException {//order为生成顺序 TokenHolder holder = new TokenHolder(appKey, secretKey, TokenHolder.ASR_SCOPE); holder.refresh(); String token = holder.getToken(); // 此处2次urlencode, 确保特殊字符被正确编码 String params = "tex=" + ConnUtil.urlEncode(ConnUtil.urlEncode(txt)); params += "&per=" + per; params += "&spd=" + spd; params += "&pit=" + pit; params += "&vol=" + vol; params += "&cuid=" + cuid; params += "&tok=" + token; params += "&aue=" + aue; params += "&lan=zh&ctp=1"; HttpURLConnection conn = (HttpURLConnection) new URL(url).openConnection(); conn.setDoInput(true); conn.setDoOutput(true); conn.setConnectTimeout(5000); PrintWriter printWriter = new PrintWriter(conn.getOutputStream()); printWriter.write(params); printWriter.close(); String contentType = conn.getContentType(); if (contentType.contains("audio/")) { byte[] bytes = ConnUtil.getResponseBytes(conn); String format = getFormat(aue); File file = new File(order+"result." + format); // 打开mp3文件便可播放 // System.out.println( file.getAbsolutePath()); FileOutputStream os = new FileOutputStream(file); os.write(bytes); os.close(); System.out.println("audio file write to " + file.getAbsolutePath()); } else { System.err.println("ERROR: content-type= " + contentType); String res = ConnUtil.getResponseString(conn); System.err.println(res); } } // 下载的文件格式, 3:mp3(default) 4: pcm-16k 5: pcm-8k 6. wav private static String getFormat(int aue) { String[] formats = {"mp3", "pcm", "pcm", "wav"}; return formats[aue - 3]; } }
control类,getStrList方法为按500长度分割方法。
方法转自:按指定长度分割的博客spring
import java.io.IOException; import java.io.UnsupportedEncodingException; import java.util.ArrayList; import java.util.List; import javax.servlet.http.HttpServletRequest; import org.json.JSONException; import org.springframework.stereotype.Controller; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RequestParam; import org.springframework.web.bind.annotation.ResponseBody; import com.chinaDaily.ttsdemo.DemoException; import com.chinaDaily.ttsdemo.TtsMain; import com.chinaDaily.webapi_tts.WebTTs; import com.google.gson.Gson; @Controller public class get_WebTTs { @RequestMapping("get_baiduWebTTs.action") @ResponseBody public String get_baiduWebTTs(HttpServletRequest request) throws DemoException, JSONException { String txt = request.getParameter("txt"); try { txt = new String(txt.getBytes("iso-8859-1"),"utf-8"); txt = java.net.URLDecoder.decode(txt,"UTF-8"); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } List<String> strList = getStrList(txt,500);//按500长度分割 try { for(int i=0;i<strList.size();i++){ TtsMain.run(strList.get(i),i+1); } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return "1"; } public static List<String> getStrList(String inputString, int length) { int size = inputString.length() / length; if (inputString.length() % length != 0) { size += 1; } return getStrList(inputString, length, size); } public static List<String> getStrList(String inputString, int length, int size) { List<String> list = new ArrayList<String>(); for (int index = 0; index < size; index++) { String childStr = substring(inputString, index * length, (index + 1) * length); list.add(childStr); } return list; } public static String substring(String str, int f, int t) { if (f > str.length()) return null; if (t > str.length()) { return str.substring(f, str.length()); } else { return str.substring(f, t); } } }
jspjson
<%@ page language="java" contentType="text/html; charset=UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>Insert title here</title> </head> <body> 输入内容:<textarea rows="25" cols="120" id="txt" ></textarea><br> <input type="button" id="formBtn" value="语音合成"> </body> <script type="text/javascript" src="js/jquery-1.4.2.min.js"></script> <script type="text/javascript"> $('#formBtn').click(function () { var txt=$("#txt").val(); $.ajax({ type: "post", url: "${pageContext.request.contextPath}/get_WebTTs.action", data: {"txt":txt}, dataType:"json", success: function(msg){ alert("百度语音合成成功"); } }) }); </script> </html>
应该复制完,jar包齐全,不报错就能够运行,逻辑就是jsp发出请求,将txt传到后台,而后后台按500长度进行分割,循环请求百度的api,而后生成多个文件,再使用合成工具将多个MP3合成一个MP3。api