聯系我們 - 廣告服務 - 聯系電話:
您的當前位置: > 關注 > > 正文

世界速訊:MS-TTS:免費微軟TTS語音合成工具 一鍵合成導出MP3音頻

來源:CSDN 時間:2023-02-10 13:46:16

聲明

本工具是個免費工具,遇到問題,還請自行解決,下面有文字教程,B站有視頻教程(鏈接在文章末尾);


(資料圖片僅供參考)

其次,微軟接口卡頓,連接超時等問題下方有詳細說明,請仔細看一下;

再次,強制升級是為了統一版本方便問題的收集與解決,如果你能理解最好,不能理解的話,那建議你還是不要用了,強扭的瓜不可能甜!

前言

微軟TTS文本轉語音引擎的確是非常NB,合成語音非常接近真人,應該是當前同類產品中體驗最好的,官網有提供在線語音合成,但不提供合成后的音頻文件下載,使用時會比較麻煩,所以寫成工具;

目前,MS-TTS工具經過N個版本更新,該實現的功能都已經一點點肝出來了,稱它為全網最強免費TTS文本語音合成工具應該不為過,所以,接下來可能在很長一段時間內,除去發現重大bug外,應該都不會再進行大的更新了,當然,有什么好的意見建議可以繼續留言告知(提示:少數人需要的特殊功能不在此范圍,真有需要可聯系定制)。

當前版本:v1.9.6.3

Bug反饋

使用說明(以下內容請仔細閱讀)

1、下載的壓縮包記得先解壓縮,再使用?。?!

2、解壓后運行主程序 MS-TTS.exe(注意:軟件有加密保護,會被部分殺毒軟件和電腦管家勿報及限制操作權限,建議將殺毒軟件及電腦管家關閉后使用,當然,如果不放心,可以不要使用)

3、軟件界面

3.1 接口設置

左側最上方為TTS接口選項,當前軟件支持 微軟、 Edge兩大接口,優缺點如下:

微軟Edge

角色個性化設置支持不支持

穩定性不穩定較穩定

合成速度一般快

WAV格式支持不支持

接口下方代理選項專為微軟接口設置,原因就是因為微軟TTS服務器網絡非常不穩定,如果一定要使用微軟接口,有條件的話就可以使用http代理,如果沒條件且又一定要使用微軟接口的話,建議在01:00-11:00時間段使用,連接穩定性及合成速度相對會好一些!

3.2 選項

合成音頻保存質量選項,微軟接口mp3、wav兩種格式都支持,Edge只支持保存mp3格式;

3.3 角色

語言:TTS文本轉語音中的文本內容所屬語言(一定要和合成內容的語言相對應)

語音:根據所先語言不同,對應的語音角色也不相同,要自行根據實際情況選擇

風格:角色的說話語氣風格

角色:這個角色一般是指角色的年齡段(實際使用效果不明顯,且只有少部分角色支持)

語速:語音合成時的說話速度,0是正常水平,>0加快,<0減慢

音調:語音合成時的說話音調,0是正常水平,>0音調升高,<0音調降低

添加角色:可將設置好的角色添加到下方的角色列表,用于文本轉語音時實現多角色配音的效果(不添加角色時,所有語音合成直接使用上方角色及各項設置)

3.4 簡單模式-中小文本

主要用于合成文本內容不多的情況,可以更為方便快捷的對文本內容進行各種自定義

在編輯區域點擊鼠標右鍵,會彈出右鍵菜單

粘貼:將復制好的文本內容粘貼到編輯區域

清空:清空編輯區域所有內容

插入間隔:在光標所以位置插入間隔標記,后面在進行語音合成時,將會在指定位置按照設置好的間隔時間進行停頓

設置角色:使用此功能需要在左側列表先添加角色,然后使用指定角色對選中范圍文本內容進行標記,進行過角色標記的內容在后面進行語音合成時,將以指定的角色設置進行語音合成。

3.5 簡單模式-超長文本

在表格區域點擊鼠標右鍵,會彈出右鍵菜單:

導入:導入需要進行tts合成的txt文本文件

導入的txt文本大小不能超過5MB(超過5MB文本文件無法導入)

導入的txt文本文件編碼格式必須為UTF-8,非UTF8編碼文件在導入后,在狀態欄會顯示“編碼錯誤”,在進行tts語音合成時,會直接跳過

清空:清空列表

也可以直接選中多個txt文本文件,拖動到軟件界面完成導入

3.6 SSML

SSML:是一種基于XML的語音合成標記語言,此功能一般只用于需要深度自定義的場景,使用SSML一定要按照其規定的語法及命令,否則將無法合成(命令語法錯一個字母都不行),具體可點擊右上方綠色文字,跳轉到官方SSML文檔進行學習。

SSML:主體內容不能超過2500字符(微軟官方有限制)

3.7 軟件設置

保存目錄:可自定義合成音頻保存目錄(打開:快速打開保存目錄,選擇文件夾:選擇保存目標文件夾)

合成音頻使用原始文件名命名:在超長文本模式下生效,勾選后,最終合并音頻文件名以“原始導入文本文件名_tts”進行命名

合成結束打開保存目錄:在語音合成任務完成后打開保存目錄(如果保存文件夾已經有打開則不會再打開)

分段音頻合并數量:在進行超長文本合并時,如果將所有音頻進行完整合并,最終生成的音頻文件將會非常大,動轍幾GB,于是采取了二級合并的模式,可以自行根據需求按指定數量合并(如果還是不能理解,打個比方,你的文本合成音頻后,有300個音頻文件,如果對這300個音頻文件進行完整合并,最終合成的文件只有一個,且文件大小將會達到幾GB,不方便移動傳輸,且合成時間會非常長,現增加的二級合并,意思就是按照指定的數量對前面生成的300個文件進行合并,比如默認二級合并數量50,意思就是以50個音頻為一組,對前面的300個音頻進行分開合并,這樣300個音頻文件合成完成后,就會生成6個二級合并的音頻文件,每個二級合并音頻文件大小就會降到幾百MB)

合成結束刪除1級音頻片段:1級音頻片段就是最多的,4位數字開頭的音頻片段文件

合成結束刪除2級音頻片段:2級音頻片段就是按照上面指定分段音頻合并數量對1級音頻片段進行合并后生成的3位數字開頭音頻文件

是否進行最終完整合并:就是將所有分段音頻文件合并成一個音頻文件。

路徑檢測:顯示YES表示路徑正常,可正常進行音頻合并

保存配置:將各項設置內容保存至配置文件(./Nconfig.ini)

注:刪除音頻片段時,將遵循保護性邏輯,即:在只存在1級音頻片段時,即使勾選合成結束刪除1級音頻片段也不會執行刪除,在同時存在1級音頻片段與2級音頻片段時,勾選刪除1級音頻片段生效,而2級音頻片段即使勾選刪除將不會執行,同理,在同時存在1級、2級音頻片段,且進行了最終完整合并的前提下,勾先刪除1級、2級音頻片段才會生效執行。

4、多音字

MS-TTS運行后會自動在程序目錄生成“dict.txt”詞典文件,

將需要自動替換的內容按照: 原始內容,替換內容的格式一行一條,寫入“dict.txt”詞典文件保存即可,如下:

5、試聽合成

5.1 試聽

提供最長不超過150字符內容的角色聲音試聽,多角色只試聽第一段內容

5.2 合成

按照設置好的角色對指定內容進行TTS語音合成

5.3 停止

停止正在進行的任務

軟件報病毒

視頻教程

視頻為1.9.3版本視頻,多數操作相同

責任編輯:

標簽:

相關推薦:

精彩放送:

新聞聚焦
Top 岛国精品在线