SpeechGen
支援 150 種語言、5000 多種聲音的文字轉語音工具,主打多角色對白、SSML 精細控制與按量付費,不綁訂閱。
SpeechGen 是什麼
SpeechGen 是一個線上 AI 文字轉語音工具,號稱有超過 5,000 種聲音、涵蓋 150 種語言,輸出支援 MP3、WAV、FLAC 等格式。它走神經網路合成,主打自然的語調起伏,並提供不少進階控制:可以替不同段落指派不同講者做多角色對白,用 SSML 精準控制停頓與重音,也能用 cut 標籤批次處理、一章一個檔案,還能把 SRT/VTT 字幕轉成同步音訊。
它的收費跟多數同類工具不同,走按量付費(pay-as-you-go)而非訂閱,適合用量不固定的人。
功能特色與適用場景
SpeechGen 提供內建背景音樂庫、Smart Cache(重生成相同文字不再扣費),所有方案都含商用授權,可用於 YouTube、廣告與應用程式。未註冊就有 1,000 字免費額度,購買的點數一年後到期。官方稱使用者超過 50 萬、生成檔案超過 7 億。適合需要多語旁白的影片創作者、做電子學習與在地化的團隊,以及需要客服語音或語音導覽的業務應用。如果你要的是即時對話語音,它不是主場;但要做「寫好稿、精細調整、批量產出」的旁白,它的 SSML 與多角色功能很到位。
TheAI學院 編輯建議
編輯實測後的真心話按量付費加上 SSML 細控,對偶爾才要做一批旁白的人比月費制更划算。給 3.9 分。
主要功能
- 5000 多種聲音、150 種語言
- 多角色對白,分段指派講者
- SSML 精準控制停頓與重音
- 字幕(SRT/VTT)轉同步音訊
- Smart Cache 重生成相同文字不扣費
適用場景
- 多語影片旁白與配音
- 電子學習課程語音製作
- 企業電話系統與語音導覽
- 內容在地化的多語語音輸出
SpeechGen 的優點與缺點
👍 優點
- 按量付費不綁訂閱,適合用量不固定者
- SSML 與多角色控制細緻
- 所有方案含商用授權
👎 缺點
- 非即時對話語音不是它的取向
- 點數有一年到期限制
- 公司所在地資訊在不同來源說法不一
SpeechGen 常見問題
SpeechGen 是訂閱制嗎?
不是。它走按量付費,購買點數使用,點數一年後到期,適合用量不固定、不想綁月費的人。
可以做多個角色的對白嗎?
可以。它支援替不同段落指派不同講者,做出多角色對白效果,搭配 SSML 還能精細控制語氣。
使用者評價
還沒有足夠評價,搶先分享你的使用心得!
寫下你的評價 ✍️
相關 AI 工具
Dubformer
支援 140 多種語言、能逐句指導語氣的 AI 配音工作室,把 AI 速度跟人工監修的可控性放在一起。
♡Wavel AI
把影片配音、語音克隆、多語配音與字幕做在一起,主打「任何影片翻成任何語言」的在地化工具。
♡Kukarella
把文字轉語音、語音克隆、多角色對話旁白做在一起的配音平台,還能順手生視覺素材搭配你的音訊。
♡LOVO AI
以創作者為中心的 AI 語音與影片平台,旗下 Genny 把文字轉語音和影片編輯結合在一起,提供 500 多種音色、100 多種語言,讓你一站完成配音、字幕到影片產出,適合 YouTuber 與內容團隊。
♡Tunee
用聊天的方式做音樂的 AI 音樂代理。描述心情、上傳參考、丟段片段,它就把點子變成歌,還整合多家模型、分軌、母帶、人聲克隆與 MV 生成,生成內容 100% 版權歸你,可商用。
♡InsMelo
克隆人聲、幾秒生出整首歌的 AI 音樂 App。錄一段或上傳一段聲音,它就把這個聲線編成一首完整、由該嗓音演唱的歌——你的、品牌的或角色的都行,iOS、Android 與網頁版資料同步。