台灣自己的 AI:雅婷逐字稿、TAIDE 與繁中模型的現況與機會

台灣自己的 AI:雅婷逐字稿、TAIDE 與繁中模型的現況與機會

當大家都在用國外的 AI,台灣有沒有自己的 AI?答案是有。這篇介紹雅婷逐字稿、TAIDE 這些立足繁體中文與台灣脈絡的在地 AI,談談它們的定位、現況,以及『台灣為什麼需要自己的 AI』。

每次聊到 AI,總有人問:「台灣有自己的 AI 嗎?還是只能用國外的?」這是個好問題,答案也比你想的樂觀——台灣確實有立足繁體中文與在地脈絡的 AI,而且各有務實的應用。

最接地氣的應用:雅婷逐字稿

雅婷逐字稿 大概是最多台灣人實際用過的本土 AI 之一。它專注做中文語音轉文字,而且難得地把『台語』也納入,對記者、學生、會議記錄、田野訪談都很實用。當國際工具對台灣口音、台語、在地專有名詞常常力不從心時,雅婷這種『為台灣調校』的工具就顯出價值。

國家隊的繁中模型:TAIDE

TAIDE 是由台灣政府支持、學研團隊推動的繁體中文大模型計畫,目標是打造真正理解台灣語言、文化與價值的基礎模型。它的意義不只是『又一個聊天機器人』,而是確保台灣在 AI 時代握有自己的繁中模型能力,不必完全仰賴國外大廠。

台灣為什麼需要自己的 AI?

這個問題值得認真回答,理由有三個。

第一,繁體中文與台灣脈絡是國際模型的弱項。 國際大模型多以英文與簡體中文資料為主,對繁中用語、台灣的法規、歷史、在地知識的掌握常有落差。台灣若有自己的模型,才能把這些『最懂台灣』的細節做對。

第二,資料自主與資安。 政府、醫療、法律等敏感領域,不可能把資料全交給國外雲端。擁有可在地部署的繁中模型,才能在不交出資料的前提下用上 AI。

第三,產業話語權。 台灣有強大的半導體與硬體實力,若在模型與應用層也站穩腳步,才能在 AI 供應鏈中握有更完整的話語權,而不只是代工。

現況與機會:務實一點看

說實話,台灣的本土 AI 在規模與資源上,無法和國際巨頭硬碰硬,這是現實。但這不代表沒機會——韓國、日本的在地化 AI 經驗告訴我們,小市場的勝負手不在『最大』,而在『最懂在地』與『最會整合在地需求』。

對台灣來說,最務實的路線是:在通用能力上善用國際開源模型,在『繁中、台語、在地知識、特定產業』這些國際模型做不好的地方,做出自己的深度。雅婷把台語轉錄做好、TAIDE 把繁中基礎模型撐住,都是這條路上扎實的一步。

台灣有沒有自己的 AI?有,而且正在長。它或許不會是參數最大的那個,但只要把『最懂台灣』這件事做到極致,就有不可取代的位置。