
(台泰時報11月15日電)全球生成式人工智慧快速發展,各國相繼投入強化本土技術能力,技術主權成為各界關注的新議題。泰國本土團隊 SCB10X 所主導的開源泰語 AI 模型「Typhoon」近期取得重要突破,獲亞馬遜雲端服務(AWS)選入 AI Accelerator Program(GAIA),成為亞太區八個入選團隊之一,也是東南亞唯一入列的泰語模型。
AWS 泰國區總經理瓦特森(Watson Tirapattarapong)表示,GAIA 為期八週,主要協助具備創新概念但尚未能推向市場的 AI 團隊進行產品化與規模化開發。本屆申請者逾 2,000 家,僅 40 家通過遴選,錄取率不足 2%。Typhoon 成為泰國唯一獲選團隊,顯示其技術成熟度與發展潛力獲得國際肯定。
瓦特森指出,入選團隊將獲得包含資金支持約 8 百萬泰銖等資源,另有運算額度、技術導師制度、行銷輔導與專業工作坊等多項協助,有助於加速模型部署至國際市場。他補充,AWS 長期推動新創扶植計畫 AWS Activate,過去 12 年已投入逾 7,000 億美元,顯示公司在支持 AI 生態系方面的持續承諾。
SCB10X AI 策略主管卡斯瑪(Kasima Tharapipithchai)說明,Typhoon 並非對既有國際模型進行微調,而是從零開始的前沿語言技術研究(Frontier NLP Research),專為泰語打造開源模型。儘管全球大型模型的泰語能力逐步提升,但泰語依舊屬於「低資源語言」,無論資料量、工具或研究基礎仍有不足,因此本土模型依然必要。
卡斯瑪指出,泰語 AI 目前仍面臨三大問題:
1️⃣ 辨識準確度不足——尤其是 OCR,在處理泰文文件時錯誤率仍偏高。
2️⃣ 語音辨識成本過高——主流國際服務費用高昂,使大量應用難以普及化。
3️⃣ 文化語境理解有限——國際模型在對齊(Alignment)方面,仍難完全掌握泰國文化、語氣與社會脈絡。
基於上述限制,SCB10X 決定自建開源泰語模型。Typhoon OCR 與 Typhoon ASR 已廣泛應用於企業及開發者領域,目前模型下載量累計逾 660 萬次。卡斯瑪透露,Typhoon ASR 在同等任務下的運算成本比國際模型低 400 至 500 倍,例如處理一小時音檔的成本僅約 0.0023 美元,大幅降低使用門檻。
然而,Typhoon 目前仍屬於研發階段工具,尚未達到企業要求的生產級(Production Grade)標準,例如 API endpoint、服務等級協議(SLA)與更穩定的推論服務等。卡斯瑪表示,與 AWS 合作將提升模型的擴展能力,使 Typhoon 能在全球標準化架構下正式商用。
瓦特森補充,AWS 將持續推動本地大型語言模型(Local LLM),相信市場需要多元選擇,而非單一大型模型即可解決全部需求。他強調,未來位於曼谷的 AWS 資料中心區(Bangkok Region)將可降低延遲,特別適用於即時語音代理(Voice Agent)等高度依賴反應速度的應用。
Typhoon 已應用於多個產業,包括:
1️⃣金融業者採用 OCR 進行大規模文件數位化、
2️⃣醫療機構利用模型開發內部聊天系統、
3️⃣教育領域運用 AI 教學工具協助學生準備 PISA 測驗、
4️⃣研究機構 TDRI 使用模型分析人力市場職缺文本,顯示泰語 AI 多元應用的可行性。
瓦特森最後表示,此次 AWS 與本土 AI 團隊合作,不僅是商業投資,更旨在促進泰國突破中等收入陷阱,讓創新成為未來經濟的重要動力。Typhoon 與 AWS 的合作,象徵泰國推動技術主權與本土 AI 能力的重要一步。
圖片來源:Bangkok Biz
