
(台泰時報11月28日電)泰國數位科技領域再添新進展,SCB 10X 於28日宣布推出「Typhoon Isan」開源語音識別系統,為全泰首個支援伊森語的自動語音辨識(ASR)模型,同時開放相關資料集供研究與開發使用。該項目旨在縮小地方語言在人工智慧領域的落差,並提升AI在多語環境下的應用能力。
SCB 10X 表示,現行語音辨識技術多以泰語中部標準語為核心訓練資料,難以精準理解各地口音與詞彙差異。伊森語雖有約2,000萬名使用者,占全國人口逾三分之一,卻缺乏一致性的書寫系統與足量的語音資料,使AI在處理相關語料時常出現辨識錯誤。該專案希望透過系統化整理資料、建立口語規範,並以開源模式鼓勵外界參與,提升AI模型對地方語言的理解力。
SCB 10X 指出,伊森語資料的建置具有多層意義,包括保存語言文化、改善科技應用,以及促進地方經濟發展。伊森地區約占全國GDP 10%,當地大量勞動人口在日常與工作場合皆使用伊森語,若語音技術具備地方語處理能力,有助於提升溝通效率與科技可及性。
該開源計畫由語言學家、教育工作者、研究團隊及伊森社群共同參與,在「TYPHOON 把 AI 做成东北味」交流活動中正式公布多項工具與資料集,包括:
1️⃣ Typhoon Isan ASR:可將伊森語語音轉換為文字的開源模型。
2️⃣ Typhoon Isan TTS:可合成自然語調的伊森語語音。
3️⃣ 開放資料庫(Open Data):涵蓋多類型語句、對話與語音樣本。
4️⃣ Isan Speech Transcription Convention:建立統一的語音轉寫標準,用於資料集整理與模型訓練。
5️⃣ Isan Spelling Standard:以泰文字建立的伊森語拼字規則。
6️⃣ Isan Speech Corpus:蒐集自多府的語音語料,包括多樣口音。
7️⃣ Isan Phonetic Dictionary:連結詞彙與發音的音標詞典,協助語音模型提升準確度。
所有工具與資料均免費開放使用,供研究機構、開發者與教育單位採用,以強化泰國AI生態系的開放協作基礎。
報告指出,傳統ASR在面對低資源語言時,常因資料稀缺與語音差異大而無法達到滿意的準確度。伊森語缺乏標準書寫體系,使資料整理更具挑戰。此一開源計畫透過跨領域合作,為地方語言建立更完整的數位基礎,亦有助未來擴展至泰國其他方言。
業界分析認為,語言多樣性已成AI發展的重要課題,地方語言的開源資料將減少開發成本,提升模型的公平性與包容性。SCB 10X 推動的伊森語專案,將有助於泰國技術社群在語音科技領域取得更大自主性,並提升在區域內的研發競爭力。
SCB 10X 表示未來將持續深化語言資料建置,並探索AI在教育、服務業與地方行政中的應用可能,希望藉由開源模式吸引更多合作夥伴,共同推動泰國AI語言科技的長期發展。
圖片來源:Bangkok Biz News
