A- A+

△個股:台灣大攜長問科技共研AI語音辨識模型myVoca,今年AI語音營收估增3倍

財訊新聞   2026/03/12 16:38

【財訊快報/記者劉居全報導】台灣大哥大(3045)今(12)日舉辦全新AI語音模型發表會,攜手合作夥伴長問科技,共同發表國內首款支援中、台、英、客語混合辨識的最新ASR(Automatic Speech Recognition, ASR)模型「myVoca」,展現「更節省、更精準、更快速」的三大核心優勢,實測在算力效能、精準度與辨識速度皆超車國際OpenAI Whisper-large-v3模型,是最懂台灣語的多語混合辨識模型。

台灣大哥大企業服務事業商務長朱曉幸表示,為推動ASR技術的產業落地,台灣大哥大將號召資服業者、系統整合商及硬體設備商等夥伴共築ASR生態系,目前逾30家橫跨政府、醫療、金融、交通、零售、製造等領域夥伴響應,預計今年AI語音營收規模將成長3倍,全面深耕金融、醫療、製造及智慧政府等應用場景。

台灣大哥大資訊長蔡祈岩表示,「myVoca」模型運作結合台灣大哥大與長問科技雙方優勢,台灣大哥大以電信天賦,將通用語料擴增,有效提升辨識準度、啟動特定產業(如醫療)語料蒐集與建置,並執行語料清洗、分類、標註,以及音檔品質與資料體檢;長問科技則專注於ASR模型架構設計、訓練流程與演算法調整,透過雙方攜手合作,「myVoca」所需算力僅需1/8,硬體成本顯著降低88%,經客製化調教後模型正確率最高可達97%;同時實現辨識速度零時差,開口1秒內即可完成即時轉錄,反應速度提升6倍。未來將全面導入金融、醫療、製造及智慧政府等應用場景,賦能企業AI降本增效。

蔡祈岩指出,全新「myVoca」語音辨識模型的問世,不僅是技術的升級,更是台灣將AI技術轉化為長期競爭力的關鍵示範。台灣大從架構面著手,優化推論效率與延遲控制,並強化專屬語料的擴訓能力;同時透過在地語料賦能,針對台灣特有的跨語言現象(Code-switching)、產業術語(Industry Jargon)及多樣聲學特徵(Acoustic Diversity)進行精準訓練,確保模型能真正貼近台灣語音習慣、產業用語與真實場域。證明模型落地的差距不在於規模大小,而是在於產業語料是否精準到位。藉由打造可規模化的基礎能力,台灣大正讓ASR技術成為企業創造價值的核心引擎。

朱曉幸表示,隨著企業對AI應用需求快速成長,「實用」且「可落地」的解決方案已成為產業升級的關鍵。全新的myVoca模型透過提升算力效率,讓穩定的毛利與營運成本控管得以實現;而辨識延遲的優化,則促使ASR技術從輔助工具,轉化為客服、會議及流程管理的核心引擎。台灣大憑藉在電信、資安與AI的深厚佈局,提供從模型、平台到場景的一站式支援,包含系統整合、維運與監控,協助企業客戶快速將語音技術轉化為實質的商務價值。

長問科技總經理陳又碩表示,長問科技專注於ASR模型研發,包含模型架構設計、訓練流程與演算法調整。透過本次與台灣大哥大合作,成功克服了傳統模型在台灣在地化應用上的技術瓶頸,使myVoca成為最懂台灣語的多語混合辨識模型。長問科技透過優化推論效率與延遲控制,使myVoca在確保運算精準度的同時,顯著降低企業導入AI的硬體門檻。在架構面實現「邊說邊出」的零時差體驗,讓ASR從單純的轉錄工具,演進為具備高互動能力的智慧引擎。藉由長問在演算法的深耕,結合台灣大豐富的產業語料賦能,myVoca能精準辨識台灣特有的術語與發音習慣。長問科技將持續與生態系夥伴協作,深耕醫療、金融等多元場景,將語音黑科技轉化為實質的產業競爭力。

台灣大持續深化AI語音應用布局,推出擬真人語音客服,鎖定餐廳訂位與醫療掛號等民生服務場景;同時,將自研語音記錄平台「AI聽寫大哥」結合群聯電子(8299)aiDAPTIV+ 技術,提供高效能的地端解決方案,並為擴大ASR技術的落地應用,台灣大號召資服業者、系統整合商及硬體設備商等夥伴,共同組建ASR生態系,期盼透過跨域協作,深耕醫療、金融、政府及製造等多元場景。

注目焦點

推薦排行

點閱排行

你的新聞