阿里巴巴推 AI 開源模型 Qwen3-Omni,挑戰全球 AI 市場

發佈時間:2025/09/24

阿里巴巴(NYSE:BABA)新推出人工智慧模型 Qwen3-Omni。這是一款開源多模態 AI,能同時處理文字、圖像、音訊與影片,並支援即時文字與語音互動,展現阿里在全球 AI 競賽中的野心。

全面多模態整合 支援 119 種語言 挑戰美國巨擘

阿里巴巴將 Qwen3-Omni 定義為全球首個「端到端全模態 AI」,強調不同輸入類型間無需取捨。該模型支援 119 種語言的文字互動,能理解 19 種語音,並生成 10 種語音輸出,具備廣泛的跨語言能力。開發者可透過系統提示調整風格、角色與行為,並利用函式呼叫功能順利整合外部工具與服務。

阿里巴巴同步推出三個專用版本,包括 Qwen3-Omni-30B-A3B-Instruct、Qwen3-Omni-30B-A3B-Thinking 與 Qwen3-Omni-30B-A3B-Captioner,涵蓋指令跟隨、思考推理及音訊描述等應用場景。公司表示,該系列在 36 項音訊與影音基準測試中有 32 項達到業界最先進水準,表現超越 Alphabet(NASDAQ:GOOGL)旗下 Gemini 2.5 Pro 與 OpenAI 的 GPT-4o。

全面開源策略 商用免費釋出

與美國對手多採收費策略不同,阿里巴巴選擇將 Qwen3-Omni 以 Apache 2.0 授權條款全面開源,允許開發者免費下載、修改與商用部署。市場分析認為,透過「普及化 + 規模效應」,阿里巴巴企圖在全球 AI 競爭中另闢蹊徑,與 Google 最新的開源模型 Gemma 3n 及其他主流平台形成正面競爭。

提到的股票

參考資料

編輯整理:Celine