Microsoft AI 自研模型亮相,功能更貼近消費大眾
由微軟執行長蘇萊曼(Mustafa Suleyman)領軍的 Microsoft AI(MAI)28 日發表 2 款自研模型──MAI-Voice-1 AI 與 MAI-1-preview。新的 MAI-Voice-1 語音生成模型可在單張 GPU 上 1 秒內生成 1 分鐘音訊,而公開測試的 MAI-1-preview 展現 Copilot 未來服務的雛形。
微軟已在多項功能採用 MAI-Voice-1,包括由 AI 朗讀當日新聞的 Copilot Daily、以及生成 Podcast 形式的討論,輔助說明主題。使用者可在 Copilot Labs 試用 MAI-Voice-1,輸入想要模型朗讀的內容,並調整聲音與風格。
MAI-1-preview 是一款微軟內部的混合專家模型(Mixture of Experts Models,MoE),在約 15,000 張 NVIDIA H100 GPU 進行預訓練和後訓練,專為需要能遵循指令並對日常查詢提供有用回應的使用者所設計。
MAI 計劃在目前仍依賴 OpenAI 模型的 Copilot 當中,對特定文字應用場景逐步推出 MAI-1-preview,已在基準測試平台 LMArena 公開測試這款模型。
Try them out and send your feedback - we want to learn more about where they're performing well and how we can make them better. More detail on the blog today if you want to deep dive: https://t.co/9JaAcgLtXs
— Mustafa Suleyman (@mustafasuleyman) August 28, 2025
▲ 蘇萊曼宣布發表 MAI-Voice-1 AI 與 MAI-1-preview 兩款模型。
「我們對未來的發展抱有宏偉願景」,MAI 在官方部落格文章寫道,「我們不僅將在此領域追求進一步的突破,並相信協同一系列針對不同使用者需求與場景的專用模型,將能釋放巨大的價值。」
實際上,蘇萊曼去年外媒專訪曾表示,微軟內部的模型並非專注在企業應用。「我的邏輯是,我們必須打造一款對消費者非常有用的產品,並為我們的使用情境進行最佳化。」他說,「我們在廣告端、消費者遙測等方面擁有大量預測性強且非常實用的資料,我的重點是建立一個真正適合消費者的模型。」
(首圖來源:Microsoft AI)