請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

電獺少女

更新於 05月05日03:46 • 發布於 05月02日08:09 • 嘻嘻

MiMo 這名字好可愛

除了 ChatGPT、DeepSeek,現在又有一款新模型問世!小米集團 30 日宣布第一個專為推理而生的大模型「Xiaomi MiMo」,為百家爭鳴的 AI 競爭投下一個震撼彈

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

Xiaomi MiMo 厲害在哪?小米集團聲稱此模型只憑藉 7 B 的參數規模,就超越 OpenAI 的閉源推理模型 o1mini 以及阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview,其強大的推理能力,是由於預訓練和後訓練階段的多層面創新驅動

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在預訓練過程中,模型已見過許多推理模式,又分為數據和訓練。在數據方面,模型藉由挖掘大量的推理語料,合成出約 200 Btokens 的推理數據,更進行三階段訓練,逐步增加訓練難度,總訓練已達 25T 的 tokens

至於後訓練方面,重點是讓強化學習(RL)的表現更穩定、更有效率,又分成兩部分:演算法和系統架構

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在演算法方面,小米設計出新方法「Test Difficulty Driven Reward」,專門解決在比較困難的情況下,強化學習容易遇到獎勵太少、學不起來的問題;另外也加入「Easy Data Re-Sampling」策略,讓訓練過程更平穩

至於系統架構,小米打造一套訓練流程「Seamless Rollout」,提升整體 RL 訓練速度到 2.29 倍,驗證速度也快了 1.96 倍,大幅提升效率

(圖片來源:科技網)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

相信大家一定很疑惑,跟備受大眾喜愛的 ChatGPT 相比,有什麼不同呢?ChatGPT 由 OpenAI 開發,屬於大型通用語言模型,具備突出的語言理解與生成能力,而 Xiaomi MiMo 由小米集團自己研發,可預測的是,其將會成為專門替小米生態系統優化的 AI 助手,功能設計更偏重生活實用與裝置控制

(圖片來源:Shutterstock)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

值得注意的是,MiMo-7B 全系列模型均已開源,推出日期甚至在阿里巴巴發佈新一代通義千問模型 Qwen3 的隔日,AI 競爭火藥味真的是隔著屏幕也聞的到。接下來就期待各家模型的實測比較了!

電獺少女 Instagram 精選每日科技新聞和促咪事件,還有各類 App 的密技心得,就差你沒追蹤!

查看原始文章

更多理財相關文章

01

LINE 收回訊息大改版!台灣用戶快注意~

電獺少女
02

她想55歲提早退休、月領2萬退休金…44歲「投保45800逾5年」能達標?「關鍵公式」活越久領越多

幸福熟齡 X 今周刊
03

聯電收盤跌1.02% 傳啟動供應鏈降價15%以上、公司不評論

經濟日報
04

輝達落腳台北恐告吹?新壽說明4方案 北市府合意終止條件不合理

anue鉅亨網
05

女星買房圓夢2/北漂6次租屋練就精準眼光 林逸欣看第3間房果斷出手原因曝

鏡週刊
06

產品遭美國海關暫扣! 巨大發聲明曝「最新進度」

中廣新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...