AI競賽|小米MiMo問世 為首個開源推理大模型 跑分贏o1-mini及Qwen-32B-Preview
小米集團旗下大模型研究團隊近日透過官方公眾號宣布,推出首個專為推理(Reasoning)設計的開源大語言模型「Xiaomi MiMo」。這款創新模型採用從預訓練到後訓練的聯動優化架構,在保持高效參數規模的同時,顯著提升各類複雜推理任務的表現。
特別值得注意的是,在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)等權威公開評測集中,僅具備70億參數規模的MiMo-7B版本,其性能表現不僅超越OpenAI的閉源推理模型o1-mini,更勝過阿里巴巴規模更大的開源推理模型Qwen-32B-Preview,展現出卓越的技術突破。
當前AI產業正經歷強化學習(RL)技術的快速發展期,DeepSeek-R1系列的推出已引發業界廣泛的協同創新熱潮。DeepSeek-R1-Distill-7B和Qwen2.5-32B等模型已成為開發者進行強化學習應用的主流基礎模型。小米MiMo-7B在相同RL訓練數據條件下,展現出在數學推導與代碼生成領域明顯優越的強化學習潛力,這項技術優勢或預示開源模型在專業領域應用的新可能。
密切留意BossMind動向!立即CLS
沒有留言。
最新內容
東方日報B1:AI推升估值 中資科技股下半年首選
on.cc 東網
泡泡瑪特珠寶店「POPOP」北京分店開業
on.cc 東網
經部更新實體管制名單 華為、中芯等601企業受限
中天新聞網
新盤市場周末錄逾200宗成交 按周增逾七成
on.cc 東網
市區兩伙私宅遺產推拍 近400呎單位開價低於「兩球」
on.cc 東網
大圍名城兩年帳蝕230萬 元朗世宙9年貶值逾8%
on.cc 東網
泰國椰子水飲品公司IIFBH Limited通過上市聆訊
on.cc 東網
晶片戰開打!台積電2奈米良率領先 三星追趕拚50%
中天新聞網
劈價求售!太古城業主勁減465萬沽海景三房 帳面仍賺三成離場(有圖)|二手市況
am730
凱和山周末沽出6伙 套現2759萬元
on.cc 東網
凱和山再沽3伙 周末連沽6伙套現逾2759萬|屯門新盤
am730
上半月十大屋苑交投百宗升26.6% 沙田第一城漲1.6倍
on.cc 東網
新地:apm父親節周末生意額及人流按年升10%|商場動態
am730
啟德海灣累沽362伙 三房呎價逾2.1萬成交|啟德新盤
am730
啟德海灣第1期昨沽三房戶 呎價21838元
on.cc 東網
GRAND SEASONS周末連沽2伙 父親節活動吸引逾200組家庭客參與|將軍澳新盤
am730
恒地一部兩周錄180宗成交 吸金近15億|一手市況
am730
嘉亨灣東南兩房月租2.48萬 業主持貨4年 回報2.6厘|二手樓租賃
am730
AI世代學歷不重要 企業睇重AI實戰能力
on.cc 東網
CCL按周微跌 逾8年半低位水平徘徊 中原:短期樓價仍反覆偏軟
am730
宏安地產港島區三盤沽3伙 單日套現逾2424萬|一手市況
am730
屯門大興花園兩房低層戶 累減30萬 同區客330萬市價承接|二手樓成交
am730
新地apm商場周末父親節人流及生意額年升10%
on.cc 東網
滶晨加推77伙 兩房折實最平909.9萬 提價最多2%|黃竹坑新盤
am730
UNI Residence「一客兩食」 投資客逾1130萬買2伙|大圍新盤
am730
滶晨開賣|首輪價單138伙一Q清 最大手客擲近8000萬掃8伙|黃竹坑新盤
am730
元朗蝶翠峰兩房價創9年低 同區半新盤6年勁蝕112萬
on.cc 東網
元朗世宙兩房545萬沽 較9年前一手價跌近9% 貶值半球|二手蝕讓
am730
瓏珀山逾1700萬沽三房戶 呎價達1.7萬|沙田新盤
am730
凱和山連沽3伙 2伙天台特色戶最低418萬成交|屯門新盤
am730
陳茂波:截至5月新股集資額近790億 資金流向印證投資者對香港信心增強
am730
保監局:五一長假於尖沙咀派神秘顧客 加強監察
on.cc 東網
餐飲業掀執笠潮 舖位租賃受壓 5月交投連跌兩個月 金額按月挫逾兩成|商舖市況
am730
滶晨昨沽清138伙推售單位 套現逾15.6億元
on.cc 東網
瑜一單日沽3伙兩房戶 成交呎價達2.7萬|何文田新盤
am730
5月商舖租賃交投價量齊跌 銅鑼灣中環空置率上升
on.cc 東網
天瀧三房戶3448萬標售 4日沽3伙吸金逾1.1億|啟德新盤
am730
富健花園兩房租盤「無縫交接」 同區客1.15萬元承租
on.cc 東網
印度將積極開採稀土 擬取代中國供應大國地位?
on.cc 東網
名日.九肚山四房海景戶1748萬沽 本地夫婦購新居賀父親節|沙田新盤
am730
留言 0