Google 發佈 Gemini 2.5 Flash 與 Pro 穩定版本 全新 2.5 Flash-Lite 主攻速度
Google宣布正式推出 Gemini 2.5 Flash 與 Pro 的穩定版本,標誌著這兩款模型已進入生產階段,同時也預覽了全新輕量級版本 Flash-Lite,主打高效能與低成本,為 Gemini 系列再添一員。
Flash 與 Pro 模型正式穩定上線
經過先前預覽階段的測試與驗證,Gemini 2.5 Flash 與 Pro 模型正式進入穩定版本,現在開發者可透過Google AI Studio、Vertex AI 以及 Gemini 應用程式存取這些模型。這些模型不僅在產業基準測試中表現出色,根據實際應用與內部測試,實際使用情境中也延續了這些成果。此外,Google Search 亦採用客製化版本的 Flash 與 Flash-Lite 強化搜尋體驗。
Flash-Lite 速度最快
新預覽的 Gemini 2.5 Flash-Lite 是目前整個 2.5 系列中速度最快且最具成本效益的模型。Google 表示,此版本在編程、數學、科學、邏輯推理與多模態任務上,皆優於先前的 2.0 Flash-Lite。無論是 GPQA(科學)、AIME(數學)或 LiveCodeBench(程式生成)測試,Flash-Lite 都展現出顯著提升,甚至在部分項目接近大型模型的表現。
高推理效能帶來更準確結果
Flash-Lite 的計費標準清晰,無論是標準模式或「Thinking」推理模式,輸入每百萬 token 為 0.10 美元,輸出為 0.40 美元。然而「Thinking」模式為提升準確性,會生成更多推理 token,使實際使用成本可能較高。這也意味著開發者可根據任務需求,自行取捨精度與成本間的平衡。
為高流量低延遲場景而設計
Google 指出,Flash-Lite 特別適合翻譯與分類等高流量、低延遲任務。根據基準數據,Flash-Lite 在 FACTS Grounding(86.8%)與 Multilingual MMLU(84.5%)中表現亮眼,視覺理解方面則分別達到 MMMU 的 72.9% 與圖像理解測試的 57.5%。此外,Flash-Lite 同樣支援多模態輸入、Google Search 與程式碼執行等工具整合,支援長達百萬 token 的上下文處理。
Gemini 2.5 系列全面升級
Gemini 2.5 系列設計上全面導向混合推理,力求效能與延遲、成本間的最佳平衡。Google 表示,這些模型皆定位於 Pareto 前緣,兼顧能力與效率。從穩定版本 Flash、Pro 到輕量的 Flash-Lite,Gemini 系列正在建立一條完整的模型產品線,以應對不同規模與複雜度的應用需求。
NewMobileLife 網站:https://www.newmobilelife.com
留言 0