Google 發佈 Gemini 2.5 Flash 與 Pro 穩定版本　全新 2.5 Flash-Lite 主攻速度

更新於 3小時前 • 發布於 5小時前 • NewMobileLife

Google宣布正式推出 Gemini 2.5 Flash 與 Pro 的穩定版本，標誌著這兩款模型已進入生產階段，同時也預覽了全新輕量級版本 Flash-Lite，主打高效能與低成本，為 Gemini 系列再添一員。

Flash 與 Pro 模型正式穩定上線

經過先前預覽階段的測試與驗證，Gemini 2.5 Flash 與 Pro 模型正式進入穩定版本，現在開發者可透過Google AI Studio、Vertex AI 以及 Gemini 應用程式存取這些模型。這些模型不僅在產業基準測試中表現出色，根據實際應用與內部測試，實際使用情境中也延續了這些成果。此外，Google Search 亦採用客製化版本的 Flash 與 Flash-Lite 強化搜尋體驗。

Flash-Lite 速度最快

新預覽的 Gemini 2.5 Flash-Lite 是目前整個 2.5 系列中速度最快且最具成本效益的模型。Google 表示，此版本在編程、數學、科學、邏輯推理與多模態任務上，皆優於先前的 2.0 Flash-Lite。無論是 GPQA（科學）、AIME（數學）或 LiveCodeBench（程式生成）測試，Flash-Lite 都展現出顯著提升，甚至在部分項目接近大型模型的表現。

高推理效能帶來更準確結果

Flash-Lite 的計費標準清晰，無論是標準模式或「Thinking」推理模式，輸入每百萬 token 為 0.10 美元，輸出為 0.40 美元。然而「Thinking」模式為提升準確性，會生成更多推理 token，使實際使用成本可能較高。這也意味著開發者可根據任務需求，自行取捨精度與成本間的平衡。

為高流量低延遲場景而設計

Google 指出，Flash-Lite 特別適合翻譯與分類等高流量、低延遲任務。根據基準數據，Flash-Lite 在 FACTS Grounding（86.8%）與 Multilingual MMLU（84.5%）中表現亮眼，視覺理解方面則分別達到 MMMU 的 72.9% 與圖像理解測試的 57.5%。此外，Flash-Lite 同樣支援多模態輸入、Google Search 與程式碼執行等工具整合，支援長達百萬 token 的上下文處理。

Gemini 2.5 系列全面升級

Gemini 2.5 系列設計上全面導向混合推理，力求效能與延遲、成本間的最佳平衡。Google 表示，這些模型皆定位於 Pareto 前緣，兼顧能力與效率。從穩定版本 Flash、Pro 到輕量的 Flash-Lite，Gemini 系列正在建立一條完整的模型產品線，以應對不同規模與複雜度的應用需求。

NewMobileLife 網站：https://www.newmobilelife.com

查看原始文章