OpenAI 開放模型 gpt-oss 來了!這次拿什麼和 DeepSeek、Meta 拚了?
OpenAI 宣布推出全新開放權重模型 gpt-oss 系列,包括 gpt-oss‑120b 與 gpt-oss‑20b,可免費下載、客製化,甚至能在筆記型電腦等消費級裝置上運行。這是 OpenAI 自 2019 年 GPT‑2 後,時隔 6 年首次釋出開放權重語言模型,也是與中國 DeepSeek、Meta Llama 系列、阿里巴巴 Qwen 等熱門開放模型正面競爭的重要一步。
6 個月前,中國 AI 新創 DeepSeek 推出開放模型 R1,其表現可與部分 OpenAI 產品媲美,令外界震驚。在 R1 發表數天後,OpenAI 執行長奧特曼在社群平台 X 表示,他認為公司在開源與閉源選擇上「站在了歷史的錯誤一方,必須想出一個不同的開源策略」。如今,OpenAI 終於釋出開放版本,其特色是什麼?
1. 瞄準全球「開放模型」市場,一台筆電免費就能跑
gpt-oss 有兩種版本:1200 億參數版本和 200 億參數版本。較大的版本可以在單一 NVIDIA GPU 上運行,較小的版本只需 16GB 記憶體即可在邊緣裝置上運行,OpenAI 表示,這「使其成為手機或筆電等設備使用場景的理想選擇」。
這兩個模型版本皆已透過 Hugging Face、Databricks、Azure 和 AWS 等平台開放,並採用 Apache 2.0 授權條款。
根據《WIRED》,Apache 2.0 授權條款是開放權重模型的熱門選擇。使用 Apache 2.0,可以將模型用於商業用途、調整,並作為其他授權軟體的一部分。中國阿里巴巴的 Qwen 和法國 AI 新創 Mistral 發布的開放權重模型,也是採用 Apache 2.0。
《VentureBeat》分析,Apache 2.0 授權比起 Meta 較複雜且有細節限制的「半開源」Llama 授權更友好。Llama 的授權要求,若服務的月活躍用戶超過 7 億,必須取得付費授權才能繼續使用該系列 AI 模型,但 gpt-oss 沒有這類限制。
2. 多功能、性能與 OpenAI 閉源模型並駕齊驅
《Financial Times》與《VentureBeat》指出,雖然 gpt-oss 是「開放權重」而非真正「開源」——開源往往提供更全面的資訊,例如資料集和從頭開始訓練模型所需的程式碼;此外,這兩款模型都是純文字語言模型,使用者只能輸入文字訊息並接收文字回復──但 gpt-oss 仍能撰寫程式碼、處理數學題目與數值運算,在性能表現,排名更高於部分 OpenAI 的付費模型,並稱推理任務表現優於同規模的開源模型。
根據 OpenAI 的說法,參數量較大的 gpt-oss-120b 在推理與工具使用的多項基準測試中,表現已達到或超越其閉源的 o4-mini 模型。其測試的基準包含美國數學邀請賽 AIME 2024 和 2025、通用問題解決的 MMLU 與 HLE、代理型評測,以及醫療領域的專用評測 HealthBench。較小的 gpt-oss-20b 則與 o3-mini 相當,甚至在部分基準測試中超越後者。
外媒分析,這代表企業可以在完全私密、安全的狀態下,在自有硬體上部署功能強大、接近頂規的 OpenAI 模型,而無需將任何資料上傳至雲端、網頁伺服器或其他外部系統──這對於金融、醫療、法律等高度受監管的產業,或是軍事、情報及政府組織來說極為關鍵。
gpt-oss 也具備進行瀏覽網頁、呼叫雲端模型協助完成任務、執行程式碼,並作為 AI 代理導航軟體的工具使用能力。
3. 強調安全性,開放思路鏈監測濫用行為
事實上,gpt-oss 原訂於今年 3 月發表,但因為需要進行額外的安全測試而延後 2 次發布。與閉源 AI 模型相比,發表開放權重模型的風險更高,因為其移除了使用門檻,任何人都能針對 gpt-oss 進行微調,並將其用於未預期的目的。
為此,OpenAI 特別針對開放權重版本,模擬「惡意行為者」在下載該工具後可能的濫用方式。根據《WIRED》,OpenAI 安全研究員 Eric Wallace 表示:「我們其實在內部針對一些風險領域微調了該模型,並測量我們能將這些風險推高到什麼程度。」
此外,gpt-oss 模型的「思維鏈(chain of thought)」,也就是推導出答案的過程會被顯示出來,以便監控模型的不當行為、欺騙與濫用情況。
為什麼 OpenAI 要發表免費、不賺錢的開放模型?
《The Verge》報導,OpenAI 研究員 Chris Cook 在一場媒體簡報會上表示:「我認為很多人其實會驚訝地發現,我們絕大多數客戶已經在大量使用各種開源模型。我們希望填補這個空缺,讓他們能在所有領域使用我們的技術。」換言之,OpenAI 希望透過 gpt-oss 產品吸引更多用戶放棄使用競爭對手的開放產品,回歸 OpenAI 的生態系,即使 OpenAI 不會從中獲得任何直接收入。
此外,OpenAI 一直倡導所謂的「民主化 AI」,也就是在模型中加入反映西方價值的防護和安全機制,並呼籲美國及其他國家協助抵制中國企業爭奪市佔的行動。OpenAI 執行長奧特曼在一份聲明中表示:「我們很高興,世界能在一套由美國創建、基於民主價值觀的開放 AI 技術棧上進行建構,並且它對所有人免費開放,造福大眾。」
《SEMAFOR》報導分析,儘管中國製造的 AI 模型可以在安全的伺服器上運行,但一些專家認為,該軟體理論上可能構成國家安全威脅,因此 OpenAI 推出的新模型,有望成為對抗中國競爭對手的誘人選擇。而《WIRED》認為,gpt-oss 的發布正值 OpenAI 和 Meta 等公司之間的 AI 人才爭奪戰, OpenAI 的最新產品可能會對 Meta 構成激烈的競爭,但也取決於開發者對 gpt-oss 模型的接受度。
- 立即報名 8/13【製造業資安論壇】,鴻海科技集團、台達電子、SEMI、資策會、Google Cloud 等重磅講者解密供應鏈必備的資安原生思維
*本文開放合作夥伴轉載,資料來源:OpenAI、《WIRED》、《VentureBeat》、《SEMAFOR》、《The Verge》、《Financial Times》,首圖來源:擷取自 OpenAI
留言 0