字節跳動Seed模型開源！512k超長上下文視窗重新定義AI應用極限

更新於 2小時前 • 發布於 2小時前

圖：Pixabay/Unsplash/Pexel

字節跳動旗下的 AI 研究團隊 Seed，近日宣佈正式開源 Seed-OSS 系列模型，此不僅為開源社群注入新活力，更透過其業界領先的 512k 超長上下文視窗，重新定義了大型語言模型（LLM）的應用邊界。

這一系列模型專為長上下文、推理、代理（Agent）及通用任務而設計，其 512k 的上下文視窗是目前主流模型的 4 倍，甚至達到 GPT-5 上下文視窗的 2 倍，相當於能夠一次性處理超過 1600 頁的文本內容。

領先業界的超長上下文視窗
Seed-OSS 系列模型的最大亮點在於其原生訓練的超長上下文視窗。與一些模型透過後續擴展實現長上下文不同，Seed-OSS 在預訓練階段即以 12 兆個 token 的海量數據進行了原生訓練，確保了在處理數十萬字內容時的穩定性和高效性。

除了超長上下文能力，Seed-OSS 系列模型還採用了多項前沿技術，包括旋轉位置編碼（RoPE）、分組查詢注意力機制（GQA）、均方根歸一化（RMSNorm）和 SwiGLU 活化函數等。這些技術的組合確保了模型在訓練過程中的穩定性，並顯著提升了其推理表現。

獨特且靈活的「思考預算」機制
Seed-OSS 系列模型特別針對推理任務進行了最佳化，並引入了獨特的「思考預算」（Thinking Budget）功能。這項功能允許開發者根據具體任務需求，靈活地控制模型的思維鏈長度，進而有效管理推理成本並優化應用體驗。研究顯示，對於複雜的任務，如程式設計或邏輯推理，增加思考預算能顯著提升模型的準確率，而在簡單任務中則影響不大。這一設計為開發者提供了精準控制模型行為的能力，實現效能與成本的最佳平衡。

字節 Seed 團隊本次共開源了 Seed-OSS 的三個版本，以滿足不同社群的需求：

基礎模型 Seed-OSS-36B-Base： 適用於通用場景的基礎模型。
無合成數據基礎模型 Seed-OSS-36B-Base-woSyn： 專為學術研究社群設計，由於不包含合成指令數據，研究人員可以更專注於模型本身的架構與能力，進行消融研究。
指令微調模型 Seed-OSS-36B-Instruct： 經過指令微調後，該模型在通用知識、代理、程式設計及長上下文等領域的基準測試中，取得了同級開源模型中的 7 項「性能最佳」（SOTA）表現，其整體能力超越了包括 Qwen3-32B、Gemma3-27B 和 gpt-oss-20B 等在內的多個知名模型。

採寬鬆開源協議獲高度肯定
Seed-OSS 系列模型採用了寬鬆的 Apache 2.0 開源協議，這一舉措獲得了開發者社群的高度肯定。Hugging Face 的工程師 Tiezhen Wang 表示，無合成數據基礎模型的發布尤其有助於學術界進行更深入的研究。

字節 Seed 團隊的這一系列模型，連同先前開源的多語言翻譯模型 Seed-X、智能體模型 Tar 系列和圖像編輯模型 Vincie 等，標誌著字節跳動在開源領域的持續投入。

隨著開源逐漸成為產業「標配」，Seed-OSS 系列模型的發布不僅為開發者提供了更強大的工具，也為整個開源社群提供了更多樣化、更高品質的基礎模型選擇。這不僅是字節 Seed 團隊的技術實力展現，更是對全球 AI 生態健康發展的一大貢獻。

點我加鉅亨網LINE好友🔥財經大事不漏接

請更新您的瀏覽器啟用Javascript

字節跳動Seed模型開源！512k超長上下文視窗 重新定義AI應用極限

anue鉅亨網

更多理財相關文章

侯漢廷為不實爆料致歉 郭智輝：此案仍由律師處理

內湖超驚奇老宅！破百年屋齡8千5百萬成交 買家備註揭貓膩

他手上股票突然被賣光，原來是稅務局出手！欠稅擺爛小心薪水、存款都被扣...真有困難怎麼辦？

直擊到美國蓋竹科！手機訊號僅一格、一人孤獨東征…台灣半導體的世紀豪賭

撐不住高損失率 實支實付醫療險保費喊漲 首年最高恐漲3成、溯及舊保單

查看更多anue鉅亨網

軍公教確定明年不加薪 行政院：考量3大不利因素 財政壓力沉重需審慎評估

藏了10年曝光！北韓在中國邊境附近 建造秘密飛彈基地

8月21日熱門股TOP10揭曉！台股電子股續弱，AI與PCB族群在關稅與輝達效應下的抗壓挑戰

中信攜統一推uniopen聯名卡 陳佳文：首年發卡至少百萬張

川普欲入股台積電 童子賢引用雷根名言呼籲美方：拿開政府干預的手

最新消息

AI 越用越失控？微軟高層示警：人們依賴引發「AI 精神病」

永豐金證券「股票禮品卡」攻禮券版圖 熱銷破千萬元

PCB鑽針廠凱崴因每股淨值低於票面 8/22起暫停融資融券交易

Meta 內部文件曝爭議！傳出 AI 聊天機器人可與兒童「搞曖昧」，還允許種族歧視言論

美中貿易現轉機！波音有望迎來中國多達500架客機大單

和椿科技發表多款機器人解決缺工！程天縱：靜待殺手級應用邁成熟期

icash Pay不急對外擴張？統一羅智先曝原因

Meta Celeste 智慧眼鏡定價曝光，內建 HUD 顯示、搭配 AI 手環，不用 1,000 美元就能入手？

研調：AI資料中心導入液冷散熱 今年滲透率逾3成

雲豹能源進軍電動車充電市場 泓德獲挪威基金加碼

電腦科學畢業生沒人要，AI 頂尖人才身價超過 NBA 球星

〈房產〉7月五大銀行房貸利率2.303% 續創逾16年半高

9/9運動部掛牌 明年編列體育運動預算248億元創史高

明明重複好幾次指令，AI 還是不聽？問題到底出在哪

〈房產〉輝達進駐北土科熱度還在 建商土林30億元總銷都更案趁勢推

房市管制影響買氣 建商：剛性需求支撐都更案

嘉義大埔發生5.1地震 台積電：南部廠區未達疏散標準

雲林離岸風場正式邁入運維階段 股東硬撐、聯貸團強力支持允能苦盡甘來

歐元區8月PMI創15個月新高 新訂單回升提振經濟氣勢

迎關稅之亂！Audi Taiwan 確認維持現行產品線售價！

7月電力景氣燈號退至黃紅燈！ 半導體獨強、其他產業現疲態

無訊號區也能傳訊！高通推最新 Snapdragon W5+/ W5 平台，Google Pixel Watch 4 率先搭載

Mercedes-Benz 推台中最潮麵吧 Glou Suru 期間限定「星選擇套餐」

明年總預算案拍板 歲出編列3兆元 國防9495億元佔GDP 3.32%

微軟最新基本薪資洩漏，裁員後又努力招聘 AI 人才

格蘭菲迪與 Aston Martin 宣布成為全球合作夥伴

主動式ETF長期勝率僅3成？台股大跌該加碼還是該逃？

近5年第3家外資券商撤出台灣 法國興業證券終止營業

Kia EV4是首輛在歐洲生產的電動車

順藥連6漲 昨天回檔今漲停！離400元歷史高價還有200元空間可賺

買鴻海免驚 內外資連日買超54.3萬餘張 21日強勢收漲5.5元

台股回神新台幣續貶 摜破30.5元改寫逾3個半月低點

獨家／張國煒又失望了！長榮雖願給付160億股利 遺囑執行人卻這樣說

加百裕與系統電雙排位 BBU佈局白熱化

雲豹能源Q2獲利年增290% 法說會宣布跨足電動車充電市場

中國前7月進出口增3.5% 對非洲貿易大幅增長

金管會准法興證券熄燈 最後營業日8/29

外資賣超101億元 期貨操作先翻多 掃貨面板股群創、友達

主動式ETF長期勝率僅3成？台股大跌該加碼還是該逃？

【焦點時事】AI眼鏡行情續燃！「這檔」狂飆 44%寫新高價！

請更新您的瀏覽器

侯漢廷為不實爆料致歉郭智輝：此案仍由律師處理

內湖超驚奇老宅！破百年屋齡8千5百萬成交　買家備註揭貓膩

撐不住高損失率　實支實付醫療險保費喊漲　首年最高恐漲3成、溯及舊保單

軍公教確定明年不加薪行政院：考量3大不利因素財政壓力沉重需審慎評估

藏了10年曝光！北韓在中國邊境附近建造秘密飛彈基地

中信攜統一推uniopen聯名卡陳佳文：首年發卡至少百萬張

川普欲入股台積電童子賢引用雷根名言呼籲美方：拿開政府干預的手

永豐金證券「股票禮品卡」攻禮券版圖熱銷破千萬元

研調：AI資料中心導入液冷散熱　今年滲透率逾3成

雲豹能源進軍電動車充電市場　泓德獲挪威基金加碼

9/9運動部掛牌明年編列體育運動預算248億元創史高

〈房產〉輝達進駐北土科熱度還在建商土林30億元總銷都更案趁勢推

房市管制影響買氣　建商：剛性需求支撐都更案

嘉義大埔發生5.1地震　台積電：南部廠區未達疏散標準

雲林離岸風場正式邁入運維階段　股東硬撐、聯貸團強力支持允能苦盡甘來

歐元區8月PMI創15個月新高新訂單回升提振經濟氣勢

7月電力景氣燈號退至黃紅燈！　半導體獨強、其他產業現疲態

明年總預算案拍板歲出編列3兆元國防9495億元佔GDP 3.32%

近5年第3家外資券商撤出台灣　法國興業證券終止營業

順藥連6漲昨天回檔今漲停！離400元歷史高價還有200元空間可賺

買鴻海免驚內外資連日買超54.3萬餘張 21日強勢收漲5.5元

台股回神新台幣續貶　摜破30.5元改寫逾3個半月低點

獨家／張國煒又失望了！長榮雖願給付160億股利　遺囑執行人卻這樣說

雲豹能源Q2獲利年增290%　法說會宣布跨足電動車充電市場

金管會准法興證券熄燈　最後營業日8/29

外資賣超101億元期貨操作先翻多掃貨面板股群創、友達