請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

字節跳動Seed模型開源!512k超長上下文視窗 重新定義AI應用極限

anue鉅亨網

更新於 2小時前 • 發布於 2小時前
圖:Pixabay/Unsplash/Pexel

字節跳動旗下的 AI 研究團隊 Seed,近日宣佈正式開源 Seed-OSS 系列模型,此不僅為開源社群注入新活力,更透過其業界領先的 512k 超長上下文視窗,重新定義了大型語言模型(LLM)的應用邊界。

這一系列模型專為長上下文、推理、代理(Agent)及通用任務而設計,其 512k 的上下文視窗是目前主流模型的 4 倍,甚至達到 GPT-5 上下文視窗的 2 倍,相當於能夠一次性處理超過 1600 頁的文本內容。

領先業界的超長上下文視窗
Seed-OSS 系列模型的最大亮點在於其原生訓練的超長上下文視窗。與一些模型透過後續擴展實現長上下文不同,Seed-OSS 在預訓練階段即以 12 兆個 token 的海量數據進行了原生訓練,確保了在處理數十萬字內容時的穩定性和高效性。

除了超長上下文能力,Seed-OSS 系列模型還採用了多項前沿技術,包括旋轉位置編碼(RoPE)、分組查詢注意力機制(GQA)、均方根歸一化(RMSNorm)和 SwiGLU 活化函數等。這些技術的組合確保了模型在訓練過程中的穩定性,並顯著提升了其推理表現。

獨特且靈活的「思考預算」機制
Seed-OSS 系列模型特別針對推理任務進行了最佳化,並引入了獨特的「思考預算」(Thinking Budget)功能。這項功能允許開發者根據具體任務需求,靈活地控制模型的思維鏈長度,進而有效管理推理成本並優化應用體驗。研究顯示,對於複雜的任務,如程式設計或邏輯推理,增加思考預算能顯著提升模型的準確率,而在簡單任務中則影響不大。這一設計為開發者提供了精準控制模型行為的能力,實現效能與成本的最佳平衡。

字節 Seed 團隊本次共開源了 Seed-OSS 的三個版本,以滿足不同社群的需求:

  • 基礎模型 Seed-OSS-36B-Base: 適用於通用場景的基礎模型。
  • 無合成數據基礎模型 Seed-OSS-36B-Base-woSyn: 專為學術研究社群設計,由於不包含合成指令數據,研究人員可以更專注於模型本身的架構與能力,進行消融研究。
  • 指令微調模型 Seed-OSS-36B-Instruct: 經過指令微調後,該模型在通用知識、代理、程式設計及長上下文等領域的基準測試中,取得了同級開源模型中的 7 項「性能最佳」(SOTA)表現,其整體能力超越了包括 Qwen3-32B、Gemma3-27B 和 gpt-oss-20B 等在內的多個知名模型。

採寬鬆開源協議 獲高度肯定
Seed-OSS 系列模型採用了寬鬆的 Apache 2.0 開源協議,這一舉措獲得了開發者社群的高度肯定。Hugging Face 的工程師 Tiezhen Wang 表示,無合成數據基礎模型的發布尤其有助於學術界進行更深入的研究。

字節 Seed 團隊的這一系列模型,連同先前開源的多語言翻譯模型 Seed-X、智能體模型 Tar 系列和圖像編輯模型 Vincie 等,標誌著字節跳動在開源領域的持續投入。

隨著開源逐漸成為產業「標配」,Seed-OSS 系列模型的發布不僅為開發者提供了更強大的工具,也為整個開源社群提供了更多樣化、更高品質的基礎模型選擇。這不僅是字節 Seed 團隊的技術實力展現,更是對全球 AI 生態健康發展的一大貢獻。

更多鉅亨報導
Altman示警低估中國AI實力 OpenAI推開源模型迎戰
有望9月開源!華為正式發布AI推理創新技術UCM 這些晶片股迎來大利多

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章
Loading...
Loading...
Loading...
轉發 (0)
Loading...

更多理財相關文章

01

侯漢廷為不實爆料致歉 郭智輝:此案仍由律師處理

中央廣播電臺
02

內湖超驚奇老宅!破百年屋齡8千5百萬成交 買家備註揭貓膩

三立新聞網
03

他手上股票突然被賣光,原來是稅務局出手!欠稅擺爛小心薪水、存款都被扣...真有困難怎麼辦?

今周刊
04

直擊到美國蓋竹科!手機訊號僅一格、一人孤獨東征…台灣半導體的世紀豪賭

商業周刊
05

撐不住高損失率 實支實付醫療險保費喊漲 首年最高恐漲3成、溯及舊保單

信傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

最新消息

AI 越用越失控?微軟高層示警:人們依賴引發「AI 精神病」

科技新報

永豐金證券「股票禮品卡」攻禮券版圖 熱銷破千萬元

anue鉅亨網

PCB鑽針廠凱崴因每股淨值低於票面 8/22起暫停融資融券交易

anue鉅亨網

Meta 內部文件曝爭議!傳出 AI 聊天機器人可與兒童「搞曖昧」,還允許種族歧視言論

三嘻行動哇 Yipee!

美中貿易現轉機!波音有望迎來中國多達500架客機大單

anue鉅亨網

和椿科技發表多款機器人解決缺工!程天縱:靜待殺手級應用邁成熟期

科技新報

icash Pay不急對外擴張?統一羅智先曝原因

NOWNEWS今日新聞

Meta Celeste 智慧眼鏡定價曝光,內建 HUD 顯示、搭配 AI 手環,不用 1,000 美元就能入手?

三嘻行動哇 Yipee!

研調:AI資料中心導入液冷散熱 今年滲透率逾3成

中央通訊社

雲豹能源進軍電動車充電市場 泓德獲挪威基金加碼

中央通訊社

電腦科學畢業生沒人要,AI 頂尖人才身價超過 NBA 球星

科技新報

〈房產〉7月五大銀行房貸利率2.303% 續創逾16年半高

anue鉅亨網

9/9運動部掛牌 明年編列體育運動預算248億元創史高

anue鉅亨網

明明重複好幾次指令,AI 還是不聽?問題到底出在哪

科技新報

〈房產〉輝達進駐北土科熱度還在 建商土林30億元總銷都更案趁勢推

anue鉅亨網

房市管制影響買氣 建商:剛性需求支撐都更案

中央通訊社

嘉義大埔發生5.1地震 台積電:南部廠區未達疏散標準

太報

雲林離岸風場正式邁入運維階段 股東硬撐、聯貸團強力支持允能苦盡甘來

鏡週刊

歐元區8月PMI創15個月新高 新訂單回升提振經濟氣勢

anue鉅亨網

迎關稅之亂!Audi Taiwan 確認維持現行產品線售價!

2GameSome

7月電力景氣燈號退至黃紅燈! 半導體獨強、其他產業現疲態

中廣新聞網

無訊號區也能傳訊!高通推最新 Snapdragon W5+/ W5 平台,Google Pixel Watch 4 率先搭載

科技新報

Mercedes-Benz 推台中最潮麵吧 Glou Suru 期間限定「星選擇套餐」

2GameSome

明年總預算案拍板 歲出編列3兆元 國防9495億元佔GDP 3.32%

anue鉅亨網

微軟最新基本薪資洩漏,裁員後又努力招聘 AI 人才

科技新報

格蘭菲迪與 Aston Martin 宣布成為全球合作夥伴

2GameSome

主動式ETF長期勝率僅3成?台股大跌該加碼還是該逃?

Money錢雜誌

近5年第3家外資券商撤出台灣 法國興業證券終止營業

中央通訊社

Kia EV4是首輛在歐洲生產的電動車

CarStuff人車事

順藥連6漲 昨天回檔今漲停!離400元歷史高價還有200元空間可賺

理財周刊

買鴻海免驚 內外資連日買超54.3萬餘張 21日強勢收漲5.5元

理財周刊

台股回神新台幣續貶 摜破30.5元改寫逾3個半月低點

中央通訊社

獨家/張國煒又失望了!長榮雖願給付160億股利 遺囑執行人卻這樣說

CTWANT

加百裕與系統電雙排位 BBU佈局白熱化

理財周刊

雲豹能源Q2獲利年增290% 法說會宣布跨足電動車充電市場

理財周刊

中國前7月進出口增3.5% 對非洲貿易大幅增長

中央通訊社

金管會准法興證券熄燈 最後營業日8/29

風傳媒

外資賣超101億元 期貨操作先翻多 掃貨面板股群創、友達

anue鉅亨網

主動式ETF長期勝率僅3成?台股大跌該加碼還是該逃?

CMoney

【焦點時事】AI眼鏡行情續燃!「這檔」狂飆 44%寫新高價!

CMoney