請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

神秘中國AI模型受矚 外傳可能是DeepSeek新系統

路透社

更新於 03月18日13:46 • 發布於 03月18日13:46

(路透北京18日電)一個強大的人工智慧(AI)模型上週以匿名方式在開發者平台上出現,引發外界揣測,中國AI新創公司深度求索(DeepSeek)是否打算在正式發布前,低調測試新一代系統。

這個免費模型名為Hunter Alpha,本月11日在AI模型聚合平台OpenRouter出現,但未標註開發者身分。

在路透的測試中,Hunter Alpha聊天機器人自稱是「一款主要以中文訓練的中國AI模型」,並表示其訓練資料所涵蓋時間範圍截至2025年5月,與DeepSeek自家聊天機器人的知識截止點(knowledge cutoff point)一致。

DeepSeek和OpenRouter均未說明Hunter Alpha模型的開發者身分,也沒有回應置評請求。

Hunter Alpha的介紹頁面顯示,其模型具有1兆個參數,這意味著它約是以1兆個可調參數訓練,可調參數用於決定系統如何處理語言並產生回應。

該系統也標榜擁有最高可達100萬個詞元(token)的上下文視窗,這是用以衡量AI模型能在單次互動中處理或保留多少文本。1個詞元大致對應一小段文本,例如1個單字的片段。

這些規格符合中國媒體對DeepSeek新一代V4模型的期待,根據中媒報導,V4模型最快可能於4月推出。

儘管這些相似處無法直接證實Hunter Alpha與DeepSeek的關聯性,開發者間仍熱烈揣測,這套匿名系統可能是DeepSeek即將公布的新模型的早期測試版。

不過,也有部分開發者提醒,將Hunter Alpha模型與DeepSeek連結的證據仍不足。

獨立評測AI性能的奧茲庫爾(Umur Ozkul)指出,根據他的分析,「Hunter Alpha可能不是DeepSeek的V4模型」,因為與DeepSeek現行系統相比,兩者在詞元相關行為及架構模式上均存在差異。中央社(翻譯)

更多科技相關文章

01

13家台灣AI新創前進NVIDIA GTC!6隊入選官方Poster Gallery,軟硬實力同步爆發

創業小聚
02

美以國安為由 禁進口國外製新款家用路由器

路透社
03

數發部公布「數位金卡」成績單:3年核發破千件,打造國際人才新入口

創業小聚
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...