請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

DeepSeek抄襲OpenAI?是大外宣嗎?中國突破美國管制?一次看懂DeepSeek

天下雜誌

更新於 04月15日04:10 • 發布於 02月07日04:01 • 陳竫詒
DeepSeek抄襲OpenAI?是大外宣嗎?中國突破美國管制?一次看懂DeepSeek

Deepeek挑戰了這幾年AI熱潮大家的信念,

  • 一個是輝達在AI晶片的獨霸,會不會其實根本不需要那麼多高階的晶片,就可以做到?
  • 一個是美國的主導地位,原來可以被小成本的後進者超越?美國阻止不了中國的創新?

同時,更帶出了許多疑問。

  • DeepSeek選在川普就職發表新模型,是不是大外宣?
  • 中國AI這麼強嗎?
  • 中國如何突破美國管制?
  • DeepSeek突破了什麼?技術真假為何?
  • 真的不用輝達高階晶片嗎?
  • 前身幻方量化在幹嘛?賺那麼多嗎?
  • 和中國政府關係?
  • DeepSeek能走多遠
  • 抄襲OpenAI?

DeepSeek是大外宣嗎?為什麼這個時候宣布新的模型?

「選擇在川普就職日發布新模型,是深思熟慮的結果,」國際研究中心(CSIS)研究員艾倫(Gregory C. Allen)表示,傳達訊息的時間和方式,就是中國政府希望大家都明白,出口管制沒有作用,美國不是人工智慧唯一的領先者。

這幾週發布的中國新模型,除了DeepSeek之外,還有好幾個。阿里巴巴的通義千問(Qwen)、騰訊的混元大模型,還有號稱比GPT-4o 低10 倍的MiniMax 01都趕在農曆過年前發布。

市場研究公司Constellation Research首席分析師Ray Wang認為,「這顯然是心理戰,」要在通用AI(AGI)的賽道脫穎而出難度太高,但是在效率上領先,就夠讓人驚艷。IDC的分析也有相同觀點,中國希望表明,在科技領域依然是不可忽視的力量。

中國AI這麼強嗎?

中國本來就不弱。根據中國信息通信研究所去年發布的白皮書,全球AI大語言模型數量已經達到1328個,其中36%來自於中國,僅次於美國。

人工智慧的發展三大要素,晶片、人才和數據資料。

中國政府積極培養相關人才。《BBC》指出,中國頂大正在創建快速成長的AI人才庫。

美國知名科技智庫「資訊科技與創新基金會」(ITIF),最新評比也佐證這個觀點。AI賽道上,中國在多數領域都落後美國,但在資料和應用上,得分遠遠超車。

美國晶片管制為什麼沒有用?

相對低階的晶片、幾乎只有十分之一的成本,打造出跟OpenAI效能差不多的模型,DeepSeek的問世,扎扎實實賞了美國政府一巴掌。

「美國的限制帶來了挑戰,但也激發創造力和韌性,」研究中國創新的雪梨科技大學副教授張越(Marina Zhang)指出,「迫使像DeepSeek這樣的中國企業,用更少的資源做更多的事,」

紐約大學教授加里馬庫斯(Gary Marcus)講得很直接,「我們不小心提高了他們的技術水準。」

「美國的出口管制,讓中國企業陷入了困境,」卡內基國際和平基金會研究員希恩(Matt Sheeha)表示,「因此必須用有限的算力來提高效率,」考慮到算力短缺,接下來會看到更多企業抱團合作。

DeepSeek到底突破了什麼?技術是真是假?

DeepSeek打破了這兩年AI軍備競賽中的大資本競爭,顯示小模型在經過適當的訓練,有機會超越大模型。

微軟執行長納德拉肯定DeepSeek「有一些真正的創新」。

DeepSeek發表了論文,提供了更多R1模型實際運作的細節。

美國智庫蘭德公司(Rand)研究員海姆(Lennart Heim)舉例,早期的ChatGPT就像是讀過所有館藏的圖書館管理員,當你問問題的時候,他會根據他看過的所有書籍來回答,這個過程耗時又耗能。但DeepSeek用了另一種方法,它的管理員沒有讀過所有的書,但接受了良好的訓練,可以在被問問題時,找到正確的書來回答。

同時透過優化「混合專家模型」(MOE),不需要一個全能的專家,而是分給多位各領域的專家,這樣每個專家的培訓時間都縮短了,減輕了晶片同時處理所有事情的需求

但這也使得訓練省錢,但回答時會花費更多的時間和精力。(看更多:DeepSeek訓練超省錢,但用起來竟更燒錢?

DeepSeek可能用到了輝達高階晶片?

DeepSeek聲稱用相對低階的H800輝達晶片訓練模型,但這引發質疑,因為早在出口禁令之前,Scale AI執行長Alexandr Wang就表示,DeepSeek至少有5萬顆高階的H100晶片。

耶魯大學管理學院教授索南菲德(Jeffrey Sonnenfeld)認為,DeepSeek不是史普尼克時刻,就是波坦金時刻(Potemkin Moment),不是冷戰蘇聯的史普尼克衛星無預警發射成功,就是做做政治門面的騙局,依賴在出口禁令之前囤貨的輝達晶片,達到現在的成效。

國家證券(National Securities)首席策略師霍根(Art Hogan)對DeepSeek宣稱的突破持保留態度,「這可能就像一個高中生說他交了女友,但女友念別的學校。」不容易求證。

要拿到晶片老實說也不難。高端晶片的黑市有多活躍?「管道很多,不用擔心(貨源),」一位中國前三大大模型開發者意有所指。

《天下》2024年實地探查深圳華強北商圈,傳說中的AI晶片走私集散地,巷子內店家低聲說,「A100有現貨跟期貨,H100你下週再來看看,」店家當場拿出現貨,報價是海外市場的好幾倍。(看更多:體檢「中國2025」

如果DeepSeek真的拿到了高端晶片,那就更支持了應該加強管制的論點。

幻方量化做量化投資的,為何要囤輝達晶片?

DeepSeek的前身,是2015年成立的幻方量化,創辦人梁文鋒年僅40歲,以AI驅動交易,早在量化交易的時代,就開始為了人工智慧項目,購買輝達GPU晶片。(看更多:DeepSeek創辦人梁文鋒,少年股神變AI大神

當時擁有上萬輝達晶片的中國企業大概也就六家,其他五家都是大科技公司,要那麼多高階晶片幹嘛?幻方如果不是財力驚人,就是對於AI的投入信念驚人。

一位商業夥伴說,「第一次見到梁文鋒,他是一個髮型糟糕的書呆子,說要由一萬個晶片集群訓練自己的模型。我們並沒有認真對待他。」

DeepSeek錢從哪裡來?和中國政府的關係?

程式交易真的勝率高到讓幻方量化賺飽飽嗎?

根據《金融時報》,幻方量化的年化報酬率約13%,這在近年表現不佳的陸股,績效不錯。不過2021年幻方量化曾經因為績效不佳,公開向投資人道歉。中國監管單位2024年初也持續收緊對量化基金的管控。

2023年梁文鋒另外成立了DeepSeek,致力於開發大型語言模型。錢當然是來自於幻方量化賺的。

他當時表示,目標是不虧錢,但也不賺巨額利潤,純粹以研究為中心。梁文鋒接受媒體採訪時表示,很多人以為背後有什麼未知的商業邏輯,但主要就是好奇心的驅動。

DeepSeek與剛在中國春晚表演轉手帕扭秧歌的宇樹人形機器人,等6家新創,並稱為「杭州六小龍」。

梁文鋒還獲得了中國二把手李強的接見,參加了專家座談會。不過卡內基國際和平基金會研究員希恩接受《華盛頓郵報》採訪表示,政府的支持對DeepSeek來說是新鮮事,許多其他的中國新創獲得了政府的資金和合約。現在DeepSeek獲得世界和政府的關注,雖然可能獲得更多來自政府的資源,但也將受到大量的政府審查,這本身就是成本。

DeepSeek能走多遠?

一些行業專家表示,儘管 DeepSeek 具有成本優勢,但其低價位可能會虧損。運算能力也可能進一步落後於競爭對手。

梁文鋒受訪坦言,「資金從來不是問題,出口管制是。」

DeepSeek「蒸餾」自OpenAI?

DeepSeek不全然是橫空出世,OpenAI可能也貢獻了一把。

微軟和OpenAI正在調查,DeepSeek是否將OpenAI的專有模型,整合到自己的模型中。

川普新任命的AI和加密貨幣總監薩克斯(David Sacks)接受福斯採訪時表示,有大量證據表明DeepSeek運用OpenAI模型來幫助開發自己的技術。

OpenAI 向《金融時報》表示,已經看到一些「蒸餾」(distillation)的證據。

所謂「蒸餾」指得是用大模型產生的內容訓練其他模型,如同老師和學生的關係,老師擁有的龐大知識,可以快速轉換給學生,有效壓縮重量級模型。開發人員藉此讓小模型獲得好效能,可以更低的成本達成特定任務。

「蒸餾」是產業界常見的做法,問題是OpenAI現在並不是開源模型,如果DeepSeek真的這麼做了,那可能涉及違反智慧財產權的疑慮。

有些用戶發現,DeepSeek的回答,出現了「OpenAI」的字樣,例如回應,「根據OpenAI政策,我必須避免表示我有意識能力」一類的字眼。

(資料來源:FT、Bloomberg、WaPo、WSJ)

【延伸閱讀】

DeepSeek崛起,中國搶佔開源模型生態系?

心理學家:Z世代「報復性離職」的3個原因

● 更多內容,請見天下雜誌816期《人生的禮物》

查看原始文章

更多理財相關文章

01

全台空屋91萬、餘屋11萬全爆量 六都中「高雄、台南」狀況最嚴重

三立新聞網
02

台灣關稅出爐了?台指期跳水百點

NOWnews 今日新聞
03

大全聯體系8/1起只接受全支付 不收其他電子支付

自由電子報
04

金管會限ETF配息率!00878開第一槍配0.4元

NOWnews 今日新聞
05

從天堂到地獄!川普下令8/29起中國直送美國包裹不再免稅,電商面臨生死存亡考驗

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 5

葉定宏
白癡媒體…openAI是閉源的….多讀點書好嗎?閉源的..閉源的…剽竊不了..沒得抄….所以別再黑deepseek.全世界的人都不會相信的..deepseek超級好用..全世界都在用..免費的..開源的.可以更改自己需要的參數訓練屬於自己公司的AI大模型👍👍👍👍👍👍👍
02月07日08:28
黃君華
習近平讓天才們 有清淨的時間與空間 專研學問 ! 台灣政府應該儘快讓 黨政軍 黑幫 毒蟲 遠離校園 不要讓台灣優秀的人才 浪費在 八掛 抹黑 寫假論文 傳播假消息 台積電 只是一時 Deepseek 也是一時
02月07日08:17
Louis
希望中國重視AI的安全性
02月07日08:27
簡為邦 EnoChien
最後一段說出了 deepseek 就是抄襲的! OpenAI 向《金融時報》表示,已經看到一些「蒸餾」(distillation)的證據。 所謂「蒸餾」指得是用大模型產生的內容訓練其他模型,如同老師和學生的關係,老師擁有的龐大知識,可以快速轉換給學生,有效壓縮重量級模型。開發人員藉此讓小模型獲得好效能,可以更低的成本達成特定任務。 「蒸餾」是產業界常見的做法,問題是OpenAI現在並不是開源模型,如果DeepSeek真的這麼做了,那可能涉及違反智慧財產權的疑慮。 有些用戶發現,DeepSeek的回答,出現了「OpenAI」的字樣,例如回應,「根據OpenAI政策,我必須避免表示我有意識能力」一類的字眼。
02月07日10:55
這軟體能幹嘛的,沒幾人想用啊…
02月07日08:23

顯示全部

最新消息

川普關稅重擊美國8.2兆零售批發業 業者示警漲價潮擋不住

anue鉅亨網

盤中速報 - 費城半導體大跌2.02%,報5670.46點

anue鉅亨網

天然氣廠CMS Energy 第二季財報優於預期,長期受惠資料中心用電需求

優分析

盤中速報 - Palo Alto Networks Inc(PANW-US)大跌5.02%,報173.85美元

anue鉅亨網

美日汽車降稅卡關!日本籲川普盡快簽署命令

anue鉅亨網

繳最佳成績單股價飆 台達電鄭平:今年只有AI好

鏡週刊

三大事業強攻獲利亮眼 光寶明年AI業績拚破2成

鏡週刊

昇達科低軌衛星營收占比逾5成 汐止新線第4季啟用

中央通訊社

盤中速報 - 高通(QCOM-US)大跌5.05%,報151.03美元

anue鉅亨網

萬事達卡 Agent Pay 三大智慧支付登場!全台首推生物辨識驗證取代 OTP 上線

科技新報

颱風豪雨致中南部災情 金融業捐款逾2.09億元

中央通訊社

減數位落差 金管會發布數位金融服務包容性指引草案

中央通訊社

固態電池商業化加速,硫化物電解質路線最受關注

科技新報

汽車零組件大廠BorgWarner(BWA)上修2025財測,電動車銷售飆升、市況優於預期

優分析

川普不敢動曝光機!ASML設備享「零關稅優惠」 間接助攻台積電大利多

風傳媒

台積電投資1650億還不夠?專家曝關稅卡關主因:台灣再拿3000億不是問題

風傳媒

外匯速報 - 歐元/日元(EURJPY) 大漲0.82%,報171.88元

anue鉅亨網

上奇 代子公司公告 GrandTech Systems Limited 現金減資實收資本額變更登記完...

MoneyDJ理財網

盤中速報 - 泰瑞達(TER-US)大漲5.07%,報113.11美元

anue鉅亨網

鉅亨速報 - Factset 最新調查:電子灣拍賣網站(EBAY-US)EPS預估上修至5.42元,預估目標價為84.50元

anue鉅亨網

鉅亨速報 - Factset 最新調查:巴西航空工業(ERJ-US)EPS預估上修至2.05元,預估目標價為62.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:安賽樂米塔爾(MT-US)EPS預估上修至5.1元,預估目標價為35.54元

anue鉅亨網

鉅亨速報 - Factset 最新調查:哈門那(HUM-US)EPS預估上修至17元,預估目標價為280.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:華住酒店集團ADRHTHT-US的目標價調降至46.09元,幅度約3.72%

anue鉅亨網

鉅亨速報 - Factset 最新調查:CSL公司(CSL-US)EPS預估下修至21.04元,預估目標價為440.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Cadence設計系統CDNS-US的目標價調升至390元,幅度約4%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Neurocrine生物科學NBIX-US的目標價調升至169元,幅度約3.05%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Avis預算集團(CAR-US)EPS預估下修至7.11元,預估目標價為135.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:羅賓昇國際聯運CHRW-US的目標價調升至116元,幅度約4.04%

anue鉅亨網

鉅亨速報 - Factset 最新調查:艾利科技(ALGN-US)EPS預估下修至10.14元,預估目標價為199.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Robinhood Markets Inc - Class AHOOD-US的目標價調升至110元,幅度約6.8%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Fair Isaac公司FICO-US的目標價調降至1950元,幅度約7.14%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Fair Isaac公司FICO-US的目標價調降至1950元,幅度約7.14%

anue鉅亨網

鉅亨速報 - Factset 最新調查:BridgeBio Pharma Inc(BBIO-US)EPS預估上修至-2.96元,預估目標價為60.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:TechnipFMC公司(FTI-US)EPS預估上修至2.17元,預估目標價為41.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Telefonica Brasil S.A., - ADR (Representing Ord)VIV-US的目標價調升至12.5元,幅度約3.97%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Avis預算集團CAR-US的目標價調升至135元,幅度約16.38%

anue鉅亨網

微軟、Meta財報優於預期 標普、那指再創歷史新高

民視新聞網

大同邀三立董座張榮華入股? 王光祥晚間證實「借其長才重返榮耀」

CTWANT

鉅亨速報 - Factset 最新調查:聯亞(3081-TW)EPS預估下修至4.63元,預估目標價為350元

anue鉅亨網