中國部分開源AI表現優於美國 引起美方警覺
美媒報導,中國計劃將其開源人工智慧(AI)模型打造成全球標準的野心,引起美國政策制定者及企業警覺,因為擔心美國的開源AI模型可能被中國超越。而中國的部分開源AI模型,某些方面的表現已被認為優於美國的模型。
華爾街日報13日報導,中國今年以來在AI領域接連取得進展,從1月份推出的DeepSeek及其R1推理模型,到阿里巴巴手推出的通義(Qwen),再到7月以來接連推出的月之暗面(Moonshot)、智譜(Z.ai)及MiniMax等,都有提供用戶免費下載和修改的版本,它們正在推動中國AI技術在全球範圍採用。
報導提到,相形之下,相關的美國企業正感受到壓力。8月初,ChatGPT的開發商OpenAI便發布了第1個開源AI模型gpt-oss。
報導表示,在科技發展史上,行業標準的爭奪戰不一定會由技術最先進的參與者贏得,「易得性」和「靈活性」也會發揮作用,這正是中國在開源AI領域的進展,令華府和矽谷許多人擔憂的原因。
美國川普(Donald Trump)政府7月份發布的一份AI行動計劃提到,開源AI模型「可能在某些商業領域和學術研究中成為全球標準」,因此呼籲美國建立「基於美國價值觀的領先開放模型」。
就目前而言,開源AI領域的贏家回報甚微,他們花費數億美元開發模型,卻沒有直接回報。然而,中國官員不僅在AI領域,且在作業系統、半導體架構和工程軟體方面鼓勵開源研發。
有AI專家表示,中國由於擔心與美國技術的聯繫被切斷,因此正在將開源項目作為戰略後備和應急資源來扶持。美國官員就擔心,如果中國的AI模型主導全球,北京會設法利用這一點獲取地緣政治優勢,這可從中國在美中貿易戰中使用稀土作為籌碼即可看出。
除了政治考量,開源AI模型正在企業的應用市場競逐。許多客戶青睞開源AI,因為他們能自由地對其進行調整,並部署在自家電腦系統上,但仍可確保敏感資訊留存在內部。
根據研究公司Artificial Analysis數據,自2024年11月以來,中國頂尖開源模型的綜合性能,已經超越了美國最好的開源模型。透過數學、編碼和其他維度的能力對模型進行評級,該公司發現,阿里巴巴Qwen3其中一個版本,便優於OpenAI的gpt-oss模型。
然而,阿里巴巴開發的模型參數量,幾乎是OpenAI模型的2倍,這代表處理簡單任務時,Qwen可能需要消耗更多的算力完成同樣的工作。亞馬遜雲科技(Amazon Web Services)即表示,在其基礎設施上運行的gpt-oss,就比中國DeepSeek的R1更具成本效益。
根據報導,許多工程師、特別是亞洲工程師們發現,中國的AI模型在理解當地語言和捕捉文化細微差別方面,往往更為出色。中國AI模型在訓練時使用了更多中文數據,而中文與其他一些亞洲語言存在相通之處。日本工程師宇佐美信一(Shinichi Usami)最近為客戶開發了一款客服聊天機器人,他便選擇了阿里巴巴的Qwen。
宇佐美信一表示,在使用一款較先進的美國AI模型時,聊天機器人有時難以理解用戶話語中的隱含意圖,而且回答有時可能不夠禮貌。然而,Qwen似乎能更好地處理這些細微之處。
在中國競爭異常激烈的AI行業,各企業起初聚焦在閉源模型上的價格戰。近幾個月來,隨著各企業為爭奪用戶採用和公眾認可展開激戰,激戰已蔓延到開源模型領域。有專家認為,中國開源AI這場達爾文式(指適者生存)的生死博弈,將淘汰許多現有的市場參與者,但也會孕育出強大的企業。
留言 0