請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

為何 GPT-5 讓大家失望了?3 大問題曝 OpenAI 現實考驗

TechOrange 科技報橘

更新於 2025年8月12日00:34 • 發布於 4小時前 • 廖紹伶

或許是市場對它的期待過高,OpenAI 最新旗艦模型 GPT-5 一登場便開局不順,也暴露了 AI 擴張定律(AI scaling laws)發展的侷限。

OpenAI 推出 GPT-5,將原本多樣的模型選項 GPT-4o、4.5、o3 整合為「統一入口」,由 GPT-5 自動決定如何以最佳方式回答用戶提出的問題。然而,GPT-5 發布當天,OpenAI 的直播示範不只出現圖表標註錯誤與語音演示失誤,後續用戶在實際體驗中更集中反映了三大問題。

首先是數學錯誤頻仍,《VentureBeat》引述社群平台 X 網友的反應報導,GPT-5 會錯判循環小數是否等於整數、解錯基礎代數式,甚至在簡單應用題上失誤等問題,表現不如舊版 4o;在圖表判讀上也出現錯誤。

其次,GPT-5 在程式撰寫能力上,與官方宣傳有所落差。雖然 OpenAI 與一些第三方外部基準測試標榜 GPT-5 的程式撰寫能力優於其他模型,但根據《VentureBeat》,部分開發者指出 GPT-5 在一次生成完整應用程式的成功率不如 Anthropic 的 Claude Opus 4.1。資安公司 SPLX 也發現,GPT-5 安全層在提示攻擊與邏輯混淆等測試中存在漏洞。

最後,是 ChatGPT 自動路由機制失靈。原本應在複雜任務自動切換至「Thinking 模式」的深度推理版本,GPT-5 卻誤導至輕量模型,導致輸出品質下降。OpenAI 執行長奧特曼事後在社群平台 X 發文承認自動路由器在部分時間出現故障。

市場信心急轉直下,反彈呼聲逼回舊版 4o

不滿情緒迅速在社群擴散,《Business Insider》報導,ChatGPT 的付費用戶湧入 OpenAI 執行長奧特曼在網路論壇 Reddit 的線上論壇,批評 GPT-5 回應扁平、創造力不足,甚至形容 GPT-5 正在「穿著他們『死去的朋友』——GPT-4o 的皮」,並要求 OpenAI 恢復舊版。

奧特曼在 X 上發文承認,他「低估了」GPT-4o 某些特質對用戶的重要性。短短一天內,OpenAI 宣布將 GPT-4o 恢復為 ChatGPT Plus 付費方案用戶的模型選項。

根據 IMPLICATOR.ai,GPT-5 發表後,預測市場 Polymarket 上 OpenAI 的領先信心由 75% 暴跌至 14%,反映市場情緒在短時間內急轉直下。《VentureBeat》表示,雖然 GPT-5 仍處於早期使用階段,但市場觀感不如 OpenAI 先前 GPT-4、4o、o3 般屬於「全壘打」式的熱烈反響。

研究揭 AI 擴張定律極限,模型專用化時代將至

《Marcus on AI》指出,GPT-5 的問題不僅是發表當天的失誤,更揭示了大型語言模型純擴張策略的侷限。他引用亞利桑那州立大學最新研究指出,AI 的思維鏈(Chain-of-Thought)在超出訓練分佈時極易崩解,增加參數或延長上下文並不能持續帶來突破。

他認為,這正是 GPT-5 仍在棋類推理、視覺理解、算數等任務上延續既有缺陷的原因,也是所有同類 AI 模型都面臨的「擴張極限」。

IMPLICATOR.ai 觀察,這也解釋了市場對 AI 模型「專用化」需求上升的原因──團隊現在會依任務混搭不同模型,而不是只使用單一、全能的 AI 模型上,例如寫程式用專門的程式 AI 模型、分析圖片用偏重視覺的模型、做結構化分析用以推理為優先的模型。

OpenAI 策略的現實考驗

如今 AI 大戰的競爭,已不只是「誰的分數高」,還包括能否將不同任務分配給最適合的模型、在高流量時反應快不快、介面好不好用,能否讓使用者自己調整回覆的細節、語氣和風險程度──而 GPT-5 在這些地方就有點翻車了。

IMPLICATOR.ai 指出,GPT-5 的統一路由設計,本質是計算成本與體驗間的平衡——深度推理模式運行成本可能是輕量模型的 5 至 10 倍,若全部查詢都使用高成本版本,免費層與低價方案將難以維持。不過,當切換機制失準,差異立刻被用戶察覺,信任也隨之受損。

該機構認為,提升透明度、讓用戶自行切換深度與速度,並標註輸出模型來源,將是 OpenAI 重建信任的關鍵。

*立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務

*本文開放合作夥伴轉載,資料來源:《VentureBeat》Marcus on AI《Business Insider》《Economist》IMPLICATION.ai,首圖來源:擷取自 OpenAI

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

【長榮遺產3-1】張國煒逆襲成功!聲請遺囑執行人催討張榮發160億股利 北院准了

太報
02

關稅震撼》非半導體業者也要走出活路 傳產上市公司:台灣可能有「荷蘭病」

信傳媒
03

房仲寒冬已到 近1/4業績衰退6成 每2.68個更有1個想轉業

自由電子報
04

3方法無感存錢、輕鬆等退休!1招教你「無痛存下」345萬

商周財富網
05

被控千萬養小三 Gogoro董事長曾達夢是尹衍樑愛將、年薪數千萬

自由電子報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

UG靠機器搖茶 拚3年展店500間

鏡週刊

寧德時代江西鋰礦停產至少三個月,鋰礦占全球 3% 產量

科技新報

〈大量科技展望〉下半年接單滿載且南京廠擴產將完工 營收將優於上半年

anue鉅亨網

星亞視覺以 45 元掛牌上櫃!首日上演蜜月行情飆逾 27%

科技新報

工研院攜手藥華藥 搶攻癌症免疫治療市場

中央通訊社

Porsche統規賽事車型再塑性能新巔峰,新款911 Cup正式推出

CarStuff人車事

聯合骨科核心市場穩健成長 7月營收年增逾2成創高

anue鉅亨網

不受匯損影響 這家金控1-7月淨利逾547億元 每股盈餘3.5元

民視新聞網

雙普會在即!美次級制裁將解除?專家曝川普恐為2件事對俄放水 甚至暫時放過中印

anue鉅亨網

全國首例警消社宅登場 雙北三地654戶即起申請

住展

7-11秒變湯姆熊!遊樂場新店型登場:太鼓達人、寶可夢⋯機台任選,夾娃娃還能換咖啡?

數位時代

微矽電子大啖800V HVDC升級潮 GaN測試需求看旺

anue鉅亨網

南光醫藥南港新總部啟用 轉型全方位健康服務

中央通訊社

國泰金前7月賺548億元EPS 3.5元 國壽獲利回穩、3子公司續創高

anue鉅亨網

匯損衝擊 宣德第2季每股虧0.61元逾2年首見

中央通訊社

薪資跑贏通膨 上半年實質經常性薪資寫5年最大增幅

中央通訊社

房屋部分出租或營業也享優稅?地價稅這樣算不吃虧!

5168實價登錄比價王

日本熊本大雨特別警報 台積電:JASM目前無影響

中央通訊社

鉅亨買幣速報 - 比特幣(BTC)24小時成交量超過24.6億美元,FIS(FIS)24小時漲幅達5.46%

anue鉅亨網

〈大量科技展望〉Q2每股純益1.99元創12季新高 上半年EPS達3.01元

anue鉅亨網

特斯拉申請英國電力供應執照 大動作挑戰當地能源巨頭

商傳媒

特斯拉 FSD v14 九月登場!模型增 10 倍、駕駛注意力提示頻率更低

TESLAGURU

宇樹科技執行長王興興:人形機器人距離主流應用仍需 1~3 年

科技新報

大量Q2獲利年增5.8倍 下半年產能全滿

NOWNEWS今日新聞

近半收入付房貸 玉山金董座嘆:房價太高

NOWNEWS今日新聞

盤後速報 - 擎邦(6122)次交易(12)日除息3.27元,參考價46.93元

anue鉅亨網

盤後速報 - 彬台(3379)次交易(12)日除息0.8元,參考價74.1元

anue鉅亨網

盤後速報 - 全科(3209)次交易(12)日除息2.48元,參考價33.22元

anue鉅亨網

盤後速報 - 偉訓(3032)次交易(12)日除息2.73元,參考價111.77元

anue鉅亨網

盤後速報 - 台新金(2887)次交易(12)日除息0.9元,參考價15.65元

anue鉅亨網

盤後速報 - 元大金(2885)次交易(12)日除權0.3元,參考價32.23元

anue鉅亨網

盤後速報 - 巧新(1563)次交易(12)日除息2.27元,參考價49.13元

anue鉅亨網

盤後速報 - 來頡(6799)下週(8月18日)除息1.99元,預估參考價87.71元

anue鉅亨網

盤後速報 - 聚和(6509)下週(8月18日)除息1.32元,預估參考價31.13元

anue鉅亨網

盤後速報 - 康舒(6282)下週(8月18日)除息0.5元,預估參考價29.1元

anue鉅亨網

盤後速報 - 廣明(6188)下週(8月18日)除息1.5元,預估參考價92.9元

anue鉅亨網

盤後速報 - 合機(1618)下週(8月18日)除息1.5元,預估參考價47.8元

anue鉅亨網

台幣狂升無礙,神達Q2獲利再創新高,H1 EPS 2.34元,7月營收續強

財訊快報

熊本暴雨成災!當地政府建議居民撤離 台積電:日本營運未受影響

太報

【ETF籌碼日報】官股賣超0050,自營商賣超00982A達10億

CMoney