請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

「博士級AI」GPT-5重磅登場!從炒夢轉向解決問題 引領AI回歸技術本質

anue鉅亨網

更新於 2小時前 • 發布於 2小時前
圖:Pixabay/Unsplash/Pexel

GPT-5 的發布無疑是今年 AI 領域的重磅新聞,一經推出便在多項基準測試中稱霸,展現出其在文字、程式設計、數學等方面的頂尖實力。然而,發布會後,用戶社群的反應卻出乎意料地複雜,一場關於「博士級別」承諾與「平庸」現實的激辯悄然展開。

●技術亮點:AI「按需思考」的時代來臨
PT-5 的核心技術突破在於其「按需思考」的能力。它能根據任務難度,自行判斷是否需要進行深度思考,避免了不必要的「過度思考」,大大提升了效率。這一功能在現場演示中表現得淋漓盡致:當被要求解釋簡單的伯努利現象時,模型能快速給出答案;但當需要生成一個動態 SVG 圖來進一步解釋該現象時,它會自動進入深度思考模式,創造出一個可互動的演示,讓學習變得更加生動。

OpenAI 的 CEO Sam Altman 在發布會上豪言,GPT-5 的智能已達「博士級」,與其對話如同與一位在任何領域都擁有博士學位的專家溝通。這不僅體現在其強大的推理能力上,更體現在其「為你做事」的實用性。例如,它能根據你的提示,自動規劃日常行程、發送邀請函、採購生活物資等。

GPT-5 也整合了多種模態能力,特別是在程式設計方面表現突出。它能夠在短短兩分鐘內生成一個帶有標籤、抽認卡和遊戲的法語學習應用,並被明星 AI 編程企業 Cursor 的創辦人 Michael Truell 盛讚,稱其解決複雜編程問題的速度比人類快很多。此外,模型改進的語音功能,使其與人類對話時更顯自然,並能透過引導式教學模式,在教育領域發揮巨大潛力。

基準測試:事實性錯誤減少 80%,性能全面領先

OpenAI 提供的數據顯示,GPT-5 在多項關鍵基準測試中取得了業界領先的成績。

基準測試項目 GPT-5 成績 GPT-4o 成績 SWE-bench (程式設計) 74.9% 69.1% FActScore (事實準確性) 錯誤率極低,表現接近完美 錯誤率相對較高 OpenAI-MRCR (長背景資訊) 表現優異,能有效處理長篇內容 表現較弱 τ2-bench telecom (智能體任務) 96.7% 表現較弱

值得注意的是,GPT-5-pro 版本更是專為專業用戶打造,它透過名為「並行測試時計算」的技術,能夠同時進行多項推理,提供更為全面、高質量的答案。在一個包含 1000 個實際測試的評估中,67.8% 的外部專家更偏好 GPT-5-pro 的回答,且其重大錯誤率降低了 22%,這使得它在健康、科學、數學和程式設計等高要求領域表現尤為出色。

此外,GPT-5 也解決了 GPT 系列模型「阿諛奉承」的問題,透過「安全完成」訓練形式,減少了不必要的過度拒絕,並降低了無意義的表情符號和過度討好的回應。

用戶情緒:期望落差與「炒作過度」的反思

儘管技術數據亮眼,但用戶社群的反應卻呈現出另一番景象。一項對 1500 多條用戶評論的分析顯示,情緒詞彙佔據了 40% 的討論,遠超技術討論的 35%,其中「平庸無奇」、「期望落差」成為最高頻的負面詞彙。

這種期望與現實的鴻溝並非空穴來風。發布會上,OpenAI 的多處「圖表錯誤」成為了用戶質疑的導火索。在展示基準測試結果的柱狀圖中,數值與長條圖的高度明顯不符,這種低級的資料視覺化錯誤,讓用戶對一個以精準性著稱的 AI 公司產生了信任危機。

此外,儘管 OpenAI 承諾 GPT-5 已達「博士級」智能,但「幻覺問題」依然是高頻討論詞彙。有用戶指出,在現場演示中,GPT-5 對伯努利效應的解釋包含了一個經典的物理學謬誤,這與「博士級」所應具備的嚴謹邏輯和準確知識相悖。

這些反饋反映出 AI 產業一個更深層次的問題:科技發展的邊際遞減與行銷造勢的指數成長形成了巨大反差。AI 的發展似乎正在從「指數成長」的黃金時代,轉向「漸進優化」的精細化時代。

產業轉折點:從「講故事」到「解決問題」

GPT-5 的發布標誌著 AI 產業進入了一個新的轉折點。用戶越來越理性,不再輕易被宏大的 AGI 願景所吸引,而是更加關注技術能否真正解決實際問題。

OpenAI 首次向免費用戶開放 GPT-5,這既是面對日益激烈的市場競爭的策略,也是為了獲取更大的用戶基礎來持續優化模型。同時,GPT-5-pro 的出現,也顯示出 OpenAI 開始走向產品分級化,以滿足不同用戶群體的精準需求。

在這個過程中,真正有價值的創新將不再是模型參數的簡單擴大,而是對可靠性、準確性和實用性的持續提升。AI 產業正從概念炒作回歸技術本質,從未來想像轉向現實應用,這或許正是產業走向成熟的標誌。

更多鉅亨報導
GPT-5來了!OpenAI強化推理能力 會寫App、懂健康、還能扮專家
OpenAI預告8日凌晨發布GPT-5 輕量版模型可望同步亮相

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

小心變國有產!新北未辦繼承不動產8月起列管 最高價3.5億「在這裡」

好房網
02

川普對晶片課100%關稅 這家台灣大廠宣布:將全數轉嫁客戶

中廣新聞網
03

獨家/傳台積電祭史上最重「五連坐」懲處!層級到副總 公司說話了

三立新聞網
04

稀土試煉1/台鏈震動中!這2家千億科技巨頭接連示警 和碩技術長一語點破痛點

CTWANT
05

聽取半導體關稅建議 美商長證實川普公布前「先見黃仁勳」

鏡新聞
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

被川普要求「利益衝突」辭職,英特爾CEO陳立武「給員工的一封信」全文曝光

數位時代

批Google新功能搶網路流量!全球媒體集體點擊下滑

TVBS

〈原相法說〉遊戲機等兩大業務帶動 Q3美元營收估微增

anue鉅亨網

財政部因應暫時性稅率20% 提6措施緩解衝擊力

5168實價登錄比價王

盤中速報 - Omni Network大跌9.43%,報4.61美元

anue鉅亨網

盤中速報 - Aptos大漲8.44%,報4.64美元

anue鉅亨網

慶豐富H1本業獲利寫同期高點,Q4擴產、併購並行,H2營運更優

財訊快報

黃金大亂鬥?美對1公斤金條課關稅 打擊「這國」煉金業+推高金價

CTWANT

三大法人賣超台股36.63億元

中央通訊社

超人力霸王入隊Teammoto! Motorola攜ULTRAMAN展開宇宙級聯名

Zeek玩家誌

台新新光金控參展高齡健康產業博覽會(圖)

中央通訊社

防禦力高、波動低 短債ETF受寵 今年至今受益人增逾4.6萬人

新頭殼

2025高齡健康產業博覽會 台新新光金「用喝一杯咖啡的時間」啟動智慧理財新體驗

anue鉅亨網

〈尖點法說〉Q2毛利率29.44%創11季來新高 上半年EPS 0.91元

anue鉅亨網

「小台積電」0052啟動分割 預估1拆5一張入手價只要4萬元

anue鉅亨網

客戶拉貨不敵台幣升值 光隆上半年每股賺1元年減6成

中央通訊社

響應政府泡水車補助 Honda Taiwan啟動關懷專案水災泡水車換購Honda全車系加贈3萬購車支援金

SiCAR愛車酷

台新新光金控參與高齡健康產業博覽會(圖)

中央通訊社

台積電7月營收年增近26% AI晶片需求持續推升成長動能

商傳媒

和泰集團「LEXUS SKILL BUILDING技術人才培育計畫」連續四年舉辦交流研討 共創產學價值

SiCAR愛車酷

國際貓咪日 寶島眼鏡為挺浪浪 惡搞自家社群

商傳媒

滿足樂齡族需求 中信銀展示友善ATM(圖)

中央通訊社

神操盤!「巨型韭菜」趁天價賣台積電、鴻海 爽賺3634萬

三立新聞網

客戶提前拉貨影響 三集瑞7月營收略減

工商時報

雙北3社宅即日起受理申請 最低租金市價3折

自由電子報

金管會要求銀行設單一窗口處理房貸爭議 積極協助首購、自住、已承諾案件 不應逕行拒貸 

太報

賴清德:高齡商機達3.6兆元 打造三大健康支柱讓國人更健康

anue鉅亨網

台股8日險守24K大關 台積電創高拉回收1175元

CTWANT

福八首顆衛星通過運送前審查 估第4季升空

中央通訊社

盤中2次跳水!台股收盤24,021點 守住成長

NOWNEWS今日新聞

剛投保完就罹癌 保險還能理賠嗎?關鍵藏在「這條款」!

CMoney

台積電懲2奈米內鬼! 史上最慘「5級連坐到他」

中廣新聞網

宏佳騰父親節油電優惠, STR 系列最高現折一萬五千元!

2GameSome

大換血!MSCI中國指數新增14檔新貴 港股科技與創新藥成最大贏家

anue鉅亨網

創帳 7 天漲粉 2.4 萬!華元小編如何靠一句「蚵仔煎洋芋片」經營 Threads?

經理人月刊

台積電7月營收3231億元!月增22.5% 創歷年同期新高

中廣新聞網

台積電豁免就安了? 《彭博社》經濟學家:直接輸美掉34% 對GDP衝擊2.5%

信傳媒

連虧三季 富采:本季需求趨近上季

工商時報

宏佳騰父親節油電優惠, STR系列最高現折一萬五千元!

Go Choice購車趣

搶攻樂齡商機!國泰金攜五大子公司打造「健康照護」與「財務保障」雙引擎

太報