Vibe Coding首選AI模型是它!Claude為何最會寫程式?官方透露3大關鍵
「寫程式」被認為是生成式AI技術最具潛力的應用面向,讓以往高門檻的軟體開發變成更為親民,人人都能是工程師。然而,擁有最強大寫程式能力的AI模型不是來自OpenAI或Google,而是Anthropic旗下的Claude系列模型。
去年6月,Claude都端出Claude Sonnet 3.5模型震撼了AI業界,這款AI模型在編寫程式上有著領先眾多競爭對手的能力。網路上不乏工程師社群盛讚Claude寫程式的優異性能,創業加速器Y Combinator旗下科技社群Hacker News上便有眾多工程師表示,新模型的程式能力比OpenAI的模型更強大,並且更加符合使用需求。
且讓人訝異的是,一年多過去Anthropic的Claude模型在程式能力上然保持領先,包括最新推出的Claude 4系列模型。AI領域瞬息萬變、每天都可能有新發現,Claude能夠維持如此長時間的領導地位,更顯其難得。
馬斯克旗下AI新創xAI也被揭露明確以Claude為標竿,希望Grok能成為勝過Claude 3.7 Sonnet的AI程式工具。
如今,Claude已被認為是首選的Vibe Coding模型,支援了Cursor、Augment和微軟的GitHub Copilot等眾多AI程式工具,甚至連Meta都運用Anthropic的模型來支援內部的程式工具Devmate。
延伸閱讀:Vibe Coding是什麼?不寫程式碼也能開發產品,3款好用AI工具+6步驟教學一次看
面對OpenAI、Google兩大巨頭,Anthropic究竟如何在程式能力取得領先?外媒《Business Insider》近期就透過訪問Anthropic高層以及外部專家,探究Claude是怎麼訓練出來的。
Claude寫程式為何這麼強?
關鍵一:RLAIF學習技術,讓AI抓AI的不完美
Anthropic的成功核心之一,在於獨特的強化學習技術「 基於AI回饋的強化學習 」(Reinforcement Learning from AI Feedback,RLAIF)。
RLAIF的基本原理是使用AI系統來提供反饋,而不是完全依賴人類反饋來訓練語言模型。且為了讓RLAIF自動化發揮效果,Anthorpic編寫了一系列原則讓模型遵守,他們稱之為「合憲AI」(Constitutional AI)。
根據Anthropic共同創辦人班.曼恩(Ben Mann)的說法,具體操作方式為:
隨機選擇一個問題,讓模型寫出答案,之後讓模型根據其中一條原則評量自己的答案;若不符合原則,就讓模型進行修正。
以寫程式來說,這條原則可能是「答案是否真正提供最終解答?」或者「答案中有沒有做了使用者沒要求的事」、「這段程式碼有辦法維護嗎?」
延伸閱讀:AI一出,新聞白忙!盤點AI摘要4大衝擊:點擊率腰斬,只有兩種網頁賺到流量
關鍵二:加強使用工具能力,Sonnet 3.5甚至可以自己寫程式抓資料
使用工具的能力,也是Claude勝過其他AI模型的一項優勢。
Anthropic特地訓練Sonnet 3.5,使其能夠更好地使用工具,與其他數位工具互動解決複雜任務。
Anthropic透過訓練模型使用工具的能力,試圖將Claude轉變為更通用的AI代理,他們稱之為「虛擬合作者」(virtual collaborators)。
也因此,Anthropic的模型能夠自行編寫程式碼來使用各種工具,好比說當你要求Claude提供天氣資訊或股票價格時,它可以編寫程式來利用API存取資料。
關鍵三:訓練AI超強記憶力、判斷關鍵重要細節
另外,大型的軟體開發專案往往曠日費時,可能需要幾天、甚至數周的時間才能完成,Anthropic還訓練Claude擁有長時間遵循人類複雜指令的能力。這代表即使Claude在寫程式時遇上困難,他也更能遵循使用者提供的建議、理解人類的意圖,繼續執行任務。
Anthropic還訓練模型擁有更精準的記憶能力。在一項軟體專案執行時,常常包括大量程式碼、修改紀錄、文件等龐大資料,Anthropic訓練AI模型可以 建立便條紙 ,當其探索程式碼庫時,也會同步在外部系統中做筆記。
Claude也被訓練懂得如何判斷程式項目的關鍵細節,並忽略不太重要的內容。妥善運用記憶能力,使得Claude在整個專案過程中多建議修改程式碼,這是其他模型不太擅長的。
延伸閱讀:輝達推免費線上課!AI、機器人模擬都能學:8門DLI課程介紹、報名連結一次看
運用終端數據訓練,培養程式能力
AI模型的進步,往往離不開大量的數據,而數據可能也是Anthropic在程式方面領先的一項優勢。使用Anthropic模型的AI程式工具公司Zencoder執行長安德魯.菲萊夫(Andrew Filev)推測,Anthropic可能利用了開發者在終端輸入及輸出的數據來訓練AI。
今年5月,Anthropic還推出了Claude Code AI程式工具,這使得他們從原先扮演AI程式工具基石的角色,直接進軍了AI程式工具市場。這讓Anthropic能夠與開發者建立更直接的連結,並能夠獲取更大量人類如何編寫程式的資料。
班.曼恩也坦承,「如果我們沒有與程式用戶直接聯繫,我們的學習資料量與速度都會大打折扣,因此Claude Code對我們非常重要,它能幫助我們進一步了解人們需求、如何改良模型、推出更先進的技術。」
延伸閱讀:Anthropic公開5個AI指令技巧:ChatGPT、Claude都適用!怎麼寫超有效?哪種下法不OK?
資料來源:Business Insider、Anthropic
延伸閱讀
微軟明明業績很好,為什麼裁員不手軟?一封給員工的信透露科技巨頭策略
ChatGPT躍升全球第5大網站!但這6種問題千萬別問AI,小心資料外洩還違法
「加入《數位時代》LINE好友,科技新聞不漏接」
留言 0