Google 發表免費開源 AI 代理 Gemini CLI,和其他 AI 寫程式工具差在哪?
AI 寫程式的風潮持續升溫,這股「Vibe coding」趨勢正吹向更貼近開發者實務操作的場域——命令列介面。Google 宣布推出開源 AI 代理工具 Gemini CLI,將 Gemini 模型帶進終端機,甚至整合 Gemini Code Assist,成為一款多功能的本地端應用程式。
對許多開發人員來說,命令列是控制系統及應用程式的關鍵介面。傳統上,使用命令列需記憶複雜的程式語言、避免拼寫錯誤等問題,如今 Gemini CLI 可讓使用者直接以自然語言和電腦溝通,例如解釋看不懂的程式碼、撰寫新功能或偵錯等。
目前,Google 已推出一系列 AI 寫程式工具,包含 Gemini Code Assistant 以及 Jules,而 Gemini CLI 將直接與同類產品如 OpenAI 的 Codex CLI、Anthropic 的 Claude Code 競爭。命令列 AI 工具相較其他工具整合性高、反應速度快,那麼 Google 認為 Gemini CLI 的關鍵優勢是什麼?
開源且免費
Gemini CLI 採用 Gemini 2.5 Pro 推理模型,只需登入個人 Google 帳戶就能免費使用,支援高達 100 萬 token 的上下文視窗、每分鐘 60 個模型請求、每天 1,000 個請求。
Google 產品資深總監 Ryan J. Salva 在新聞發布會上表示,他們不希望開發者像看計程車跳錶一樣盯著 token,而是能沒有阻礙地創造。Google 資深軟體工程師 Taylor Mullen 也認為,Gemini CLI 相較其他須付費工具,將更有機會被廣泛採用。
此外,Google CLI 根據 Apache 2.0 授權開源,所有程式碼可供公開檢視。Salva 表示,這代表開發者、安全團隊和研究人員都可以審核每一行程式碼,了解該工具的運作方式,使用者也能完全掌控資料存取權限。
不只會寫程式
Google 表示,Gemini Code Assist 是 Google 為學生、業餘愛好者和專業開發者打造的 AI 程式設計助理,現在與 Gemini CLI 共享相同的技術,無論是在終端機還是程式碼編輯器(IDE)中,使用者都可以存取相同的工具和功能。其功能包括根據複雜提示生成程式碼、撰寫測試、除錯、建構新功能甚至遷移程式碼,並能自動規劃多步驟任務、從錯誤中恢復。
談及與其他 AI 寫程式工具的不同之處,Google 指出 Gemini CLI 不僅侷限於程式開發,也能協助理解大型代碼庫、執行自動化工作、整理筆記、進行技術研究,甚至產出多媒體內容。
實現可擴展性
Google 強調其 Gemini CLI 產品在設計之初就將可擴展性(extensibility)列為首要考量,支援如 Model Context Protocol(MCP)、GEMINI.md 系統提示檔,以及個人與團隊層級的設定,賦予使用者最大程度的自主權和客製化能力。
在新聞發布會上,Google 展示了 Gemini CLI 透過連接到 Veo、Imagen、Chirp 和 Lia 等多媒體模型,製作出貓咪在澳洲探險的影片。
整體而言,Google 表示 Gemini CLI 的設計目標是成為一個「瑞士刀」般的多功能工具。
*本文開放合作夥伴轉載,首圖來源:Google 提供。
留言 0