Nano Banana實測|AI生圖神器怎麼用?修圖、合成、多輪修改,一句提示就搞定?
Nano Banana(奈米香蕉)是 Google 最新推出的圖像生成與編輯模型,正式名稱為 Gemini 2.5 Flash Image。它的主要特色是能夠在多次編輯後,維持人物或物件的外觀一致性,並支援多張圖片融合、局部編輯,以及自然語言指令操作。
簡單來說,Nano Banana 讓用戶可以用自己的照片,快速更換背景、衣服、髮型,或將多張圖片合成一張,且不需寫程式,只要用文字描述需求即可。《數位時代》本次將透過4大題來實測Nano Banana的生圖實力。
如何使用 Nano Banana?
一般用戶可以透過以下3種方式使用Nano Banana:
1.Google Gemini 應用程式
◦ 開啟 Gemini,選擇「2.5 Flash」模型,進入圖像功能。
◦ 上傳照片,輸入自然語言指令(如「換背景為海邊」、「衣服改成藍色」),即可生成新圖像。
2.Google AI Studio
◦ 前往 Google AI Studio。
◦ 在模型選擇中選擇「Gemini 2.5 Flash Image Preview」(Nano Banana)。
◦ 上傳圖片,輸入提示詞(Prompt),如「將角色變成 1/7 比例的公仔,放在電腦桌上」等,即可生成目標圖片。
3.LMArena 網站
◦ 進入 LMArena。
◦ 在Direct Chat模式下點擊Generate Images,並選擇gemini-2.5-flash模型。
◦ 上傳照片並輸入指令,即可體驗 Nano Banana 生成效果。
實測Nano Banana:Google殺手鐧有多猛?
測試一:圖片優化
1.上傳模糊原圖,並請AI「銳利化」。
2.請AI將圖片的彩度及明暗對比提高。
測試二:人像一致性
1.將所有人物衣著改成「打赤膊穿泳褲」,背景換到沙灘。
2.將4位角色換穿夏威夷衫。
3.讓每一位角色都手拿mojito調酒。
4.加墨鏡於頭頂。
5.背景改室內咖啡館、左側打光。
6.加入背景人物:在吧台的咖啡師,以及在窗邊面向窗戶,正在喝咖啡的顧客。
測試三:多圖合成
1.人像+商品圖插入(請圖內人物自然握持球棒)。
2.請調整成全身照,並加入地面真實接觸陰影
3.加入參考動作調整角色
4.消除多餘的線
5.將角色置入指定背景
測試四:物理與文字細節
1.將人物置入背景,並添加素材「夜雨街景」,要求濕地反射。
2.加入奢華飾品,色調更黑暗,並強調燈光照射在人物上的明暗效果。
3.在圖片右下角加入字樣。
結論:堪用可靠!指令明確就能準確生成
總結這次四項測試,Nano Banana在一致性、真實感、可控性,以及生成效率上都有不錯的表現。原則上,只要提示明確,並提供適切的素材,Gemini就能輸出可靠的結果。
但要注意的是,圖片中若有複數以上的人物或角色,在替換衣著、指定物品等細部調整上仍有限制,即使在可以重複編輯指令的情況下,還是會有無法順利調整的情況。
此外,Nano Banana在生成繁體中文上仍能力不足,會有變成畸形字體的可能。
但可以想像,Nano Banana已經可以可將商品、人物、場景合成,模擬商品在不同環境下的擺放效果。例如:家電、家具、服飾、配件等,應對電商或小型業者的宣傳需求很有幫助。
此外,由支援多輪精細編輯,能快速生成多版本廣告素材、YouTube 縮圖、社群貼文圖、員工識別證、交易卡等,並可根據需求調整細節,提升設計流程效率。
目前,Nano Banana除了文章前段提及的3種平台,也已整合進Adobe Firefly、Adobe Express 等主流平台,並支援 API 付費串接,預期將推動更多第三方應用、工具、平台的創新。
延伸閱讀:生態系戰爭開打!拆解谷歌「Nano Banana」的戰略意義:廣告投放遲早全面AI化,OpenAI如何求生?
Google推出Gemini 2.5 Flash Image!AI修圖不再「走鐘」,還支援多圖融合:5大亮點一次看
資料來源:Google
本文初稿為AI編撰,整理.編輯/ 李先泰
延伸閱讀
25億Gmail帳戶個資外洩?Google證實「系統遭駭」:萬年懶人密碼怎麼改?如何啟用Passkey?
MAGA後遺症!川普關稅新政存隱形危機:沒有最貴只有更貴,美國物價為何必將起飛?
「加入《數位時代》LINE好友,科技新聞不漏接」