剛剛，Nano Banana 2 發布！便宜又大碗，體驗后我發現這些細節

2026-04-23 蘋果 meta 智能音箱 openai

文章圖片

【剛剛，Nano Banana 2 發布！便宜又大碗，體驗后我發現這些細節】

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

用 AI 生圖，總繞不開一道兩難題：要快，還是要好？
但速度與質量之間，未必是魚和熊掌不可兼得。就在剛剛， Google 正式發布了他們的新一代圖像生成模型：Nano Banana 2（Gemini 3.1 Flash Image）。
沒有太多顛覆世界的口號，它只是把更好的畫質和更懂人話的理解力，一起塞進了全新的底層架構里。就這一件事，卻讓 AI 生圖少了幾分「看運氣」的感覺，多了幾分真正能用的踏實。
官方博客地址：https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/

接入了整個互聯網，這次的 AI 真的懂你在說什么要說清楚這次的變化，得先回想一下三年前 AI 生圖有多難用。
你讓它畫「紅燒肉」，它可能老老實實給你畫一塊正在燃燒的肉；你讓它在海報上寫句中文，它往往會給你湊出一堆毫無意義的鬼畫符。缺乏對真實世界的常識，是第一代 AI 最容易讓人崩潰的地方。
現在的 Nano Banana 2 ，改變了不少。它和前代 Nano Banana Pro 一樣，接入了 Gemini 積累的龐大真實世界知識庫，還能結合網頁搜索的實時信息，用起來更像是一個見過世面、懂點常識的人。
最先感受到的變化，是它開始更好地理解空間和比例了。
提示詞：畫面中，【東方明珠廣播電視塔】被一只超級巨大、超級可愛的【貓】占據。周圍的建筑物看起來就像玩具模型一樣小，而【貓】則非常巨大。游戲背景設定在一個逼真的城市環境中。整體氛圍安靜、溫暖、舒緩、可愛。
在上面這個案例中， AI 精準地還原了上海的地標，并極其自然地處理了巨貓與微縮城市之間的光影和透視關系。
最直觀的改變，是它終于認字、也會寫字了。比如讓它畫一幅《楓橋夜泊》的水墨畫。畫面上方不僅端端正正地用書法寫出了「月落烏啼霜滿天」等全句，甚至連排版和水墨的意境都拿捏得比較準。
當然，也不是沒有瑕疵，仔細看上方悄悄多出了一個「滿」字。
除了詩意，它還能處理相當復雜的 UI 場景——在下面這張圖里，復雜的半透明數據面板、懸浮的購物清單、精準的中文顯示，被 AI 有條不紊地安排得井井有條，信息之間的層級關系也真正理清楚了。
提示詞：第一人稱視角，置身于燈光明亮的超市貨架通道中。人類雙手將一瓶芬達汽水舉到鏡頭前方。鮮艷的橙色飲料裝在其標志性的品牌瓶身里，周圍環繞著多層全息增強現實界面，用中文展示營養相關數據，包括熱量數值、含糖量、咖啡因水平、新鮮度指示、保質/到期日期，以及基于芬達推薦的清爽飲品配方和雞尾酒調制方案。玻璃質感的 UI 面板，柔和的環境光暈，逼真的光照與陰影，自然的景深效果，沉浸式第一人稱交互界面， 2K
排版極其講究的雙頁黑白日式漫畫，也是手拿把掐。
提示詞：設計一份逼真的雙頁漫畫雜志樣張。每一頁都應包含多個漫畫風格分鏡，以富有動感的版式排列，呈現出專業印刷的日本漫畫質感。整體風格為黑白稿，使用粗獷有力的墨線、網點效果（screen tones）以及富有表現力的人物繪制。畫面中加入對白氣泡、中文擬聲詞，并通過分鏡之間的過渡來傳達動作、情緒與節奏。左右兩頁需要連貫銜接，像同一場景或同一話章節的一部分。采用傳統漫畫鏡頭語言：特寫、遠景、斜向分鏡以及戲劇化的視角與構圖。整體觀感要真實可信，仿佛來自一本真正的漫畫雜志的跨頁內容。
或者這張帶步驟說明的「功夫茶」中文信息圖，從排版到意境，都給出了一套可以直接用的視覺方案。
生成提示詞：一張關于中國傳統功夫茶道設計精美的垂直信息圖。中國傳統水墨畫背景。頂部有巨大的、優雅的中文書法標題，明確寫著「功夫茶」。向下有三個圖文并茂的步驟：步驟 1 展示用沸水溫杯，配有中文「溫杯」；步驟 2 展示將茶葉放入蓋碗，配有中文「投茶」；步驟 3 展示倒出茶湯，配有中文「出湯」。優雅、極簡、溫暖的大地色調，平衡的布局。
一位很早就接觸到 Nano Banana 2 的內測用戶，給出了一個相當中肯的評價：「它并不完美，但它是第一個能夠以一定一致性，去處理真正復雜圖像和圖表的模型。」
為了測試這個新模型的理解極限，他隨手甩出了一道極其刁鉆的測試題：「給我畫一張設定在古威尼斯的《尋找沃爾多（Where’s Waldo）》，但里面要找的不能是人，得是一只穿著藍色條紋飛行服的水獺。」
Nano Banana 2 最終也真的理清了邏輯，不僅沒畫串，還穩穩地交出了答卷。

快和好，終于不用二選一了？除了懂常識，強大的「主體一致性」是這次 Nano Banana 2 更新的另一大殺手锏。
在一次生成過程中，它最多能保持 5 個角色的臉不崩，或者 14 個物品的樣子不變。這意味著，你可以放心大膽地拿它來畫連載漫畫或者做影視分鏡了。
不僅如此，它的畫質也達到了可以直接干活的標準。
從 512px 的配圖到 4K 級別的超高清海報，它都能拿捏。輸入一段關于「重慶老火鍋」的提示詞，它能生成一張賽博朋克風的雨夜街景，濕漉漉的柏油路上，紅藍霓虹燈的倒影和「24 小時營業」的招牌都細致入微。
提示詞：一張繁忙亞洲城市雨夜的電影感街頭照片。一個巨大的、發光的紅色霓虹燈牌掛在一座老建筑上，上面清晰地寫著「重慶老火鍋」。在它下面，一個較小的藍色霓虹燈牌寫著「24 小時營業 – 歡迎光臨」。濕漉漉的柏油路反射著霓虹燈光。
色彩張力極強的波普藝術風格，它也駕馭得住。
或者是這種帶著幾分荒誕、又透著高級感的時尚大片：
提示詞：This high-resolution bird’s-eye view photograph was taken with a LOMO Ic-a. The ground is covered with countless black-and-white billboard advertisements of beautiful fashion models and standing on top of the advertisements is an incredibly beautiful chinese film actress wearing a long black coat.
在這個俯視視角的案例中， AI 極好地模擬了老式 LOMO 相機的特殊質感。女演員孑然獨立于鋪滿黑白海報的地面上，畫面的電影張力和故事感呼之欲出。
不過也不是沒有明顯短板，讓它將二次元人物、鉛筆素描和黏土人強行塞進同一個真實咖啡館的場景中，素描人物的融入就顯得十分生硬，邊緣過渡也不夠自然。
顯然，在跨維度融合上，它遠不及前代模型效果來得自然，還有進步的空間。
提示詞：A photo of an everyday scene at a busy cafe serving breakfast. In the foreground is an anime man with blue hair one of the people is a pencil sketch another is a claymation person
其實整體體驗下來，盡管官方博客將 Nano Banana 2（Gemini 3.1 Flash Image）吹的天花亂墜，但實際體感中，生成的質量效果和速度并未得到肉眼可見的提升，甚至在部分場景中還不及前代模型。
真正讓 Nano Banana 2 站穩腳跟的，其實是它極其接地氣的性價比。
今天起，在 Gemini 應用和 Google 搜索框里，你都能順手用上它。沒有訂閱方案的普通用戶， 24 小時內也能白嫖 100 張；而 Pro 訂閱用戶的額度則高達 1000 張。
對于開發者而言， API 的價格更是直接腰斬，僅為上一代 Pro 模型的一半。折算下來，生成一張 4K 高清圖的成本被硬生生打到了 0.15 美元左右。
附上地址：https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview
當然，當 AI 能夠以極低的成本、極快的速度批量生產高清圖片時，大家心里其實越沒底。現在網上的假圖滿天飛，「眼見為實」這句話早就靠不住了。如果任何人都能在一秒鐘內生成一張幾可亂真的照片，我們該如何分辨圖片？
Google 自己也十分清楚這一點，所以他們也一并升級了防偽技術。 Nano Banana 2 繼續加深了對 SynthID 數字水印和 C2PA 內容憑證的支持，能夠更清楚地看到一張圖到底是不是 AI 畫的，以及它是怎么被修改的。
據統計，自去年 11 月以來， Gemini 里的這個驗證功能已經被調用了超過 2000 萬次。
AI 繪圖這兩年的發展，確實快得讓人眼花繚亂。我們經歷過 Nano Banana Pro 的一眼驚艷，也經歷過繁瑣的調教與漫長的等待。 Nano Banana 2 的出現，則嘗試進一步把好和快揉在了一起，并大大降低了使用的門檻。
你腦子里的一個靈感，不用再經過反復的修改和焦躁的等待。敲下回車的瞬間，它就在那里了。自然、簡單，且立等可取，這件事聽起來平常，但能做到，其實已經很難得了。
#歡迎關注愛范兒官方微信公眾號：愛范兒（微信號：ifanr），更多精彩內容第一時間為您奉上。
愛范兒|原文鏈接· ·新浪微博

推薦閱讀

上一篇：同樣是256GB容量，為什么電腦縮水，手機不縮水？

下一篇：手機漲價已成定局！今年換機要加預算，這4款還算良心