剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

【剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節】剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片

剛剛,Nano Banana 2 發布!便宜又大碗,體驗后我發現這些細節

文章圖片


用 AI 生圖 , 總繞不開一道兩難題:要快 , 還是要好?
但速度與質量之間 , 未必是魚和熊掌不可兼得 。 就在剛剛 , Google 正式發布了他們的新一代圖像生成模型:Nano Banana 2(Gemini 3.1 Flash Image) 。
沒有太多顛覆世界的口號 , 它只是把更好的畫質和更懂人話的理解力 , 一起塞進了全新的底層架構里 。 就這一件事 , 卻讓 AI 生圖少了幾分「看運氣」的感覺 , 多了幾分真正能用的踏實 。
官方博客地址:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/

接入了整個互聯網 , 這次的 AI 真的懂你在說什么要說清楚這次的變化 , 得先回想一下三年前 AI 生圖有多難用 。
你讓它畫「紅燒肉」 , 它可能老老實實給你畫一塊正在燃燒的肉;你讓它在海報上寫句中文 , 它往往會給你湊出一堆毫無意義的鬼畫符 。 缺乏對真實世界的常識 , 是第一代 AI 最容易讓人崩潰的地方 。
現在的 Nano Banana 2 , 改變了不少 。 它和前代 Nano Banana Pro 一樣 , 接入了 Gemini 積累的龐大真實世界知識庫 , 還能結合網頁搜索的實時信息 , 用起來更像是一個見過世面、懂點常識的人 。
最先感受到的變化 , 是它開始更好地理解空間和比例了 。
提示詞:畫面中 , 【東方明珠廣播電視塔】被一只超級巨大、超級可愛的【貓】占據 。 周圍的建筑物看起來就像玩具模型一樣小 , 而【貓】則非常巨大 。 游戲背景設定在一個逼真的城市環境中 。 整體氛圍安靜、溫暖、舒緩、可愛 。
在上面這個案例中 , AI 精準地還原了上海的地標 , 并極其自然地處理了巨貓與微縮城市之間的光影和透視關系 。
最直觀的改變 , 是它終于認字、也會寫字了 。 比如讓它畫一幅《楓橋夜泊》的水墨畫 。 畫面上方不僅端端正正地用書法寫出了「月落烏啼霜滿天」等全句 , 甚至連排版和水墨的意境都拿捏得比較準 。
當然 , 也不是沒有瑕疵 , 仔細看上方悄悄多出了一個「滿」字 。
除了詩意 , 它還能處理相當復雜的 UI 場景——在下面這張圖里 , 復雜的半透明數據面板、懸浮的購物清單、精準的中文顯示 , 被 AI 有條不紊地安排得井井有條 , 信息之間的層級關系也真正理清楚了 。
提示詞:第一人稱視角 , 置身于燈光明亮的超市貨架通道中 。 人類雙手將一瓶芬達汽水舉到鏡頭前方 。 鮮艷的橙色飲料裝在其標志性的品牌瓶身里 , 周圍環繞著多層全息增強現實界面 , 用中文展示營養相關數據 , 包括熱量數值、含糖量、咖啡因水平、新鮮度指示、保質/到期日期 , 以及基于芬達推薦的清爽飲品配方和雞尾酒調制方案 。 玻璃質感的 UI 面板 , 柔和的環境光暈 , 逼真的光照與陰影 , 自然的景深效果 , 沉浸式第一人稱交互界面 , 2K
排版極其講究的雙頁黑白日式漫畫 , 也是手拿把掐 。
提示詞:設計一份逼真的雙頁漫畫雜志樣張 。 每一頁都應包含多個漫畫風格分鏡 , 以富有動感的版式排列 , 呈現出專業印刷的日本漫畫質感 。 整體風格為黑白稿 , 使用粗獷有力的墨線、網點效果(screen tones)以及富有表現力的人物繪制 。 畫面中加入對白氣泡、中文擬聲詞 , 并通過分鏡之間的過渡來傳達動作、情緒與節奏 。 左右兩頁需要連貫銜接 , 像同一場景或同一話章節的一部分 。 采用傳統漫畫鏡頭語言:特寫、遠景、斜向分鏡以及戲劇化的視角與構圖 。 整體觀感要真實可信 , 仿佛來自一本真正的漫畫雜志的跨頁內容 。
或者這張帶步驟說明的「功夫茶」中文信息圖 , 從排版到意境 , 都給出了一套可以直接用的視覺方案 。
生成提示詞:一張關于中國傳統功夫茶道設計精美的垂直信息圖 。 中國傳統水墨畫背景 。 頂部有巨大的、優雅的中文書法標題 , 明確寫著「功夫茶」 。 向下有三個圖文并茂的步驟:步驟 1 展示用沸水溫杯 , 配有中文「溫杯」;步驟 2 展示將茶葉放入蓋碗 , 配有中文「投茶」;步驟 3 展示倒出茶湯 , 配有中文「出湯」 。 優雅、極簡、溫暖的大地色調 , 平衡的布局 。
一位很早就接觸到 Nano Banana 2 的內測用戶 , 給出了一個相當中肯的評價:「它并不完美 , 但它是第一個能夠以一定一致性 , 去處理真正復雜圖像和圖表的模型 。 」
為了測試這個新模型的理解極限 , 他隨手甩出了一道極其刁鉆的測試題:「給我畫一張設定在古威尼斯的《尋找沃爾多(Where’s Waldo)》 , 但里面要找的不能是人 , 得是一只穿著藍色條紋飛行服的水獺 。 」
Nano Banana 2 最終也真的理清了邏輯 , 不僅沒畫串 , 還穩穩地交出了答卷 。

快和好 , 終于不用二選一了?除了懂常識 , 強大的「主體一致性」是這次 Nano Banana 2 更新的另一大殺手锏 。
在一次生成過程中 , 它最多能保持 5 個角色的臉不崩 , 或者 14 個物品的樣子不變 。 這意味著 , 你可以放心大膽地拿它來畫連載漫畫或者做影視分鏡了 。
不僅如此 , 它的畫質也達到了可以直接干活的標準 。
從 512px 的配圖到 4K 級別的超高清海報 , 它都能拿捏 。 輸入一段關于「重慶老火鍋」的提示詞 , 它能生成一張賽博朋克風的雨夜街景 , 濕漉漉的柏油路上 , 紅藍霓虹燈的倒影和「24 小時營業」的招牌都細致入微 。
提示詞:一張繁忙亞洲城市雨夜的電影感街頭照片 。 一個巨大的、發光的紅色霓虹燈牌掛在一座老建筑上 , 上面清晰地寫著「重慶老火鍋」 。 在它下面 , 一個較小的藍色霓虹燈牌寫著「24 小時營業 – 歡迎光臨」 。 濕漉漉的柏油路反射著霓虹燈光 。
色彩張力極強的波普藝術風格 , 它也駕馭得住 。
或者是這種帶著幾分荒誕、又透著高級感的時尚大片:
提示詞:This high-resolution bird’s-eye view photograph was taken with a LOMO Ic-a. The ground is covered with countless black-and-white billboard advertisements of beautiful fashion models and standing on top of the advertisements is an incredibly beautiful chinese film actress wearing a long black coat.
在這個俯視視角的案例中 , AI 極好地模擬了老式 LOMO 相機的特殊質感 。 女演員孑然獨立于鋪滿黑白海報的地面上 , 畫面的電影張力和故事感呼之欲出 。
不過也不是沒有明顯短板 , 讓它將二次元人物、鉛筆素描和黏土人強行塞進同一個真實咖啡館的場景中 , 素描人物的融入就顯得十分生硬 , 邊緣過渡也不夠自然 。
顯然 , 在跨維度融合上 , 它遠不及前代模型效果來得自然 , 還有進步的空間 。
提示詞:A photo of an everyday scene at a busy cafe serving breakfast. In the foreground is an anime man with blue hair one of the people is a pencil sketch another is a claymation person
其實整體體驗下來 , 盡管官方博客將 Nano Banana 2(Gemini 3.1 Flash Image)吹的天花亂墜 , 但實際體感中 , 生成的質量效果和速度并未得到肉眼可見的提升 , 甚至在部分場景中還不及前代模型 。
真正讓 Nano Banana 2 站穩腳跟的 , 其實是它極其接地氣的性價比 。
今天起 , 在 Gemini 應用和 Google 搜索框里 , 你都能順手用上它 。 沒有訂閱方案的普通用戶 , 24 小時內也能白嫖 100 張;而 Pro 訂閱用戶的額度則高達 1000 張 。
對于開發者而言 , API 的價格更是直接腰斬 , 僅為上一代 Pro 模型的一半 。 折算下來 , 生成一張 4K 高清圖的成本被硬生生打到了 0.15 美元左右 。
附上地址:https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview
當然 , 當 AI 能夠以極低的成本、極快的速度批量生產高清圖片時 , 大家心里其實越沒底 。 現在網上的假圖滿天飛 , 「眼見為實」這句話早就靠不住了 。 如果任何人都能在一秒鐘內生成一張幾可亂真的照片 , 我們該如何分辨圖片?
Google 自己也十分清楚這一點 , 所以他們也一并升級了防偽技術 。 Nano Banana 2 繼續加深了對 SynthID 數字水印和 C2PA 內容憑證的支持 , 能夠更清楚地看到一張圖到底是不是 AI 畫的 , 以及它是怎么被修改的 。
據統計 , 自去年 11 月以來 , Gemini 里的這個驗證功能已經被調用了超過 2000 萬次 。
AI 繪圖這兩年的發展 , 確實快得讓人眼花繚亂 。 我們經歷過 Nano Banana Pro 的一眼驚艷 , 也經歷過繁瑣的調教與漫長的等待 。 Nano Banana 2 的出現 , 則嘗試進一步把好和快揉在了一起 , 并大大降低了使用的門檻 。
你腦子里的一個靈感 , 不用再經過反復的修改和焦躁的等待 。 敲下回車的瞬間 , 它就在那里了 。 自然、簡單 , 且立等可取 , 這件事聽起來平常 , 但能做到 , 其實已經很難得了 。
#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr) , 更多精彩內容第一時間為您奉上 。
愛范兒|原文鏈接· ·新浪微博

    推薦閱讀