Google Project Genie: 從圖片或提示創建交互式虛擬世界

Google Project Genie: 從圖片或提示創建交互式虛擬世界

去年 , Google展示了其AI世界模型的升級版本Genie 3 , 它具備了令人印象深刻的長期記憶能力 , 能夠僅從簡單的文本提示就創建交互式世界 。 當時 , Google只向少數受信任的測試者提供了Genie 。 現在 , 作為Project Genie , 它的可用范圍更加廣泛 , 但僅限于訂閱Google最昂貴AI服務的用戶 。

什么是世界模型
世界模型正如其名稱所示——這是一種能夠即時生成動態環境的AI 。 不過 , 它們在技術上并不是3D世界 。 像Genie 3這樣的世界模型會創建一個響應你控制輸入的視頻 , 讓你能夠像探索真正的虛擬世界一樣探索這個模擬環境 。 Genie 3在世界模型領域是一個突破 , 因為它能夠在更長的時間內記住它所創建世界的細節 。 但在這種情況下 , \"更長時間\"是指幾分鐘 。
【Google Project Genie: 從圖片或提示創建交互式虛擬世界】Project Genie的功能特性
Project Genie本質上是Genie 3的清理優化版本 , 它集成了更新的AI模型 , 如Nano Banana Pro和Gemini 3 。 Google在Project Genie中提供了許多預構建的世界 , 但使其真正有趣的是創建新內容的能力 。 你可以提供參考圖像 , 或者簡單地告訴Genie你想要從環境和角色中得到什么 。
系統首先生成一張靜態圖像 , 然后你可以從中生成世界 。 這就是Google所說的\"世界素描\" 。 如果你不喜歡Nano Banana Pro創建的參考圖像 , 你可以在將其交給Genie之前進行修改 。
生成的視頻為720p分辨率 , 渲染速度約為每秒24幀 。 當你使用WASD按鍵移動角色時 , Genie會以接近實時的方式渲染前方的路徑 。
如果60秒的AI世界探索還不夠 , 你可以重新運行提示 。 由于這是生成式AI , 每次的結果都會略有不同 。 Google還允許你使用新角色和視覺風格來\"重新混合\"其預構建的世界 。 你探索過程的生成視頻也可以下載 。
仍處于實驗階段
Google強調Project Genie仍只是一個研究原型 , 因此存在一些顯著的限制 。 任何使用過Google Veo或OpenAI Sora創建AI視頻的人都知道 , 即使創建一個短片段也需要幾秒鐘 。 因此 , Genie能夠讓人感覺到交互性本身就令人印象深刻 。 然而 , 會存在一些輸入延遲 , 而且每個世界只能探索60秒 。 此外 , 之前為Genie 3演示的可提示事件功能(允許在運行的模擬中插入新元素)尚未可用 。
雖然Google一直在宣傳Genie準確建模物理現象的能力 , 但公司指出 , 測試者可能會看到一些看起來或行為不太正確的世界示例 。 測試者也可能看到內容限制的變化 。 The Verge網站能夠測試Project Genie , 最初它很樂意生成任天堂游戲的仿制版 , 如超級馬里奧和塞爾達傳說 。 但在測試結束時 , The Verge報告稱 , 由于\"第三方內容提供商的利益\" , 一些這樣的提示被屏蔽了 。
Project Genie只能通過專用的網絡應用程序訪問——它不會集成到Gemini應用程序或網站中 。 目前 , 你只能通過AI Ultra訂閱訪問這個工具 , 每月費用為250美元 。 生成所有這些AI視頻成本昂貴 , 因此從高級層開始是合理的 。 Google表示其目標是隨著時間的推移開放Project Genie的訪問權限 。
Q&A
Q1:Project Genie是什么?它能做什么?
A:Project Genie是Google開發的AI世界模型工具 , 它能從圖片或文本提示創建交互式虛擬世界 。 用戶可以使用WASD鍵控制角色在生成的720p視頻世界中探索 , 系統會實時渲染前方路徑 , 每次探索時長為60秒 。
Q2:Project Genie如何收費?普通用戶能使用嗎?
A:目前Project Genie只對訂閱AI Ultra的用戶開放 , 月費為250美元 。 它只能通過專用網絡應用訪問 , 不集成在Gemini應用中 。 Google表示將逐步開放更多用戶的訪問權限 。
Q3:Project Genie生成的世界質量如何?有什么限制?
A:系統生成720p、24fps的視頻世界 , 但仍是研究原型 , 存在輸入延遲、每次只能探索60秒等限制 。 可能出現物理行為不正確的情況 , 且對第三方版權內容有限制 , 如任天堂游戲相關內容會被屏蔽 。

    推薦閱讀