字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

文章圖片

字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛

了解AI的朋友都知道 , 當前AI應用硬件層面的主要瓶頸就在于GPU與內存 , 無論是Stable Diffusion的文生圖、圖生圖、文生視頻等應用 , 還是圍繞各種大模型的智能體類應用 , 只要涉及到本地化部署和使用 , 主要瓶頸就是GPU和內存 。 銳龍AI Max+就瞄準了這兩大痛點 , 通過高算力圖形計算單元以及高容量、高帶寬內存方案 , 讓AI PC、迷你電腦也具備了堪比臺式機的AI算力水平 。 因此 , 銳龍AI Max+平臺堪稱當前性能最強、AI算力最為彪悍的移動級處理器 。
今天我們拿到的是搭載AMD銳龍AI Max+ 395處理器的極摩客EVO-X2迷你電腦 , 它的定位是“Mini AI工作站” 。
作為當前少數搭載AMD銳龍AI Max+ 395處理器的迷你電腦 , 極摩客EVO-X2桌面AI超算中心在AI應用方面究竟會有怎樣的表現?通過本篇評測 , 我們來一探究竟 。
·硬件配置與性能表現
首先我們看看這款機器的配置與性能表現 。
極摩客EVO-X2桌面AI超算中心搭載的AMD銳龍AI Max+ 395處理器 , 是銳龍AI Max+系列的頂配型號 , 原生16顆超大核心32線程設計 , 最高加速頻率5.1GHz , 總緩存高達80MB , NPU峰值AI算力為50TOPS , cTDP為45-120W , 集成40個圖形核心的Radeon 8060S iGPU 。
【CPU單核/多核性能】
參考CINEBENCH R23和2024測試 , 銳龍AI Max+ 395處理器在R23測試標準下 , 單核得分1985 , 多核得分36648;2024標準下單核得分113 , 多核得分1752 , 整體性能表現非常出色 , 甚至可以探到移動端HX級別處理器的性能水準 。 因此銳龍AI Max+ 395并非“AI偏科生” , 而是有著極其扎實的單核和多核性能實力 。
【CPU功耗釋放】
得益于極摩客EVO-X2桌面AI超算中心較大體積帶來的內部空間 , AIDA 64 FPU CPU單烤機實測這顆處理器的長時穩定功耗釋放可以保持在103W附近 , 平均核心溫度99.1℃ , 3分鐘以內的短時功耗釋放甚至可以達到120W 。
【內存讀寫性能】
銳龍AI Max+ 395在設計時針對AI應用角度的這種特性 , 大幅提升了內存帶寬 , 所以AIDA 64內存性能測試的結果極為出色 。 這款機器配備的雙通道128GB LPDDR5x 8000高速內存讀取速度高達119.34GB/s , 寫入速度高達210.1GB/s , 拷貝速度高達153.49GB/s , 速度極快 。
【硬盤讀寫性能】
存儲方面 , 極摩客EVO-X2桌面AI超算中心一步到位配備了2TB容量的雷克沙PCIe 4.0固態硬盤 , 實測順序讀取速度為7116.8MB/s , 順序寫入速度為6440.38MB/s , 4K隨機讀取速度為69.5MB/s , 4K隨機寫入速度為207.96MB/s , 達到了PCIe 4.0固態硬盤的高端性能水準 。 這非常有助于大參數量大語言模型的載入速度 。
【GPU圖形性能】
銳龍AI Max+ 395之所以能夠勝任大參數量AI大模型的需求 , 很重要的原因在于它集成的Radeon 8060S iGPU , 這顆GPU在集成顯卡中可以說是超模的存在 。 它擁有2560個流處理器 , 64GB LPDDR5顯存 , 128GB/s顯存帶寬 , 核心頻率高達2900MHz , 顯存頻率1000MHz , 比當前任何一款集成顯卡的性能都要強很多 。
參考3DMark各項測試可以看到 , Radeon 8060S iGPU在Speed Way DX12性能方面得分達到了2025 , 遠超其它iGPU性能 。 Port Royal光追性能達到了5884分 , 基本達到了RTX 4060獨顯的水平(5957分左右) 。 而Time Spy以及Fire Strike圖形分也分別達到了11498和30713分 , 作為集成顯卡 , 它的理論圖形性能其實達到甚至超越了RTX 4060獨顯的水平 , 著實讓人感到驚艷 。
·綜合應用性能評估
CPU、內存、硬盤、GPU理論性能了解之后 , 我們來看看如此出色的綜合性能能夠在實際應用中獲得怎樣的體驗?
【CPU應用性能】
首先是CPU相關的應用性能表現 。
7-Zip壓縮與解壓縮測試中 , 銳龍AI Max+ 395處理器得益于16顆超大核心32線程設計 , 壓縮速度達到了150617KB/s , 解壓縮速度達到了2063057KB/s , 總評分高達177.76GIPS , 是目前移動級處理器中T0級別的性能水準 。
視頻編碼方面 , x264 Benchmark實測編碼2500幀的幀速率為77.31fps , 完成時間為32秒 , 相對于HX系列的處理器要略慢一些 。
渲染方面 , V-Ray Bencmark 1分鐘采樣率達到38813 vsamples;Corona Benchmark渲染速度達到了11248700Rays/sec , 渲染用時僅43秒 。
總體來說 , 銳龍AI Max+ 395處理器在壓縮、解壓縮以及物理渲染方面有著遠高于其它移動端處理器的性能表現 , 而視頻編碼能力滿足生產力需求也是不成問題的 。
【GPU應用性能】
接下來再看看GPU相關的應用性能 。
首先是V-Ray Benchmark的加速測試 , 1分鐘渲染速度達到了1812 vpaths , 在集成顯卡中鶴立雞群 。
Blender benchmark的表現同樣出色 , monster、junkshop、classroom三項渲染采樣率分別達到560.23、199.86以及252.34 samples/min , 同樣遠超當前其它集成顯卡的性能 。
【綜合應用性能】
最后看看綜合應用性能 。
生產力理論性能我們參考PCMark 10辦公模式測試:常用基本功能 , 包含Web瀏覽、視頻會議、應用程序啟動等得分為11425分 , 說明其完成這些基礎辦公任務沒有任何問題;生產力項目測試中得分高達10717分 , 表明其擁有卓越的電子表格、文檔工作性能;數位內容創作評分高達16366分 , 說明其能夠非常高效地完成圖片、視頻編輯、圖形渲染等工作;綜合得分9039 , 應對日常辦公、娛樂應用沒有任何問題 。
生產力應用性能我們參考UL Procyon的照片編輯和視頻編輯測試 , 二者評分分別達到了8955和22765分 , 可以相當輕松地勝任RAW格式原片處理 , 并且在2K、4K視頻剪輯上也能提供極為出色的性能支持 。
·AI性能評估
搭載AMD銳龍AI Max+ 395處理器的極摩客EVO-X2售價為14999元 , 對于大眾用戶這個價格不便宜 , 但是如果將它與動輒數萬、數十萬元的AI一體機來做對比的話 , 這款機器可以說是目前成本相當低的AI學習、開發、應用平臺 , 對初步上手AI的人群來說非常適合 。
了解AI的朋友都知道 , 顯存和內存在AI應用中非常重要 , Radeon 8060S雖然圖形性能極為出色 , 但其顯存也不過就是6GB , 應對AI大語言模型的應用需求有點捉襟見肘 。 不過通過AMD獨特的統一內存技術 , 在AMD軟件控制中心 , 我們可以將極摩客EVO-X2的128GB內存分配給集成顯卡作顯存 , 最高可以分配96GB , 這樣就可以承擔起大參數量大語言模型的應用需求了 。
在AI應用測試之前 , 我們先來看看銳龍AI Max+ 395處理器的CPU、GPU以及NPU三大AI計算單元的算力表現 。 參考UL Procyon的CPU Integer、GPU Float 16以及NPU Integer測試 , 三項評分分別為248、987以及1783分 , 相對此前的銳龍8040系列的處理器來說 , 銳龍AI Max+ 395處理器的CPU AI算力提升不算太大 , 但GPU和NPUAI算力提升幅度基本都超過了3倍!
理論性能了解之后 , 我們看看銳龍AI Max+ 395在實際AI應用中的表現 。
首先通過UL Procyon測試了Phi-3.5 4B、Mistral 7B、Llama 3.1 8B以及Llama 2 13B四款經典大語言模型 , 生成速度分別達到了69.56 tokens/s、44.87 tokens/s、38.01 tokens/s以及25.45 tokens/s , 速度非常快 。 另外值得一提的是 , 即便是RTX 5060筆記本電腦GPU , 因為其作為獨立顯卡也只有可憐的8GB顯存 , 所以也無法正常運行參數量較大的Llama 2大模型 , 而Radeon 8060S不僅成功運行 , 且生成速度能夠達到25.45 tokens/s , 日常應用完全沒有問題 。 此時 , 銳龍AI Max+ 395平臺的獨特優勢就徹底顯現出來了 。
接下來我們通過LM Studio進行了15B及以下小參數量大語言模型和22B及以上大參數量大語言模型的測試 。
首先在各類小參數量稠密大模型測試中可以看到 , 銳龍AI Max+ 395表現非常出色 , 憑借內存分配帶來的超大顯存支持 , 即便是遇到BF16高精度的Mistral-small 24B以及Gemma 2 27B大模型 , 生成速度也分別達到了12.37 tokens/s和11.62 tokens/s , 表現出色 。 而對于更高性能的DeepSeek R1 14B、Phi-4 15B , 速度也能達到19.63 tokens/s和12.24 tokens/s;低精度的DeepSeek R1 7B生成速度更是達到了41.94 tokens/s , 而DeepSeek R1 1.5B則達到了92.67 tokens/s , 可見在面對小參數量大模型時 , 銳龍AI Max+ 395無論是面對高精度模型還是低精度模型 , 都能提供足夠快的生成速度 。
在面對大參數量大語言模型時 , 其實首要解決的問題不是能不能使用大模型 , 而是能不能正常加載大模型 。 就比如RTX 5060筆記本電腦GPU , 雖然其性能比Radeon 8060S要強 , 但如果大模型參數量較大 , 前者大概率也過不了加載這一關 , 更別提進一步應用了 。
從下圖可以看到 , 我們在加載Qwen3-235B-A22B-IQ2_S的MoE混合大模型時 , 內存峰值占用高達63.6GB , 如果沒有128GB超大內存支持的話 , 加載這一關就過不了 。
在各類大參數量大語言模型測試中 , Qwen3-235B-A22B-IQ2_SMoE模型生成速度達到了14.72 tokens/s , 表現出色;DeepSeek IQ2_M、DeepSeek R1 Distill Llama 70B大參數量稠密模型也能夠正常運行 , 并且可以達到4.91 tokens/s和5.31 tokens/s的生成速度 。 而Q4量化版本的DeepSeek R1 Qwen 32B蒸餾模型以及QWQ 32B大模型生成速度分別可以達到9.71 tokens/s和9.79 tokens/s的生成速度 。
另外這里要說明的一點是 , Qwen3-235B-A22B-IQ2_S這個模型雖然參數量達到了235B , 但它并非是常見的稠密模型 , 而是MoE(Mixture of experts)混合專家模型 。 簡單來說 , MoE模型雖然總參數量很大 , 但以Qwen3-235B-A22B-IQ2_S模型為例 , 它雖然擁有235B總參數量 , 但運行時實際只會調用22B(模型中A22B標識就表示運行時只會調用22B參數量)的參數進行計算 , 因此對于硬件的壓力要小很多 。
也正是因為有著這種大參數、低算力特性 , MoE模型或許會成為未來大模型發展的主流趨勢 。
反之 , 稠密模型每一次計算都會調用所有參數 , 這也就是為什么235B的Qwen3-235B-A22B-IQ2_S生成速度反而比DeepSeek R1 32B、QWQ 32B大模型要快的原因 。
AI測試的最后一部分 , 我們使用了針對AMD銳龍平臺打造的Amuse這款Stable Diffusion工具 , 它支持文生圖、圖生圖、文生視頻等應用 , 使用起來非常方便 。
首先我們使用最近大半年非?;鸨腇LUX.1-Dev模型進行了文生圖測試 , 實測迭代10步 , 生成一張1024×1024超清圖片用時234.3秒 。 這個表現雖然不如獨顯 , 但在集成顯卡里 , 能順利完成這一任務的此前沒有 , Radeon 8060S不僅順利完成 , 而且效率也還不錯 , 畢竟1024×1024規格的圖片生成 , 在AI文生圖應用中算是高負載任務了 。
其次我們使用了Stable Diffusion XL Turbo模型 , 進行了2048x2048規格圖片的生成 。 這款大模型整體精度要低一些 , 所以對硬件負載的壓力不算太高 。 普通用戶使用這類大模型進行文生圖就足夠了 , 沒必要使用FLUX.1-Dev這種超高精度大模型 。
可以看到 , Stable Diffusion XL Turbo模型生成2048x2048規格圖片耗時僅需12.8秒 , 每秒迭代次數也達到了2.6次 。
總體來說 , 銳龍AI Max+ 395是非常不錯的AI計算平臺 , 配合大內存并通過AMD統一內存技術分配給顯存之后 , 常規的AI應用基本沒有太大壓力 , 完全可以作為個人或者小型工作室、小型企業用戶的AI終端設備 。 尤其相比動輒數萬、數十萬元的AI一體機來說 , 14999元的極摩客EVO-X2絕對是一個高性價比的解決方案 。
同時 , 這類設備也非常適合AI初學者、初級AI開發者使用 。 首先 , 銳龍AI Max+ 395平臺配合超大內存 , 完全可以在本地部署多樣化的AI大模型 , 如70B、32B大語言模型 , 或者Flux、StableDiffusion等文生圖、文生視頻大模型 。 借助LMStudio、Comfy-UI等AI工具 , 輕松實現本地化的AI助手、個人知識庫以及圖片、視頻創作平臺的搭建 。
其次 , 超大內存與顯存帶來了更加出色的AI應用體驗 , 例如用戶在實際應用中可以同時加載Stable Diffusion+Whisper+Llama這樣的混合式AI模型方案 , 從而用AI解決AI應用的問題 , 如讓AI直接生成提示詞 , 再通過SD進行圖片、視頻創作 。 同時銳龍AI Max+395平臺還支持ONNX、DirectML等多種框架 , 完美適配Windows平臺的部署與運行 。 因此也非常適合多模態AI應用 , 如擴圖、分割、語音識別、圖像識別等 , 節約實驗或驗證成本 , 快速完成Demo或開源項目的開發 。
其三 , 設備成本支出更低的同時 , 本地化部署帶來的另一大好處就是使用成本幾乎為零 。 用戶無需額外支付Token費用 , 也不受網絡質量影響 。 同時擁有更加可靠的用戶隱私、數據安全 , 算法模型數據不容易外泄 。
此外 , 銳龍AI Max+ 395的NPU也可以參與YOLO等適配模型的相關任務 , 分擔負載 , 從而讓多模態應用擁有最優的算力表現 。
·游戲性能評估
銳龍AI Max+ 395集成的Radeon 8060S本身擁有相當不錯的圖形性能 , 因此對于游戲玩家來說也是不錯的選擇 。 所以性能測試的最后一部分 , 我們進行了四款熱門游戲的測試 。
《三角洲行動》 , 極高畫質(次高畫質) , 2560x1600分辨率 , 平均幀率可以達到96fps , 流暢運行無壓力 。
《荒野大鏢客2》 , 中等畫質 , 2560x1600分辨率 , 開啟FSR , 平均幀率可以達到89fps , 運行非常流暢 。
《賽博朋克2077》 , 超級畫質 , 未開啟光追 , 2560x1600分辨率 , 平均幀率可以達到59.23fps , 接近60fps的表現已經遠超當前其它集成顯卡了 。
《黑神話:悟空》 , 超高畫質(非影視級畫質) , 2560x1600分辨率 , 平均幀率達到了62fps , 可以流暢游玩 。
可見極摩客EVO-X2不僅擁有出色的AI性能 , 同時還有著不錯的游戲性能 , 再加上出色的生產力性能 , 這款產品可以說是相當能打的一款綜合性迷你主機了 。 而且確實不負“桌面AI超算中心”之名!
·簡約干練的外觀設計
作為一款較大體積的迷你電腦 , 極摩客EVO-X2桌面AI超算中心在設計上還是很有看點的 。 這款機器整體采用了類似“夾心餅干”的設計方式 , 頂部和底部采用銀色金屬面板打造 , 中間采用黑色配色 , 從外觀配色上就給人一種很極客的感覺 。
這款機器的設計風格簡約 , 臥放時正面的切角區域印有“GMKtec”的品牌LOGO , 五邊形切角設計打破了正方形機身“循規蹈矩”的感覺 。 正如其獨特的配置一樣 , 仿佛彰顯著不拘一格、打破壁壘的產品語言 。
這款機器支持臥放和立放 , 可以適應不同尺寸的辦公空間 。 另外可以看到切角對應的區域設計有一枚三角形按鍵 , 它的作用是一鍵切換風扇的燈效模式 。 可以很方便的在常亮、呼吸等燈效模式中快速切換 。
極摩客EVO-X2桌面AI超算中心有著非常出色的接口擴展能力 , 機身前端配有電源鍵和P-Mode性能模式切換快捷鍵 。 同時還配有標準的SD卡插槽 , 1個USB4接口 , 2個USB 3.2 Type-A接口以及3.5mm耳麥插孔 。
機身背部接口就更加豐富了 。 包括安全鎖孔 , 電源插孔 , 3.5mm耳麥插孔 , RJ45以太網口 , 1個USB 3.2 Gen 2 Type-A接口 , 1個USB4接口 , 1個DP1.4視頻端口 , 1個HDMI2.1視頻端口以及2個USB2.0接口 。
另外可以看到在接口區域下方 , 還設計有四個散熱格柵 。 同時機身底部面板也開有大面積的散熱孔 , 整體散熱效率得到保障 。
·評測總結
年初我在CES參加AMD發布會時 , 就對銳龍AI Max+ 395產生了極大興趣 。 因為在整個行業里 , 銳龍AI Max+是頗為獨特的存在 , 它從CPU的角度賦予了AI PC更加確切的定義 , 讓移動端的AI處理器與傳統移動端處理器產生了區隔 。 不過說實話 , 當時對于銳龍AI Max+的實際表現還是頗有疑問的 , 畢竟集成顯卡跑出超越獨立顯卡的AI性能 , 在年初還是一件相當魔幻的事情 。
不過在這次對銳龍AI Max+ 395處理器和極摩客EVO-X2桌面AI超算Mini工作站的深入測試中 , 此前的疑慮被徹底打破 。 MoE混合專家模型的出現 , 或許是未來銳龍AI Max+ 395這類處理器切入大參數量模型本地部署和應用的主要方式 , 而且實際效果真心不錯 。
此外 , 銳龍AI Max+ 395有著非常不錯的生產力性能和游戲性能 , 對于迷你電腦、筆記本電腦來說也是相當靠譜的硬件解決方案 。
而對于極摩客EVO-X2桌面AI超算中心這款產品來說 , 筆者個人認為它非常適合正在學習AI、研究AI、或者本地部署使用AI的工作室、小型企業用戶選擇 , 算得上是當前極低成本的高算力AI解決方案了 。
【字典大小的迷你主機性能卻超越臺式機?銳龍AI Max+ 395確實猛】(10768595)

    推薦閱讀