字典大小的迷你主機性能卻超越臺式機？銳龍AI Max+ 395確實猛

2026-04-01 ai gpu it芯片人工智能 cpu 顯卡

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

了解AI的朋友都知道，當前AI應用硬件層面的主要瓶頸就在于GPU與內存，無論是Stable Diffusion的文生圖、圖生圖、文生視頻等應用，還是圍繞各種大模型的智能體類應用，只要涉及到本地化部署和使用，主要瓶頸就是GPU和內存。銳龍AI Max+就瞄準了這兩大痛點，通過高算力圖形計算單元以及高容量、高帶寬內存方案，讓AI PC、迷你電腦也具備了堪比臺式機的AI算力水平。因此，銳龍AI Max+平臺堪稱當前性能最強、AI算力最為彪悍的移動級處理器。
今天我們拿到的是搭載AMD銳龍AI Max+ 395處理器的極摩客EVO-X2迷你電腦，它的定位是“Mini AI工作站” 。
作為當前少數搭載AMD銳龍AI Max+ 395處理器的迷你電腦，極摩客EVO-X2桌面AI超算中心在AI應用方面究竟會有怎樣的表現？通過本篇評測，我們來一探究竟。
·硬件配置與性能表現
首先我們看看這款機器的配置與性能表現。
極摩客EVO-X2桌面AI超算中心搭載的AMD銳龍AI Max+ 395處理器，是銳龍AI Max+系列的頂配型號，原生16顆超大核心32線程設計，最高加速頻率5.1GHz ，總緩存高達80MB ， NPU峰值AI算力為50TOPS ， cTDP為45-120W ，集成40個圖形核心的Radeon 8060S iGPU 。
【CPU單核/多核性能】
參考CINEBENCH R23和2024測試，銳龍AI Max+ 395處理器在R23測試標準下，單核得分1985 ，多核得分36648；2024標準下單核得分113 ，多核得分1752 ，整體性能表現非常出色，甚至可以探到移動端HX級別處理器的性能水準。因此銳龍AI Max+ 395并非“AI偏科生” ，而是有著極其扎實的單核和多核性能實力。
【CPU功耗釋放】
得益于極摩客EVO-X2桌面AI超算中心較大體積帶來的內部空間， AIDA 64 FPU CPU單烤機實測這顆處理器的長時穩定功耗釋放可以保持在103W附近，平均核心溫度99.1℃ ， 3分鐘以內的短時功耗釋放甚至可以達到120W 。
【內存讀寫性能】
銳龍AI Max+ 395在設計時針對AI應用角度的這種特性，大幅提升了內存帶寬，所以AIDA 64內存性能測試的結果極為出色。這款機器配備的雙通道128GB LPDDR5x 8000高速內存讀取速度高達119.34GB/s ，寫入速度高達210.1GB/s ，拷貝速度高達153.49GB/s ，速度極快。
【硬盤讀寫性能】
存儲方面，極摩客EVO-X2桌面AI超算中心一步到位配備了2TB容量的雷克沙PCIe 4.0固態硬盤，實測順序讀取速度為7116.8MB/s ，順序寫入速度為6440.38MB/s ， 4K隨機讀取速度為69.5MB/s ， 4K隨機寫入速度為207.96MB/s ，達到了PCIe 4.0固態硬盤的高端性能水準。這非常有助于大參數量大語言模型的載入速度。
【GPU圖形性能】
銳龍AI Max+ 395之所以能夠勝任大參數量AI大模型的需求，很重要的原因在于它集成的Radeon 8060S iGPU ，這顆GPU在集成顯卡中可以說是超模的存在。它擁有2560個流處理器， 64GB LPDDR5顯存， 128GB/s顯存帶寬，核心頻率高達2900MHz ，顯存頻率1000MHz ，比當前任何一款集成顯卡的性能都要強很多。
參考3DMark各項測試可以看到， Radeon 8060S iGPU在Speed Way DX12性能方面得分達到了2025 ，遠超其它iGPU性能。 Port Royal光追性能達到了5884分，基本達到了RTX 4060獨顯的水平（5957分左右）。而Time Spy以及Fire Strike圖形分也分別達到了11498和30713分，作為集成顯卡，它的理論圖形性能其實達到甚至超越了RTX 4060獨顯的水平，著實讓人感到驚艷。
·綜合應用性能評估
CPU、內存、硬盤、GPU理論性能了解之后，我們來看看如此出色的綜合性能能夠在實際應用中獲得怎樣的體驗？
【CPU應用性能】
首先是CPU相關的應用性能表現。
7-Zip壓縮與解壓縮測試中，銳龍AI Max+ 395處理器得益于16顆超大核心32線程設計，壓縮速度達到了150617KB/s ，解壓縮速度達到了2063057KB/s ，總評分高達177.76GIPS ，是目前移動級處理器中T0級別的性能水準。
視頻編碼方面， x264 Benchmark實測編碼2500幀的幀速率為77.31fps ，完成時間為32秒，相對于HX系列的處理器要略慢一些。
渲染方面， V-Ray Bencmark 1分鐘采樣率達到38813 vsamples；Corona Benchmark渲染速度達到了11248700Rays/sec ，渲染用時僅43秒。
總體來說，銳龍AI Max+ 395處理器在壓縮、解壓縮以及物理渲染方面有著遠高于其它移動端處理器的性能表現，而視頻編碼能力滿足生產力需求也是不成問題的。
【GPU應用性能】
接下來再看看GPU相關的應用性能。
首先是V-Ray Benchmark的加速測試， 1分鐘渲染速度達到了1812 vpaths ，在集成顯卡中鶴立雞群。
Blender benchmark的表現同樣出色， monster、junkshop、classroom三項渲染采樣率分別達到560.23、199.86以及252.34 samples/min ，同樣遠超當前其它集成顯卡的性能。
【綜合應用性能】
最后看看綜合應用性能。
生產力理論性能我們參考PCMark 10辦公模式測試：常用基本功能，包含Web瀏覽、視頻會議、應用程序啟動等得分為11425分，說明其完成這些基礎辦公任務沒有任何問題；生產力項目測試中得分高達10717分，表明其擁有卓越的電子表格、文檔工作性能；數位內容創作評分高達16366分，說明其能夠非常高效地完成圖片、視頻編輯、圖形渲染等工作；綜合得分9039 ，應對日常辦公、娛樂應用沒有任何問題。
生產力應用性能我們參考UL Procyon的照片編輯和視頻編輯測試，二者評分分別達到了8955和22765分，可以相當輕松地勝任RAW格式原片處理，并且在2K、4K視頻剪輯上也能提供極為出色的性能支持。
·AI性能評估
搭載AMD銳龍AI Max+ 395處理器的極摩客EVO-X2售價為14999元，對于大眾用戶這個價格不便宜，但是如果將它與動輒數萬、數十萬元的AI一體機來做對比的話，這款機器可以說是目前成本相當低的AI學習、開發、應用平臺，對初步上手AI的人群來說非常適合。
了解AI的朋友都知道，顯存和內存在AI應用中非常重要， Radeon 8060S雖然圖形性能極為出色，但其顯存也不過就是6GB ，應對AI大語言模型的應用需求有點捉襟見肘。不過通過AMD獨特的統一內存技術，在AMD軟件控制中心，我們可以將極摩客EVO-X2的128GB內存分配給集成顯卡作顯存，最高可以分配96GB ，這樣就可以承擔起大參數量大語言模型的應用需求了。
在AI應用測試之前，我們先來看看銳龍AI Max+ 395處理器的CPU、GPU以及NPU三大AI計算單元的算力表現。參考UL Procyon的CPU Integer、GPU Float 16以及NPU Integer測試，三項評分分別為248、987以及1783分，相對此前的銳龍8040系列的處理器來說，銳龍AI Max+ 395處理器的CPU AI算力提升不算太大，但GPU和NPUAI算力提升幅度基本都超過了3倍！
理論性能了解之后，我們看看銳龍AI Max+ 395在實際AI應用中的表現。
首先通過UL Procyon測試了Phi-3.5 4B、Mistral 7B、Llama 3.1 8B以及Llama 2 13B四款經典大語言模型，生成速度分別達到了69.56 tokens/s、44.87 tokens/s、38.01 tokens/s以及25.45 tokens/s ，速度非常快。另外值得一提的是，即便是RTX 5060筆記本電腦GPU ，因為其作為獨立顯卡也只有可憐的8GB顯存，所以也無法正常運行參數量較大的Llama 2大模型，而Radeon 8060S不僅成功運行，且生成速度能夠達到25.45 tokens/s ，日常應用完全沒有問題。此時，銳龍AI Max+ 395平臺的獨特優勢就徹底顯現出來了。
接下來我們通過LM Studio進行了15B及以下小參數量大語言模型和22B及以上大參數量大語言模型的測試。
首先在各類小參數量稠密大模型測試中可以看到，銳龍AI Max+ 395表現非常出色，憑借內存分配帶來的超大顯存支持，即便是遇到BF16高精度的Mistral-small 24B以及Gemma 2 27B大模型，生成速度也分別達到了12.37 tokens/s和11.62 tokens/s ，表現出色。而對于更高性能的DeepSeek R1 14B、Phi-4 15B ，速度也能達到19.63 tokens/s和12.24 tokens/s；低精度的DeepSeek R1 7B生成速度更是達到了41.94 tokens/s ，而DeepSeek R1 1.5B則達到了92.67 tokens/s ，可見在面對小參數量大模型時，銳龍AI Max+ 395無論是面對高精度模型還是低精度模型，都能提供足夠快的生成速度。
在面對大參數量大語言模型時，其實首要解決的問題不是能不能使用大模型，而是能不能正常加載大模型。就比如RTX 5060筆記本電腦GPU ，雖然其性能比Radeon 8060S要強，但如果大模型參數量較大，前者大概率也過不了加載這一關，更別提進一步應用了。
從下圖可以看到，我們在加載Qwen3-235B-A22B-IQ2_S的MoE混合大模型時，內存峰值占用高達63.6GB ，如果沒有128GB超大內存支持的話，加載這一關就過不了。
在各類大參數量大語言模型測試中， Qwen3-235B-A22B-IQ2_SMoE模型生成速度達到了14.72 tokens/s ，表現出色；DeepSeek IQ2_M、DeepSeek R1 Distill Llama 70B大參數量稠密模型也能夠正常運行，并且可以達到4.91 tokens/s和5.31 tokens/s的生成速度。而Q4量化版本的DeepSeek R1 Qwen 32B蒸餾模型以及QWQ 32B大模型生成速度分別可以達到9.71 tokens/s和9.79 tokens/s的生成速度。
另外這里要說明的一點是， Qwen3-235B-A22B-IQ2_S這個模型雖然參數量達到了235B ，但它并非是常見的稠密模型，而是MoE（Mixture of experts）混合專家模型。簡單來說， MoE模型雖然總參數量很大，但以Qwen3-235B-A22B-IQ2_S模型為例，它雖然擁有235B總參數量，但運行時實際只會調用22B（模型中A22B標識就表示運行時只會調用22B參數量）的參數進行計算，因此對于硬件的壓力要小很多。
也正是因為有著這種大參數、低算力特性， MoE模型或許會成為未來大模型發展的主流趨勢。
反之，稠密模型每一次計算都會調用所有參數，這也就是為什么235B的Qwen3-235B-A22B-IQ2_S生成速度反而比DeepSeek R1 32B、QWQ 32B大模型要快的原因。
AI測試的最后一部分，我們使用了針對AMD銳龍平臺打造的Amuse這款Stable Diffusion工具，它支持文生圖、圖生圖、文生視頻等應用，使用起來非常方便。
首先我們使用最近大半年非?；鸨腇LUX.1-Dev模型進行了文生圖測試，實測迭代10步，生成一張1024×1024超清圖片用時234.3秒。這個表現雖然不如獨顯，但在集成顯卡里，能順利完成這一任務的此前沒有， Radeon 8060S不僅順利完成，而且效率也還不錯，畢竟1024×1024規格的圖片生成，在AI文生圖應用中算是高負載任務了。
其次我們使用了Stable Diffusion XL Turbo模型，進行了2048x2048規格圖片的生成。這款大模型整體精度要低一些，所以對硬件負載的壓力不算太高。普通用戶使用這類大模型進行文生圖就足夠了，沒必要使用FLUX.1-Dev這種超高精度大模型。
可以看到， Stable Diffusion XL Turbo模型生成2048x2048規格圖片耗時僅需12.8秒，每秒迭代次數也達到了2.6次。
總體來說，銳龍AI Max+ 395是非常不錯的AI計算平臺，配合大內存并通過AMD統一內存技術分配給顯存之后，常規的AI應用基本沒有太大壓力，完全可以作為個人或者小型工作室、小型企業用戶的AI終端設備。尤其相比動輒數萬、數十萬元的AI一體機來說， 14999元的極摩客EVO-X2絕對是一個高性價比的解決方案。
同時，這類設備也非常適合AI初學者、初級AI開發者使用。首先，銳龍AI Max+ 395平臺配合超大內存，完全可以在本地部署多樣化的AI大模型，如70B、32B大語言模型，或者Flux、StableDiffusion等文生圖、文生視頻大模型。借助LMStudio、Comfy-UI等AI工具，輕松實現本地化的AI助手、個人知識庫以及圖片、視頻創作平臺的搭建。
其次，超大內存與顯存帶來了更加出色的AI應用體驗，例如用戶在實際應用中可以同時加載Stable Diffusion+Whisper+Llama這樣的混合式AI模型方案，從而用AI解決AI應用的問題，如讓AI直接生成提示詞，再通過SD進行圖片、視頻創作。同時銳龍AI Max+395平臺還支持ONNX、DirectML等多種框架，完美適配Windows平臺的部署與運行。因此也非常適合多模態AI應用，如擴圖、分割、語音識別、圖像識別等，節約實驗或驗證成本，快速完成Demo或開源項目的開發。
其三，設備成本支出更低的同時，本地化部署帶來的另一大好處就是使用成本幾乎為零。用戶無需額外支付Token費用，也不受網絡質量影響。同時擁有更加可靠的用戶隱私、數據安全，算法模型數據不容易外泄。
此外，銳龍AI Max+ 395的NPU也可以參與YOLO等適配模型的相關任務，分擔負載，從而讓多模態應用擁有最優的算力表現。
·游戲性能評估
銳龍AI Max+ 395集成的Radeon 8060S本身擁有相當不錯的圖形性能，因此對于游戲玩家來說也是不錯的選擇。所以性能測試的最后一部分，我們進行了四款熱門游戲的測試。
《三角洲行動》，極高畫質（次高畫質）， 2560x1600分辨率，平均幀率可以達到96fps ，流暢運行無壓力。
《荒野大鏢客2》，中等畫質， 2560x1600分辨率，開啟FSR ，平均幀率可以達到89fps ，運行非常流暢。
《賽博朋克2077》，超級畫質，未開啟光追， 2560x1600分辨率，平均幀率可以達到59.23fps ，接近60fps的表現已經遠超當前其它集成顯卡了。
《黑神話：悟空》，超高畫質（非影視級畫質）， 2560x1600分辨率，平均幀率達到了62fps ，可以流暢游玩。
可見極摩客EVO-X2不僅擁有出色的AI性能，同時還有著不錯的游戲性能，再加上出色的生產力性能，這款產品可以說是相當能打的一款綜合性迷你主機了。而且確實不負“桌面AI超算中心”之名！
·簡約干練的外觀設計
作為一款較大體積的迷你電腦，極摩客EVO-X2桌面AI超算中心在設計上還是很有看點的。這款機器整體采用了類似“夾心餅干”的設計方式，頂部和底部采用銀色金屬面板打造，中間采用黑色配色，從外觀配色上就給人一種很極客的感覺。
這款機器的設計風格簡約，臥放時正面的切角區域印有“GMKtec”的品牌LOGO ，五邊形切角設計打破了正方形機身“循規蹈矩”的感覺。正如其獨特的配置一樣，仿佛彰顯著不拘一格、打破壁壘的產品語言。
這款機器支持臥放和立放，可以適應不同尺寸的辦公空間。另外可以看到切角對應的區域設計有一枚三角形按鍵，它的作用是一鍵切換風扇的燈效模式。可以很方便的在常亮、呼吸等燈效模式中快速切換。
極摩客EVO-X2桌面AI超算中心有著非常出色的接口擴展能力，機身前端配有電源鍵和P-Mode性能模式切換快捷鍵。同時還配有標準的SD卡插槽， 1個USB4接口， 2個USB 3.2 Type-A接口以及3.5mm耳麥插孔。
機身背部接口就更加豐富了。包括安全鎖孔，電源插孔， 3.5mm耳麥插孔， RJ45以太網口， 1個USB 3.2 Gen 2 Type-A接口， 1個USB4接口， 1個DP1.4視頻端口， 1個HDMI2.1視頻端口以及2個USB2.0接口。
另外可以看到在接口區域下方，還設計有四個散熱格柵。同時機身底部面板也開有大面積的散熱孔，整體散熱效率得到保障。
·評測總結
年初我在CES參加AMD發布會時，就對銳龍AI Max+ 395產生了極大興趣。因為在整個行業里，銳龍AI Max+是頗為獨特的存在，它從CPU的角度賦予了AI PC更加確切的定義，讓移動端的AI處理器與傳統移動端處理器產生了區隔。不過說實話，當時對于銳龍AI Max+的實際表現還是頗有疑問的，畢竟集成顯卡跑出超越獨立顯卡的AI性能，在年初還是一件相當魔幻的事情。
不過在這次對銳龍AI Max+ 395處理器和極摩客EVO-X2桌面AI超算Mini工作站的深入測試中，此前的疑慮被徹底打破。 MoE混合專家模型的出現，或許是未來銳龍AI Max+ 395這類處理器切入大參數量模型本地部署和應用的主要方式，而且實際效果真心不錯。
此外，銳龍AI Max+ 395有著非常不錯的生產力性能和游戲性能，對于迷你電腦、筆記本電腦來說也是相當靠譜的硬件解決方案。
而對于極摩客EVO-X2桌面AI超算中心這款產品來說，筆者個人認為它非常適合正在學習AI、研究AI、或者本地部署使用AI的工作室、小型企業用戶選擇，算得上是當前極低成本的高算力AI解決方案了。
【字典大小的迷你主機性能卻超越臺式機？銳龍AI Max+ 395確實猛】(10768595)

推薦閱讀

上一篇：GPU云排行榜，傳統云大廠集體拉胯！

下一篇：買得到芯片的美國科技巨頭，買不到電了