安謀科技發布“周易”X3 NPU IP,打造端側AI計算效率新標桿

安謀科技發布“周易”X3 NPU IP,打造端側AI計算效率新標桿

文章圖片

2025年11月13日 , 安謀科技在上海舉行新品發布會 , 正式推出新一代NPU IP——“周易”X3 , 該產品采用專為大模型而生的最新DSP+DSA架構 , 兼顧CNN與Transformer , 協同完善易用的“周易”NPU Compass AI軟件平臺 , 致力于為基礎設施、智能汽車、移動終端、智能物聯網四大領域提供AI計算核芯 , 打造端側AI計算效率新標桿 , 加快邊緣及端側AI規?;渴?。
圖1:“周易”X3 NPU IP亮點
硬件架構:專為大模型設計最新DSP+DSA架構“周易”X3基于專為大模型設計的最新DSP+DSA架構 , 從定點轉向浮點計算 , 單Cluster擁有8-80 FP8 TFLOPS算力且可靈活配置 , 單Core帶寬高達256GB/s , 支持端側大模型運行必備的W4A8/W4A16計算加速模式 , 集成安謀科技自研的解壓硬件WDC , 使大模型Weight軟件無損壓縮后通過硬件解壓獲得額外約15%的等效帶寬 , 計算效率和計算密度大幅提升 。
同時 , “周易”X3集成AI專屬硬件引擎AIFF , 配合專用硬化調度器 , 實現超低至0.5%的CPU負載與低調度延遲 , 使NPU在并行處理多項AI任務時 , 擁有高效流暢的體驗 。
軟件生態:優化大模型端到端性能 , 支持客戶自定義AI開發“周易”X3 搭載完善易用的Compass AI軟件平臺 , 全面優化大模型端到端性能 。 平臺廣泛兼容TensorFlow、ONNX、PyTorch等主流AI框架 , 具備業界領先的大模型動態Shape支持能力 , 并支持GPTQ等大模型主流量化方案、 Hugging Face模型庫 , 與LLM、VLM、VLA及MoE等模型 。
圖 2:“周易”NPU Compass AI軟件平臺
同時 , 安謀科技積極構建開放生態 , Compass AI軟件平臺已將 Parser、Optimizer、Linux Driver、TVM 及內部 IR 格式等核心組件相繼開源 , 并擁有豐富的調試工具 , 可滿足開發者白盒部署需求 , 且支持更易用的 DSL 算子編程語言 , 在深度開發模式下 , 客戶可以使用平臺中的Compiler、Debugger和DSL語言開發出自己的自定義算子 , 也可通過Parser、Optimizer等工具打造出屬于自己的模型編譯器 , 極大提升開發效率 。 發布初期 , “周易”Compass AI軟件平臺已支持超 160 種算子與 270 多種模型 , 顯著提升開發部署效率 , 助力客戶快速實現 AI 應用創新與落地 。
軟硬深度協同下 , “周易”X3的性能顯著提升 ,CNN模型性能較上一代提升30%-50% , 在同算力規格下 , AIGC大模型能力提升10倍 , 這得益于16倍的FP16 TFLOPS、4倍的計算核心帶寬 , 以及超10倍的Softmax和LayerNorm性能提升共同驅動 。 實測多核算力線性度達到70%-80% 。 實測大模型性能方面 , “周易”X3 在Prefill階段算力利用率達72% , Decode階段有效帶寬利用率在開啟WDC情況下超100% , 充分釋放硬件算力潛力 。
應用場景:覆蓋基礎設施、智能汽車、移動終端、智能物聯網四大領域在應用場景上 , “周易”X3可廣泛應用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機、智能網關、智能IPC等AI設備 , 深度賦能四大核心領域 , 提升AI計算效率 , 優化AI應用體驗 。

  • 基礎設施:在加速卡場景中 , 支持CNN與大模型等多樣結構的AI模型加速;
  • 智能汽車:在ADAS系統中 , 可基于AI算力進行為自動泊車等輔助駕駛提供AI算力支持;在IVI系統中 , 支持基于語音與車內外視頻圖像輸入的智能互動;
  • 移動終端:在AI PC、AI手機上 , 可實現超分渲染 , 提升分辨率 , 并支持基于大模型的AI Agent應用;
  • 智能物聯網:在智能網關、智能IPC等設備中 , 提供本地AI推理能力 , 提升響應速度 , 優化智能體驗 。
【安謀科技發布“周易”X3 NPU IP,打造端側AI計算效率新標桿】周易“X3”的推出 , 進一步完善了安謀科技NPU IP產品家族在端側AI領域的布局 。 目前 , “周易”NPU產品線已全面覆蓋核心領域 , 可匹配多場景AI計算需求 。 未來 , 安謀科技將積極響應“AI+”行動計劃 , 深耕技術創新 , 連接全球前沿技術 , 攜手伙伴共建生態 , 為國內“AI+”產業升級構建堅實的智能計算基石 。

    推薦閱讀