從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!

從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!

文章圖片

從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!

文章圖片

從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!

文章圖片

從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!

文章圖片

2025 年 11 月 13 日 , 中國上海訊 - 國內領先的芯片IP設計與服務提供商安謀科技(中國)有限公司(以下簡稱“安謀科技Arm China”)今日宣布 , 在上海舉辦“周易”X3 NPU IP新品發布會 。 作為安謀科技Arm China“All in AI”產品戰略下誕生的首款重磅產品 , 以及“AI Arm CHINA”戰略發展方向的關鍵實踐 , “周易”X3 NPU IP基于專為大模型而生的最新DSP+DSA架構 , 致力于打造端側AI計算效率新標桿 , 在性能、功能與易用性等方面全面躍升 , 面向基礎設施、智能汽車、移動終端、智能物聯網四大領域 , 為加速卡、智能座艙、ADAS(高級駕駛輔助系統)、具身智能、AI PC、AI手機、智能網關、智能IPC(網絡攝像機)等設備帶來前所未有的AI計算體驗 。
安謀科技Arm China產品研發副總裁劉浩
安謀科技Arm China產品研發副總裁劉浩表示:“在‘All in AI’產品戰略的指引下 , 我們將持續加大投入 , 以前瞻性視野整合頂尖研發資源 , 秉持開放合作理念 , 為生態伙伴提供業界領先的從硬件、軟件到服務的端到端解決方案 , 全力賦能伙伴的產品創新和商業化落地 。 ”
“周易”X3 NPU IP新品發布會現場
性能躍遷——前瞻五年布局 , 讓端側大模型“跑得穩、答得順”在半導體IP領域 , “面向未來5年的產品方向進行前瞻布局”已成為行業共識——涵蓋IP研發、芯片及終端產品研發量產 。 安謀科技Arm China深諳這一規律 , 前瞻性地在“周易”X3中采用兼顧CNN與Transformer的通用架構設計 , 支持全算力類型并增強浮點運算FLOPS , 助力實現從定點到浮點計算的關鍵轉變 , 并滿足大模型計算需求 , 為未來5年Gen AI、Agentic AI與Physical AI的端側落地奠定技術基石 。
隨著AI大模型技術的飛速發展 , 智能手機、AI PC和智能汽車等端側設備正迎來AI能力的爆發性需求 。 從多模態語音助手到實時圖像生成 , 從智能座艙交互到輔助駕駛決策 , 端側設備需要承載越來越復雜的AI計算任務 。 然而 , 端側AI部署面臨算力受限、能效要求高、帶寬瓶頸、開發門檻高等多重挑戰——如何在有限的功耗和算力資源下實現大模型的高效運行 , 成為行業亟需突破的關鍵難題 。
“周易”X3基于專為大模型而生的最新DSP+DSA架構 , 從計算效率、帶寬、精度適配、任務處理四大維度實現升級 , 精準解決端側AI大模型運行難題 , 打造端側AI計算效率的新標桿 。
其單Cluster最高支持4個Core , 擁有8~80 FP8 TFLOPS算力且可靈活配置 , 單Core帶寬高達256GB/s 。 相較于“周易”X2產品 , “周易”X3的CNN模型性能提升30%~50% , 多核算力線性度達到70%~80% 。 在同算力規格下 , AIGC大模型能力較上一代產品實現10倍增長 , 這得益于16倍的FP16 TFLOPS、4倍的計算核心帶寬、超過10倍的Softmax和LayerNorm性能提升共同驅動 。
借助這些優化 , 端側大模型推理將更高效:在Llama2 7B大模型實測中 , “周易”X3 NPU IP在Prefill階段算力利用率高達72% , 并在安謀科技Arm China自研的解壓硬件WDC的加持下 , 實現Decode階段有效帶寬利用率超100% , 遠超行業平均水平 , 滿足大模型解碼階段的高吞吐需求 。
“周易”X3 NPU IP新品亮點
此外 , “周易”X3在架構層面實現了多項創新 , 集成以下關鍵特性:

  • 集成自研解壓硬件WDC:使大模型Weight軟件無損壓縮后通過硬件解壓能獲得額外15%~20%等效帶寬提升 。
  • 新增端側大模型運行必備的W4A8/W4A16計算加速模式:對模型權重進行低比特量化 , 大幅降低帶寬消耗 , 支持云端大模型向端側的高效遷移 。
  • 集成AI專屬硬件引擎AIFF(AI Fixed-Function)與專用硬化調度器:實現超低至0.5%的CPU負載與低調度延遲 , 靈活支持端側多任務場景和任意優先級調度場景 , 確保高優先級任務的即時響應 。
  • 支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合計算 , 強浮點計算:可靈活適配智能手機邊緣部署、AI PC推理、智能汽車等從傳統CNN到前沿大模型的數據類型需求 , 平衡性能與能效 。
安謀科技Arm China產品總監鮑敏祺
安謀科技Arm China產品總監鮑敏祺指出:“‘周易’X3遵循‘軟硬協同、全周期服務與成就客戶’的產品準則 , 提供從硬件、軟件到售后服務的全鏈路支持 , 以前瞻性設計、專業團隊交付與深度服務投入 , 全面助力客戶產品成功與商業化落地 。 ”
軟硬協同——從“好用”到“用好 ” , Compass“金牌輔助”提升開發效率“周易”X3 NPU IP不僅提供高性能硬件 , 還配套完善易用的“周易”Compass AI軟件平臺 , 通過“軟硬一體”的協同設計 , 讓開發者從“好用”到“用好” , 顯著提升開發部署效率 。
Compass AI軟件平臺通過覆蓋開發全流程的工具鏈、極致的易用性優化與開放的生態布局 , 破解端側AI開發“適配難、周期長、門檻高”的痛點 。 作為核心工具 , 平臺中的NN Compiler(神經網絡編譯器)集成Parser(模型解析)、Optimizer(優化器)、GBuilder(生成器)及AIPULLM(大模型運行工具) , 可實現主流模型的高效轉化、自動化優化與部署配置生成 , 并具備以下核心能力:
  • 廣泛的框架與模型支持:支持超160種算子與270種模型 , 兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流AI框架 , 提供開箱即用的Model Zoo 。
  • 創新的Hugging Face模型“一鍵部署”:通過AIPULLM工具鏈 , 直接支持Hugging Face格式模型 , 實現“一站式”轉化與部署 , 極大降低開發門檻 。
  • 先進的模型推理優化:實現業界領先的大模型動態shape支持 , 高效處理任意長度輸入序列;同時提供包括Tensor/Channel/Token Level多樣量化方式 , 以及GPTQ等大模型主流量化方案 , 并增加對LLM/VLM/VLA及MoE等模型的高性能支持 , 保障推理精度并實現云到端快速遷移 。
  • 靈活的開發者賦能:提供多種開放接口 , 支持用戶模型與自定義算子的開發與調試;配備豐富的調試工具與Bit精度軟件仿真平臺 , 支持多層次白盒開發與性能調優 , 極大簡化算法移植與部署 。
  • 全面的系統與異構兼容:支持Android、Linux、RTOS、QNX等多種操作系統 , 并通過TVM/ONNX實現SoC異構計算 , 高效調度CPU、GPU、NPU等計算資源 。
安謀科技Arm China積極構建開放生態 , Compass AI軟件平臺中的Parser、Optimizer、Linux Driver、TVM及內部IR格式等核心組件已相繼開源 , 并擁有豐富的調試工具 , 可滿足開發者白盒部署需求 , 且支持更易用的DSL算子編程語言 。 在此基礎上 , 平臺賦予開發者更深度的定制能力:客戶不僅可以使用平臺中的Compiler、Debugger或DSL語言開發出自己的自定義算子 , 也可通過Parser、Optimizer等工具打造出屬于自己的模型編譯器 , 從而實現差異化設計與開發效率提升 。
“周易”NPU Compass AI軟件平臺
不僅如此 , 安謀科技Arm China技術團隊還圍繞“周易”X3 NPU IP和Compass AI軟件平臺的軟硬件協同進行精心設計和反復論證 , 目標是提升客戶最終落地方案的效率和能效 。 例如 , 在“周易”X3 NPU IP的AIFF模塊軟硬件設計中 , 硬件端充分結合軟件使用場景 , 通過增大總線帶寬、增加DMA(直接內存訪問)的outstanding(未處理的指令或數據請求)等方式提升數據搬運、數據并行效率 , 軟件端則針對硬件特性設計專屬使用模式 , 如對模型進行合理切分以充分發揮多核并行優勢 。
安謀科技Arm China NPU產品線負責人兼首席架構師舒浩博士
【從無形IP到AI萬象,安謀科技Arm China“周易”X3 NPU 發布!】安謀科技Arm China NPU產品線負責人兼首席架構師舒浩博士認為:“‘周易’X3的產品優勢 , 源于通用、靈活、高效且軟硬協同的系統架構設計 , 這一設計使其兼具廣泛的行業適用性與靈活的邊端側AI應用場景匹配能力 。 ”
多場景落地——從無形IP到AI萬象 , 端側智能觸手可及新一代“周易”X3 NPU IP將端側智能的邊界拓展至更廣闊的應用場景 , 面向基礎設施、智能汽車、移動終端、智能物聯網四大領域 , 精準匹配當前爆發的端側AI需求 , 可廣泛應用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機、智能網關、智能IPC等AI設備:
  • 基礎設施領域:在加速卡場景中 , “周易”X3 NPU IP支持CNN與大模型等多樣結構的AI模型高效加速 , 為數據中心及邊緣計算節點提供核心算力 。
  • 智能汽車領域:“周易”X3 NPU IP同時賦能智能駕駛與智能座艙:在ADAS系統中 , 可為自動泊車等輔助駕駛功能提供高性能AI算力支持;在IVI(車載信息娛樂系統)中 , 支持基于語音與車內外視頻圖像輸入的智能互動 。
  • 移動終端領域:在AI PC、AI手機上 , “周易”X3 NPU IP可實現超分渲染 , 提升顯示分辨率 , 并支持基于大模型的AI Agent應用 , 為用戶帶來更智能、更流暢的交互體驗 。
  • 智能物聯網領域:在智能網關、智能IPC等設備中 , “周易”X3 NPU IP支持本地AI推理 , 實現更快響應與更智能的終端體驗 , 滿足邊緣設備對實時性與隱私保護的高要求 。
“周易”NPU IP系列家族現場demo展示區
此次發布會現場系統展示了“周易”NPU產品家族的技術演進與落地成果 , 生動詮釋其如何將無形的算力轉化為觸手可及的智能體驗 。
  • “周易”Z1:算力0.32~3.75 TOPS , 賦能AIoT場景 , 廣泛支持人臉識別、人臉及人體關鍵點檢測和文字識別等 , 且已進入AI智能音箱等多種產品 。
  • “周易”Z2/Z3:算力1.25~5 TOPS , 面向AIoT、入門級座艙等市場 , 支持前視輔助駕駛方案、艙泊一體方案及安全儀表盤方案 , 以及圖像超分辨率優化等 。
  • “周易”X1:算力10 TOPS , 面向高端AIoT、汽車座艙等市場 , 支持駕駛員監控、乘客監控、自動泊車、AVM 360環視 , 以及AI圖像降噪等 。
  • “周易”X2:算力10-30 TOPS , 面向高端AIoT、AI PC、AI Pad、手機等市場 , 現場展示了運行Stable Diffusion v1.5的文生圖能力 , 運行CLIP的文搜圖能力 , 可實現端側多模態AI流暢運行 。
  • “周易”X3:算力8-80 FP8 TFLOPS , 面向基礎設施、智能汽車、移動終端、AIoT等市場 , 現場展示了基于“周易”X3的主流大模型效果 , 包括運行DeepSeek-R1-Distill-Qwen-1.5B模型的文生文AI流暢對話 , 運行Stable Diffusion v1.5的文生圖效果 , 運行MiniCPM v2.6模型的圖片識別及圖生文多模態應用等 , 均展現出優異的端側大模型推理性能 。
從“周易”Z1的基礎感知到“周易”X3的復雜認知 , 這一技術演進路徑清晰地表明 , 端側AI正在從單一的功能實現 , 邁向融合多種模型、適應動態場景的“全民普及”新階段 。 “周易”X3 NPU IP的設計充分預判端側AI的“場景深化”趨勢:以極致算力表現破解“多模型融合”的算力需求 , 以全算力類型并增強浮點運算FLOPS適配“精度動態演變”的場景差異 , 借助軟硬協同的生態打造端側算力底座 。
“周易”X3 NPU IP新品發布會現場
“周易”X3 NPU IP的發布 , 標志著安謀科技Arm China“All in AI”產品戰略的正式開啟 。 安謀科技Arm China以“AI Arm CHINA”為戰略發展方向 , 積極響應“AI+”行動計劃 , 持續深耕技術領域創新 , 同時攜手伙伴共建開放生態 , 加快構建國內“AI+”產業升級的智能計算基石 , 為千行百業智能化轉型提供更強IP“核芯”動力 。

    推薦閱讀