MCU,智能覺醒

MCU,智能覺醒

文章圖片


根據IoT Analytics的報告 , 全球物聯網MCU市場規模預計到2030年將達到73億美元 , 年復合增長率約為6.3% 。 這一增長主要得益于自動化升級需求的釋放、LPWAN項目的推動、AI向邊緣遷移的趨勢以及亞洲尤其是中國市場的快速增長 。 AI技術的融入正在徹底改寫MCU的生存邏輯 。 而AI技術的深度融入 , 正從底層改寫MCU的技術邏輯與市場格局 , 催生出兼具低功耗、實時性與智能推理能力的AI MCU , 成為物聯網智能化發展的載體 。

AI MCU通過集成神經網絡處理單元(NPU)、擴展專用指令集等方式 , 實現了邊緣端的本地智能推理 , 精準匹配了智能設備對低功耗、高實時性和高性價比的需求 。 這不僅推動了MCU產品的升級 , 更讓市場競爭愈發激烈 , 國內外各大芯片廠商紛紛加大研發投入 , 推出各具技術特色的AI MCU產品 , 加速邊緣智能應用的落地 。
01Arm:構筑AI MCU核心技術底座
作為全球領先的處理器架構設計公司 , Arm的內核產品線覆蓋了從高性能計算到低功耗嵌入式應用的全場景 , 自1990年成立以來 , 已形成Cortex-A、Cortex-M、Cortex-R三大系列產品 , 以及面向服務器/基礎設施的Neoverse系列 , 各系列基于ARMv7、ARMv8、ARMv9等不同架構版本設計 , 針對專屬應用場景完成深度優化 。
【MCU,智能覺醒】其中 , Cortex-M系列是微控制器(MCU)和嵌入式系統的核心處理器內核 , 以低功耗、高實時性和高成本效益為核心特性 , 支持單周期指令執行、納秒級快速中斷響應 , 最小內核尺寸僅0.01mm2 , 搭配Thumb-2指令集 , 無MMU且可運行RTOS , 是目前絕大多數MCU產品的技術基石 , 也成為Arm布局AI MCU的核心切入點 。
為了讓Cortex-M系列具備更強的AI計算能力 , Arm推出了一系列專屬技術與內核產品 。 2019年 , Arm發布適用于Armv8M架構的Cortex-M矢量擴展技術(MVE)——Arm Helium技術 , 作為Armv8.1-M架構的擴展 , 該技術通過高效的SIMD(單指令多數據)操作 , 為機器學習(ML)和數字信號處理(DSP)應用帶來顯著性能提升 , 在機器學習任務中可實現最高15倍的性能突破 。 而Arm Helium Utils作為CMSIS DSP庫的組成部分 , 還為該技術提供了一系列實用函數 , 進一步優化DSP和ML任務的處理效率 。
Cortex-M55和Cortex-M85是首批支持Helium技術的處理器 , 讓小型、低功耗的嵌入式系統能夠應對音頻設備、傳感器集線器、關鍵詞識別、靜態圖像處理等場景的計算挑戰 , 也讓基于Arm內核的MCU具備更強的AI處理能力 。 2023年 , Arm再度推出專為AI應用設計的Cortex-M52處理器 , 不僅實現了能效的進一步提升 , 成為Cortex-M3、Cortex-M33等主流MCU內核的替代選擇 , 更借助Helium技術實現了DSP和ML處理能力的顯著升級 , 將AI驅動的創新引入更多低功耗嵌入式場景 。
除了內核本身的升級 , Arm還推出了面向Cortex-M系列的microNPU——Ethos-U55 , 專為面積受限的嵌入式和物聯網設備設計 , 可大幅加速ML推理性能 。 當Ethos-U55與Cortex-M55協同部署時 , 相較于傳統的Cortex-M系統 , 機器學習性能可提升高達480倍 , 為低成本、高能效的AI MCU解決方案提供了支撐 。
在國內 , 安謀科技也基于Arm架構完成了本土化創新 , 其自主研發的第三代高能效嵌入式芯片IP“星辰”STAR-MC3 , 基于Arm v8.1-M架構打造 , 向前兼容傳統MCU架構 , 同時集成Arm Helium 技術 , 在顯著提升CPU AI計算性能的同時 , 兼顧優異的面效比與能效比 , 成為AIoT領域主控芯片及協處理器的核心架構 , 助力客戶高效部署端側AI應用 。
02RISC-V:AI MCU的另一技術路線
除了Arm架構 , RISC-V憑借開源、靈活的特性 , 成為AI MCU的另一重要技術選擇 , 其矢量擴展(RVV)技術可讓處理器內核加速海量數據集的單指令流計算 , 完美適配機器學習、圖像壓縮處理、數據加密、音視頻多媒體處理、語音識別和自然語言處理等任務——而這些正是物聯網端側AI落地的核心計算需求 , 也吸引了眾多企業基于RISC-V架構打造AI MCU產品 , 形成與Arm架構互補的技術格局 。
如今 , 谷歌已通過與合作方Synaptics共同將基于RISC-V的Coral NPU架構推向市場 。 Coral NPU是基于RISC-V指令集架構 , 包含一個四階標量CPU核心、一個32位RISC-V向量引擎以及一個專門為現代Transformer模型優化的矩陣核心加速器 。 谷歌給 Coral NPU 的定位是“一個全棧、開源的平臺 , 旨在解決性能、碎片化和隱私這三大核心挑戰 , 而這些挑戰限制了功能強大、始終在線的 AI 技術在低功耗邊緣設備和可穿戴設備上的應用 。 ”
國內外廠商:AI MCU產品落地加速
依托Arm Helium、RISC-V RVV等技術 , 國內外芯片廠商紛紛推出自研AI MCU產品 , 從高端高算力到入門級解決方案 , 覆蓋不同應用場景 , 推動AI MCU的商業化落地 。
國際大廠:技術領先 , 布局全場景
瑞薩電子的RA8系列作為業界首個基于Arm Cortex-M85內核的MCU系列 , 兼具MPU的高性能與MCU的易用性、低功耗和低BOM成本 , 支持單核或雙核設計 , 最高可實現1GHz的CPU主頻、0.25 TOPS NPU算力 , 還集成了包含EtherCAT在內的多協議工業網 , 可滿足AI、工業以太網、機器人、HMI等高算力應用需求 。 在此基礎上 , 瑞薩推出的RA8P1微控制器產品群 , 采用Cortex-M85(1GHz)+Cortex-M33(250MHz)的雙核異構設計 , 并集成Arm EthosTM-U55 NPU , 借助Arm Helium技術實現了DSP和AI/ML性能的大幅提升 , 樹立了MCU性能的新標桿 。
意法半導體的STM32N6則是首款內嵌自研神經處理單元(NPU)——ST Neural-ART accelerator的STM32 MCU , 專為節能型邊緣AI應用設計 , 其搭載的Arm Cortex-M55內核主頻高達800MHz , 結合Arm Helium向量處理技術顯著增強DSP處理能力 , 芯片整體時鐘頻率可達1GHz , 計算性能達600 GOPS , 能為計算機視覺和音頻應用提供實時神經網絡推理能力 。
恩智浦的i.MX RT700系列則以多內核架構實現智能算力的分層部署 , 該系列擁有5個計算內核 , 主計算子系統包含325MHz的Arm Cortex-M33核與Cadence Tensilica HiFi 4 DSP , 超低功耗感知子系統則搭配第二款Cortex-M33核與Cadence Tensilica HiFi 1 DSP , 無需外部傳感器集線器 , 有效降低系統設計復雜度與BOM成本 。 同時 , 該系列集成恩智浦eIQ Neutron NPU , 可將AI工作處理速度提高172倍 , 還內置7.5MB板載SRAM , 為可穿戴設備、醫療設備、智能家居等邊緣智能設備提供算力支撐 。
英飛凌的PSoC Edge E81、E83、E84系列均基于Arm Cortex-M55內核打造 , 支持Arm Helium DSP指令集 , 同時搭配不同的AI加速單元:E81搭載英飛凌自研超低功耗NNLite神經網絡加速器 , E83和E84則內置Arm Ethos-U55微型NPU , 與傳統Cortex-M系統相比機器學習性能提升480倍 , 且三款產品均集成豐富外設、片上存儲器和硬件安全功能 , 支持WiFi 6、BT/BLE、Matter協議等 , 適配低功耗計算領域的機器學習應用 。
德州儀器則依托DSP技術優勢布局AI MCU , 其C2000 MCU系列的TMS320F28P550 MCU , 搭載150MHz C28x 32位DSP CPU , 集成浮點單元(FPU32)與三角函數加速器(TMU) , 并內置NPU實現邊緣AI計算 , 算力達600–1200 MOPS , 支持本地運行CNN模型 , 適配工業控制等場景的AI需求 。
國內企業:緊跟趨勢 , 本土化適配突出
國內芯片廠商也在AI MCU領域快速突破 , 結合本土物聯網應用場景完成產品優化 , 同時實現了RISC-V架構的落地應用 , 形成差異化競爭優勢 。
新唐科技推出的NuMicro M55M1是定位入門級的AI MCU解決方案 , 專為AI數據識別、智能音頻等邊緣應用打造 , 基于Arm Cortex-M55核心設計 , 搭載Arm Ethos-U55 NPU與Helium向量處理器 , AI運算能力達110 GOPS , 相較于傳統1GHz MCU , AI推理性能實現超100倍突破 , 還內置1.5MB RAM、2MB Flash并支持外擴存儲 。 同時 , 新唐科技還推出自研NuML Tool Kit開發工具 , 并提供人臉識別、物體識別等多款現成AI模型 , 大幅降低AI應用開發門檻 , 加速產品落地 。
國芯科技則聚焦RISC-V架構的AI MCU研發 , 其端側AI MCU芯片CCR4001S已實現10萬顆交貨 , 該芯片采用RISC-V內核 , 主頻230MHz , 集成0.3 TOPS @INT8算力的NPU , 可高效運行MobileNet、ResNet、Yolo等深度學習算法 , 實現物體識別、目標檢測等復雜任務 , 同時兼具低功耗特性 , 尤其適配空調智能控制等家電智能化場景 , 支持客戶自主導入算法模型并完成迭代優化 。 此外 , 國芯科技還與賽昉科技聯合推出CCR7002芯片 , 通過多芯片封裝技術集成高性能SoC與低功耗AI芯片子系統 , 同樣提供0.3TOPS的NPU算力 , 實現RISC-V架構與AI的深度融合 。
樂鑫科技的ESP32-S3則在通用MCU基礎上增加了AI算力支持 , 這款集成2.4GHz Wi-Fi和Bluetooth 5 (LE)的MCU , 搭載Xtensa 32位LX7雙核處理器 , 主頻240MHz , 新增的向量指令可加速神經網絡計算和信號處理 , 開發者通過ESP-DSP、ESP-NN等庫即可實現圖像識別、語音喚醒等AI應用 , 適配智能家居等輕量級邊緣智能場景 。
華為海思則針對家電端側智能化推出Hi3066M , 這款微算力嵌入式AI MCU采用海思自有RISC-V內核 , 內置eAI引擎 , 主頻200MHz , 搭配64KB SRAM和512KB內置Flash , 可適配空調、冰箱、洗衣機等白電的AI節能、智能檢測等場景 , 同時預留了足夠的存儲空間 , 滿足未來5~10年的產品升級需求 , 是華為首款端側eAI芯片 。
03結語
AI與MCU的融合 , 已逐漸從技術探索走向商業化落地 。 隨著邊緣智能需求的持續釋放 , 以及芯片廠商在算力、功耗、成本和開發工具上的不斷優化 , AI MCU將成為更多智能設備的算力載體 , 在智能家居、工業控制、消費電子、醫療設備等領域實現更廣泛的應用 , 推動物聯網產業向更智能、更高效的方向發展 。
值得關注的是 , 中國作為RISC-V生態最核心的推動者與踐行者 , 也是全球RISC-V芯片應用最活躍的國家 。 相較于Arm架構芯片 , 我們所能深入了解的往往僅限于其外設、調試系統、總線結構及指令集 , 卻缺乏有效渠道窺探Cortex-M內核的核心細節 , 無法深入掌握芯片內部流水線等關鍵技術;而RISC-V的開源特性恰好解決了這一痛點 。 更為重要的是 , 它大幅降低了內核學習門檻 , 能夠培養出一大批深入掌握內核技術的專業人才 。
如今 , 在MCU中融入AI功能 , 已成為一件司空見慣的事情 , 這一趨勢也將持續推動邊緣智能產業的深度發展 。
想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!

    推薦閱讀