【導讀】人工智能 (AI)、機器學習 (ML) 和物聯網 (IoT) 網絡邊緣的其他計算密集型工作負載的興起給微控制器 (MCU) 帶來了額外的處理負載。 即使設計人員被要求最大限度地降低功耗并加快上市時間,處理這些新的工作負載也會增加功耗。
人工智能 (AI)、機器學習 (ML) 和物聯網 (IoT) 網絡邊緣的其他計算密集型工作負載的興起給微控制器 (MCU) 帶來了額外的處理負載。 即使設計人員被要求最大限度地降低功耗并加快上市時間,處理這些新的工作負載也會增加功耗。
設計人員需要一種計算選項,既能保持 MCU 的效率,又能添加專門針對低功耗用例定制的高性能功能。 此選項還應保留與傳統 MCU 相關的簡單部署模型,同時添加足夠的功能來支持 AI 和 ML 啟用的復雜應用程序,例如語音控制和預測性維護。
本文討論了推動人工智能和機器學習需求的因素,并解釋了為什么需要新的處理器架構來有效地提供這些功能。 然后介紹瑞薩電子的 RA8M1 MCU 系列,并展示如何使用它來滿足這些要求。
邊緣AI和ML的要求
從樓宇自動化、工業設備到家用電器,邊緣物聯網應用對人工智能和機器學習的需求不斷增加。 即使是相對較小的低功耗嵌入式系統現在也承擔著關鍵字識別、語音命令控制和音頻/圖像處理等工作負載。 目標應用包括傳感器集線器、無人機導航和控制、增強現實 (AR)、虛擬現實 (VR) 和通信設備。
為了最大限度地減少能源使用、開銷和延遲,同時確保隱私,通常首選在邊緣處理數據,而不是將其發送到云端。 這對設計人員來說是一個挑戰,因為邊緣設備通常資源有限,特別是在電池供電時。
用于邊緣計算的增強型 MCU
AI 和 ML 工作負載通常涉及在大型數據集中重復執行相同的數學運算。 這些工作負載可以使用單指令、多數據 (SIMD) 處理進行加速。 SIMD 并行執行多項數學運算,與傳統處理相比,可提供更高的吞吐量和更高的能效。
由于傳統 MCU 缺乏 SIMD 功能,因此它們需要幫助執行 AI 和 ML 工作負載。 一種解決方案是與 MCU 一起使用數字信號處理器 (DSP) 或其他 SIMD 加速器。 然而,這種多處理器方法使系統設計變得復雜。
另一種選擇是改用配備 SIMD 功能的更高性能微處理器單元 (MPU)。 這可以在單處理器設置中提供必要的性能,但 MPU 在功耗和功能集方面需要權衡。 例如,并非所有 MPU 都旨在提供面向 MCU 的應用程序所需的確定性、低延遲計算。
在 MCU 中啟用 AI 和 ML
瑞薩電子認識到需要一套優化的 MCU 來支持 AI 和 ML 工作負載,因此推出了 RA8M1 MCU 系列(圖 1)。 該系列基于配備 Helium 和 TrustZone 的 Arm Cortex-M85 架構,運行頻率為 480 兆赫 (MHz),典型功耗為 225μA/MHz。
圖 1:Renesas RA8M1 MCU 基于 Arm Cortex-M85,并采用 Helium 技術來加速 AI 和 ML 處理。 (圖片來源:瑞薩)
RA8M1 MCU 專為高性能和低功耗而設計,具有確定性、短中斷時間和最先進的電源管理支持等功能。 該處理器的性能效率達到 6.39 CoreMark/MHz。
Helium 是一種 SIMD M-Profile 矢量擴展 (MVE),可顯著加速信號處理和 ML。 它添加了 150 個標量和向量指令,并支持 128 位寄存器的處理(圖 2)。 它針對資源受限、低功耗的微控制器進行了優化。 例如,Helium 重用浮點單元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。 這有助于降低處理器的功耗并降低設計復雜性。
圖 2:Helium 重用 FPU 寄存器組進行矢量處理。 (圖片來源:Arm)
如圖 3 所示,RA8M1 的 Cortex-M85 包含 Arm 的 TrustZone 技術。 TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。 Cortex-M85 還添加了新的安全保障功能,例如指針身份驗證和分支目標識別 (PACBTI) 擴展。 這些安全功能在設備可能與個人數據交互的人工智能環境中特別有價值。
圖 3:Cortex-M85 的 TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。 (圖片來源:Arm)
支持 AI 的 MCU 需要具備的硬件功能
一個MCU 應將高效性能與強大的功能集結合起來,以支持人工智能應用。 RA8M1 配備齊全,適用于電機控制、可編程邏輯控制 (PLC)、計量以及其他工業和物聯網應用。
例如,人工智能算法需要大量內存。 RA8M1 系統存儲器包括高達 2 兆字節 (Mbytes) 的閃存和 1 MB 的 SRAM。其中SRAM 包括 128 KB 的緊耦合存儲器 (TCM),可實現快速存儲器訪問以實現高性能計算。
為了確保可靠運行,384 KB 的用戶 SRAM 和整個 128 KB TCM 被配置為糾錯碼 (ECC) 存儲器。 32 KB 指令和數據高速緩存也受 ECC 保護。
除了 Arm 內核中包含的功能之外,RA8M1 還包含多種安全功能。 其中包括用于安全數據處理的可重編程安全知識產權 (RSIP) 加密引擎、用于關鍵數據保護的不可變存儲以及篡改保護機制。
對于通信接口,MCU 配備了用于網絡連接的以太網、用于汽車和工業應用的控制器局域網靈活數據速率 (CAN FD) 以及用于一般連接的 USB 高速/全速。 它還集成了一個攝像頭接口和一個八進制串行外設接口 (SPI),可對外部存儲器進行動態解密。
模擬接口包括 12 位模數轉換器 (ADC) 和數模轉換器 (DAC)、高速模擬比較器以及三個采樣保持電路。 對于串行通信,RA8M1 支持多種協議,包括帶 SPI 的串行通信接口 (SCI)、通用異步接收器/發送器 (UART) 和I2C。 該 MCU 還提供改進的I3C,以提高數據傳輸速率和效率。
需要完全訪問這些輸入/輸出 (I/O) 功能的開發人員,可以使用球柵陣列 (BGA) 封裝,例如 224 引腳 R7FA8M1AHECBD#UC0。 尋求更簡化的印刷電路板 (PC 板) 設計和組裝流程的用戶可以考慮使用薄型四方扁平封裝 (LQFP) 選項,例如 144 引腳 R7FA8M1AHECFB#AA0。
AI應用程序的開發環境
有興趣嘗試 RA8M1 系列的設計人員可以從 EK-RA8M1 R7FA8M 評估板開始(圖 4)。 該板包括一個 RJ45 RMII 以太網接口、一個 USB 高速主機和設備接口以及一個三引腳 CAN FD 接頭。 對于存儲器,它具有 64 MB 八進制 SPI 閃存。
圖 4:EK-RA8M1 評估板具有強大的 I/O 支持來測試 RA8M1 MCU。 (圖片來源:瑞薩)
RA8M1 由瑞薩FSP支持,這是一個綜合框架,旨在為嵌入式系統設計提供用戶友好、可擴展且高質量的軟件基礎。
該軟件包提供了開發工具,包括基于流行的 Eclipse IDE 的 e2 studio 集成開發環境 (IDE)。 它還包含兩個著名的免版稅實時操作系統:Azure RTOS 和 FreeRTOS。
該軟件包包括輕量級、生產就緒的驅動程序,支持嵌入式系統中的常見用例。 這些驅動程序與評估板相結合,為開發人員提供了快速試驗 RA8M1 I/O 的途徑。
結論
RA8M1 為開發人員提供了在邊緣物聯網應用中實施 AI 和 ML 工作負載的新選擇,從而節省功耗、增強性能、降低復雜性并縮短上市時間。
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯系小編進行處理。
推薦閱讀: