【導讀】許多嵌入式系統部署在操作人員難以或無法接近的地方。物聯網(IoT)應用尤其如此,這些應用通常大量部署并且電池壽命有限。實例包括監控人員或機器健康狀況的嵌入式系統。這些挑戰加上快速迭代的軟件生命周期,導致許多系統需要支持無線(OTA)更新。OTA更新用新軟件替換嵌入式系統的微控制器或微處理器上的軟件。雖然很多人非常熟悉移動設備上的OTA更新,但在資源受限的系統上設計和實施會帶來許多不同的挑戰。本文將介紹針對OTA更新的若干不同軟件設計,并討論其優缺點。我們將了解OTA更新軟件如何利用兩款超低功耗微控制器的硬件特性。
構建模塊
服務器和客戶端
OTA更新用新軟件替換器件上的當前軟件,新軟件以無線方式下載。在嵌入式系統中,運行此軟件的器件通常是微控制器。微控制器是一種小型計算器件,其存儲器、速度和功耗均很有限。微控制器通常包含微處理器(核心)和用于執行特定操作的數字硬件模塊(外設)。工作模式下典型功耗為30μA/MHz至40μA/MHz的超低功耗微控制器是此類應用的理想選擇。使用這些微控制器上的特定硬件外設并將其置于低功耗模式,是OTA更新軟件設計的重要組成部分。圖1顯示了一個可能需要OTA更新的嵌入式系統實例。可以看到,一個微控制器與無線電和傳感器相連,這可用在物聯網應用中,利用傳感器收集有關環境的數據,并利用無線電定期報告數據。系統的這一部分稱為邊緣節點或客戶端,是OTA更新的目標。系統的另一部分稱為云或服務器,是新軟件的提供者。服務器和客戶端利用收發器(無線電)通過無線連接進行通信。
圖1.示例嵌入式系統中的服務器/客戶端架構
何為軟件應用程序?
OTA更新過程的大部分操作是將新軟件從服務器傳輸到客戶端。軟件從源格式轉換為二進制格式之后,作為一個字節序列進行傳輸。轉換過程會編譯源代碼文件(例如c、cpp),將其鏈接成一個可執行文件(例如exe、elf),然后將可執行文件轉換為可移植的二進制文件格式(例如bin、hex)。概言之,這些文件格式包含一個字節序列,此字節序列屬于微控制器中存儲器的特定地址。通常,我們將通過無線鏈路發送的信息概念化為數據,例如更改系統狀態的命令或系統收集的傳感器數據。就OTA更新而言,數據就是二進制格式的新軟件。在很多情況下,二進制文件非常大,無法通過單次傳輸從服務器發送到客戶端,這意味著需要將二進制文件放入多個不同的數據包中,此過程稱為“分包”。為了更好地說明此過程,圖2演示了軟件的不同版本如何生成不同的二進制文件,從而在OTA更新期間發送不同的數據包。在這個簡單例子中,每個數據包包含8字節數據,前4個字節表示客戶端存儲器中用來存儲后4個字節的地址。
主要挑戰
基于對OTA更新過程的這種高層次描述,OTA更新解決方案必須應對三大挑戰。第一個挑戰與存儲器有關。軟件解決方案必須將新軟件應用程序組織到客戶端器件的易失性或非易失性存儲器中,以便在更新過程完成時可以執行它。解決方案必須確保將前一版本的軟件保留為后備應用程序,以防新軟件出現問題。此外,當復位和斷電重啟時,我們必須讓客戶端器件的狀態——例如當前運行的軟件版本以及它在存儲器中的位置——保持不變。第二大挑戰是通信。新軟件必須以離散數據包的形式從服務器發送到客戶端,每個數據包都要放在客戶端存儲器中的特定地址。分包方案、數據包結構和數據傳輸協議必須在軟件設計中考慮周全。最后一個主要挑戰是安全性。當新軟件以無線方式從服務器發送到客戶端時,我們必須確保服務器是可信任方。這種安全挑戰稱為身份驗證。我們還必須對新軟件進行模糊處理以防觀察者偷窺,因為其中可能包含敏感信息。這種安全挑戰稱為保密。安全性的最后一個要素是完整性,即確保新軟件在通過無線方式發送時不會損壞。
圖2.軟件應用程序的二進制轉換和分包過程
第二階段引導加載程序(SSBL)
了解引導序列
主引導加載程序是一種軟件應用程序,永久駐留在微控制器的只讀存儲器中。主引導加載程序所在的存儲區域稱為信息空間,有時用戶無法訪問。每次復位都會執行該應用程序,一般完成一些必要的硬件初始化,并且可能將用戶軟件加載到存儲器中。但是,如果微控制器包含片內非易失性存儲器(如閃存),則引導加載程序不需要進行任何加載,只需將控制權轉移到閃存中的程序即可。如果主引導加載程序不支持OTA更新,則必須有第二階段引導加載程序。與主引導加載程序一樣,SSBL會在每次復位時運行,但將實施OTA更新過程的一部分。此引導序列如圖3所示。本節將說明為什么需要第二階段引導加載程序,并解釋如何指定此應用程序的作用是一個重要設計權衡。
經驗教訓:務必有一個SSBL
從概念上講,省略SSBL并將所有OTA更新功能放入用戶應用程序似乎更簡單,因為這樣的話,OTA過程可以無縫利用現有的軟件框架、操作系統和設備驅動程序。圖4顯示了一個選擇此方法的系統的存儲器映射和引導序列。
應用程序A是部署在現場微控制器上的原始應用程序。此應用程序包含OTA更新相關軟件,當服務器請求時,利用該軟件可下載應用程序B。下載完成且應用程序B經過驗證之后,應用程序A將對應用程序B的復位處理程序執行分支指令,以將控制權轉移給應用程序B。復位處理程序是一小段代碼,用作軟件應用程序的入口點,并在復位時運行。在這種情況下,復位是通過執行一個分支來模擬,這相當于函數調用。這種方法有兩大問題:
● 許多嵌入式軟件應用程序采用實時操作系統(RTOS),其允許將軟件拆分為多個并發任務,每個任務在系統中具有不同的職責。例如,圖1所示的應用程序可能有用于讀取傳感器的RTOS任務,對傳感器數據運行某種算法的RTOS任務,以及與無線電接口的RTOS任務。RTOS本身始終處于活動狀態,負責根據異步事件或特定的基于時間的延遲切換這些任務。因此,從RTOS任務分支到新程序是不安全的,因為其他任務會在后臺繼續運行。對于實時操作系統,終止某個程序的唯一安全方法是通過復位。
圖3.使用SSBL的存儲器映射和引導流程示例
圖4.沒有SSBL的存儲器映射和引導流程示例
● 基于圖4,上述問題的解決辦法是讓主引導加載程序分支到應用程序B而不是應用程序A。但在某些微控制器上,主引導加載程序總是運行具有中斷向量表(IVT)的程序;IVT是應用程序的一個關鍵部分,描述中斷處理函數,位于地址0。這意味著必須以某種形式重定位IVT,使其復位映射到應用程序B。如果在IVT重定位期間發生斷電重啟,則系統可能會處于永久破損狀態。
將SSBL固定在地址0可以解決這些問題,如圖3所示。SSBL不是RTOS程序,因此可以安全地分支到新應用程序。地址0處的SSBL的IVT永遠不會重新定位,所以不必擔心斷電重啟會將系統置于災難性狀態。
設計權衡:SSBL的作用
我們花了很多時間討論SSBL及其與應用軟件的關系,但SSBL程序有何作用?至少,該程序必須確定當前應用程序是什么(其開始位置),然后分支到該地址。微控制器存儲器中各種應用的位置一般保存在目錄(ToC)中,如圖3所示。這是持久內存中的一個共享區域,SSBL和應用軟件均利用它來相互通信。當OTA更新過程完成時,新的應用程序信息會更新ToC。OTA更新功能的某些部分也可以被推送到SSBL。開發OTA更新軟件時,確定推送哪些部分是重要的設計決策。上述最小SSBL將非常簡單,易于驗證,并且在應用程序的生命周期中很可能不需要修改。但是,這意味著每個應用程序都要負責下載和驗證下一個應用程序。這可能導致無線電堆棧、設備固件和OTA更新軟件的代碼重復。另一方面,我們可以選擇將整個OTA更新過程推送到SSBL。在這種情況下,應用程序只需在ToC中設置一個標志以請求更新,然后執行復位。SSBL隨后執行下載序列和驗證過程。這將最大限度地減少代碼重復并簡化應用專用軟件。然而,這會引入一個新的挑戰,那就是可能需要更新SSBL本身(即更新更新代碼)。最終,決定SSBL中放置哪些功能將取決于客戶端器件的存儲器限制、下載的應用程序之間的相似性以及OTA更新軟件的可移植性。
設計權衡:緩存和壓縮
OTA更新軟件中的另一個關鍵設計決策是在OTA更新過程中如何組織存儲器中傳入的應用程序。微控制器上通常有兩類存儲器:非易失性存儲器(例如閃存)和易失性存儲器(例如SRAM)。閃存用于存儲應用程序的程序代碼和只讀數據,以及其他系統級數據,例如ToC和事件日志。SRAM用于存儲軟件應用程序的可修改部分,例如非常數全局變量和堆棧。圖2所示的軟件應用程序二進制文件僅包含非易失性存儲器中存在的程序的某些部分。在啟動例程期間,應用程序將初始化屬于易失性存儲器的部分。
在OTA更新過程中,每次客戶端器件從服務器收到一個包含該二進制文件一部分的數據包時,便會將其存儲到SRAM中。該數據包可以是壓縮的,也可以是未壓縮的。壓縮應用程序二進制文件的好處是文件會變小,從而要發送的數據包會減少,下載過程中存儲數據包所需的SRAM空間相應地減小。這種方法的缺點是壓縮和解壓縮會增加更新過程的處理時間,并且必須在OTA更新軟件中捆綁壓縮相關代碼。
新應用軟件屬于閃存,但在更新過程中到達SRAM,因此OTA更新軟件需要在更新過程中的某個時刻執行對閃存的寫操作。暫時將新應用程序存儲在SRAM中的操作稱為緩存。概言之,OTA更新軟件可以采取三種不同的緩存方法。
● 不緩存:每次包含新應用程序一部分的數據包到達時,便將其寫入閃存中的目標位置。這種方案非常簡單,可以最大限度地減少OTA更新軟件中的邏輯數量,但要求完全擦除新應用程序對應的閃存區域。此方法會消磨閃存并增加開銷。
● 部分緩存:保留一個SRAM區域用于緩存,當新數據包到達時,將其存儲在該區域中。當該區域填滿時,將數據寫入閃存以清空該區域。如果數據包無序到達或新應用程序二進制文件中存在間隙,這種方案可能會變得很復雜,因為需要一種方法來將SRAM地址映射到閃存地址。一種策略是讓緩存充當閃存一部分的鏡像。閃存被劃分為若干稱為頁面的小區域,這是可供擦除的最小區域。得益于這種自然劃分,一個好辦法是在SRAM中緩存閃存的一頁,當其填滿或下一數據包屬于其他頁面時,便將該頁寫入閃存以清空緩存。
● 完全緩存:在OTA更新過程中將整個新應用程序存儲在SRAM中,只有從服務器完全下載好新應用程序之后才將其寫入閃存。這種方法克服了前述方法的缺點,寫入閃存的次數最少,OTA更新軟件無需復雜的緩存邏輯。但是,這會限制所下載新應用程序的大小,因為系統的可用SRAM量通常遠小于可用閃存量。
圖5.使用SRAM緩存閃存的一頁
圖5顯示了OTA更新過程中的第二種方案——部分緩存,來自圖3和圖4的應用程序A所對應的閃存部分被放大,并且顯示了用于SSBL的SRAM的功能存儲器映射。示例閃存頁面大小為2 kB。最終,此設計決策將取決于新應用程序的大小和OTA更新軟件容許的復雜度。
安全和通信
設計權衡:軟件與協議
OTA更新解決方案還必須解決安全和通信問題。如圖1所示,許多系統會在硬件和軟件中實現通信協議,以支持系統的普通(非OTA更新相關)操作,例如交換傳感器數據。這意味著服務器和客戶端之間已經建立了(可能是安全的)無線通信的方法。類似圖1所示的嵌入式系統可以使用的通信協議有低功耗藍牙® (BLE)或6LoWPAN等。有時候,這些協議支持安全性和數據交換,OTA更新軟件在OTA更新過程中可以利用。
OTA更新軟件中必須構建的通信功能量最終將取決于現有通信協議提供的抽象程度。現有通信協議具有用于在服務器和客戶端之間發送和接收文件的工具,OTA更新軟件可以簡單地將該工具用于下載過程。但是,如果通信協議較為原始,只有發送原始數據的工具,那么OTA更新軟件可能需要執行分包處理,并提供元數據和新應用程序二進制文件。這也適用于安全挑戰。如果通信協議不支持,OTA更新軟件可能要負責對無線保密發送的字節進行解密。
總之,在OTA更新軟件中實施哪些功能,例如自定義數據包結構、服務器/客戶端同步、加密和密鑰交換等,將取決于系統的通信協議提供了什么內容以及對安全性和穩健性的要求。下一節將提出一個完整的安全解決方案,其解決了之前介紹的所有挑戰,我們將展示如何在此解決方案中利用微控制器的加密硬件外設。
解決安全挑戰
我們的安全解決方案需要讓新應用程序以無線方式保密發送,檢測新應用程序中的任何損壞,并驗證新應用程序是從受信任的服務器而不是惡意方發送的。這些挑戰可通過加密操作來解決。具體而言,該安全解決方案可以使用兩種加密操作:加密和哈希處理。加密使用客戶端和服務器共享的密鑰(密碼)來對無線發送的數據進行模糊處理。微控制器的加密硬件加速器可能支持的特定加密類型是AES-128或AES-256,具體取決于密鑰大小。除了加密數據,服務器還可以發送一個摘要以確保沒有損壞。摘要通過對數據包進行哈希處理來生成,這是一種用于生成唯一代碼的不可逆數學函數。在服務器產生消息或摘要之后,如果其任何部分遭到修改,比如在無線通信期間有一位發生翻轉,則客戶端在對數據包執行相同的哈希函數處理并比較摘要時,會注意到此修改。微控制器的加密硬件加速器可能支持的特定哈希處理類型是SHA-256。圖6顯示了微控制器中的加密硬件外設的框圖,OTA更新軟件駐留在Cortex-M4應用層中。此圖還顯示了其支持將受保護密鑰存儲在外設中,OTA更新軟件解決方案可以利用這一點來安全存儲客戶端密鑰。
圖6.ADuCM4050上的加密加速器的硬件框圖
解決身份驗證這一最終挑戰的常見技術是使用非對稱加密。對于此操作,服務器會生成一個公鑰-私鑰對。私鑰只有服務器知道,客戶端知道公鑰。服務器使用私鑰可以生成給定數據塊的簽名,例如要無線發送的數據包的摘要。簽名被發送給客戶端,后者可以使用公鑰驗證簽名。這樣,客戶端就能確認消息是從服務器而不是惡意第三方發送的。此序列如圖7所示,實線箭頭表示函數輸入/輸出,虛線箭頭表示無線發送的信息。
圖7.使用非對稱加密驗證消息
多數微控制器沒有用于執行這些非對稱加密操作的硬件加速器,但可以使用Micro-ECC等專門針對資源受限器件的軟件庫來實現。該庫需要一個用戶定義的隨機數生成功能,這可以利用微控制器上的真隨機數發生器硬件外設來實現。雖然這些非對稱加密操作解決了OTA更新期間的信任挑戰,但是會消耗大量處理時間,并且需要將簽名與數據一同發送,這會增加數據包大小。我們可以在下載結束時使用最后數據包的摘要或整個新軟件應用程序的摘要執行一次此檢查,但如此的話,第三方將能把不受信任的軟件下載到客戶端,這不太理想。理想情況下,我們希望驗證所收到的每個數據包都來自我們信任的服務器,而且沒有每次都需要簽名的開銷。這可以利用哈希鏈來實現。
哈希鏈將本節討論的加密概念整合到一系列數據包中,以便在數學上將它們聯系在一起。如圖8所示,第一個數據包(編號0)包含下一個數據包的摘要。第一個數據包的有效載荷不是實際的軟件應用程序數據,而是簽名。第二個數據包(編號1)的有效載荷包含二進制文件的一部分和第三個數據包(編號2)的摘要。客戶端驗證第一個數據包中的簽名并緩存摘要H0以供以后使用。當第二個數據包到達時,客戶端對有效載荷進行哈希處理并將其與H0進行比較。如果它們匹配,客戶端便可確定該后續數據包來自可信服務器,而無需費力進行簽名檢查。生成此鏈的高開銷任務留給服務器完成,客戶端只需在每個數據包到達時進行緩存和哈希處理,確保到達的數據包完整無損并驗明正身。
圖8.將哈希鏈應用于數據包序列
實驗設置
解決本文所述存儲器、通信和安全設計挑戰的超低功耗微控制器是ADuCM3029和ADuCM4050.這些微控制器包含本文討論的用于OTA更新的硬件外設,例如閃存、SRAM、加密加速器和真隨機數發生器。這些微控制器的器件系列包(DFP)為在這些器件上構建OTA更新解決方案提供了軟件支持。DFP包含外設驅動,以便為使用硬件提供簡單靈活的接口。
硬件配置
為了驗證本文討論的概念,我們利用ADuCM4050創建了OTA更新軟件參考設計。對于客戶端,一個ADuCM4050 EZ-KIT®使用收發器子板馬蹄形連接器連接到ADF7242。客戶端器件如圖9左側所示。對于服務器,我們開發了一個在Windows PC上運行的Python應用程序。Python應用程序通過串行端口與另一個ADuCM4050 EZ-KIT通信,后者也以與客戶端相同的配置連接一個ADF7242。但是,圖9中右邊的EZ-KIT不執行OTA更新邏輯,只是將從ADF7242接收到的數據包中繼給Python應用程序。
圖9.實驗硬件設置
軟件組件
軟件參考設計對客戶端器件的閃存進行分區,如圖3所示。主要客戶端應用程序具有非常好的移植性和可配置性,以便其他方案或其他硬件平臺也可以使用。圖10顯示了客戶端器件的軟件架構。請注意,雖然我們有時將整個應用程序稱為SSBL,但在圖10中,并且從現在開始,我們在邏輯上將真正的SSBL部分(藍色)與OTA更新部分(紅色)分開,因為后者不一定需要完全在上述應用程序中實現。圖10所示的硬件抽象層使OTA客戶端軟件可移植并獨立于任何底層庫(以橙色顯示)。
圖10.客戶端軟件架構
軟件應用程序實現圖3中的引導序列(一個用于從服務器下載新應用程序的簡單通信協議)和哈希鏈。通信協議中的每個數據包都有12字節的元數據頭、64字節的有效載荷和32字節的摘要。此外,它還有如下特性:
● 緩存:根據用戶配置,支持不緩存或緩存閃存的一頁。
● 目錄:ToC設計為僅容納兩個應用程序,并且新應用程序總是下載到最舊的位置,以保留一個備用應用程序。這稱為A/B更新方案。
● 消息傳遞:支持ADF7242或UART進行消息傳遞,具體取決于用戶配置。使用UART進行消息傳遞可免除圖9左側的EZ-KIT,僅保留右側套件用于客戶端。這種有線更新方案對初始系統啟動和調試很有用。
結果
除了滿足功能要求并通過各種測試之外,軟件的性能對于判斷項目成功與否也很重要。通常使用兩個指標來衡量嵌入式軟件的性能:占用空間和周期數。占用空間是指軟件應用程序在易失性(SRAM)和非易失性(閃存)存儲器中占用的空間大小。周期數是指軟件執行特定任務所使用的微處理器時鐘周期數。它與軟件運行時間相似,但在執行OTA更新時,軟件可能進入低功耗模式,此時微處理器處于非活動狀態,不消耗任何周期。雖然軟件參考設計沒有針對任何一個指標進行優化,但它們對于程序基準測試和比較設計權衡非常有用。
圖11和圖12顯示了在ADuCM4050上實現的OTA更新軟件參考設計的占用空間(不緩存)。這些圖根據圖10所示的組件進行劃分。如圖11所示,整個應用程序使用大約15 kB的閃存。鑒于ADuCM4050包含512 kB閃存,此占用空間非常小。真正的應用軟件(為OTA更新過程開發的軟件)僅需1.5 kB左右,其余用于庫,例如DFP、Micro-ECC和ADF7242堆棧。這些結果有助于說明SSBL應在系統中扮演什么角色的設計權衡。15 kB占用空間的大部分是用于更新過程。SSBL本身僅占用大約500字節的空間,另外還有1 kB到2 kB的DFP代碼,用于訪問閃存驅動器之類的器件。
圖11.閃存占用空間(字節)
圖12.SRAM占用空間(字節)
為了評估軟件的開銷,我們在每次接收數據包時計數周期,然后計算每個數據包平均消耗的周期數。每個數據包都需要AES-128解密、SHA-256哈希處理、閃存寫入和某種數據包元數據驗證。數據包有效載荷為64字節且不緩存時,處理單個數據包的開銷為7409個周期。使用26 MHz內核時鐘時,大約需要285微秒的處理時間。該值是利用ADuCM4050 DFP中的周期計數驅動程序計算的(未調整周期數),并且是100 kB二進制文件下載期間(約1500個數據包)的平均值。為使每個數據包的開銷最小,DFP中的驅動程序應利用ADuCM4050上的直接存儲訪問(DMA)硬件外設來執行總線事務,并且驅動程序在每次事務處理期間將處理器置于低功耗休眠狀態。每個事務中不存在一個萬能的狀態如果我們禁用DFP中的低功耗休眠并將總線事務更改為不使用DMA,則每個數據包的開銷將增加到17,297個周期。這說明了高效使用器件驅動程序對嵌入式軟件應用程序是有影響的。雖然減少每個數據包的數據字節數也可以降低開銷,但每個數據包的數據字節數翻一倍達到128時,周期數僅有少量增加,相同實驗得到的周期數為8362。
周期數和占用空間也解釋了先前討論的權衡——緩存數據包數據而不是每次都寫入閃存。使能緩存一頁閃存后,每個數據包的開銷從7409減少到5904個周期。此20%減幅來自于更新過程跳過了大多數數據包的閃存寫入,僅在緩存已滿時才執行閃存寫入。其代價是SRAM占用面積增加。不使用緩存時,HAL只需要336個字節的SRAM,如圖12所示。但是,當使用緩存時,必須保留一個相當于閃存一整頁的空間,故SRAM占用增加到2388字節。HAL使用的閃存也會少量增加,原因是需要額外代碼來判斷緩存何時必須清空。
這些結果證明,設計決策對軟件性能會有切實的影響。不存在一個萬能的解決方案,每個系統都有不同的要求和約束,OTA更新軟件需要視具體情況具體對待。希望本文闡明了在設計、實現和驗證OTA更新軟件解決方案時遇到的常見問題和權衡。
參考文獻
Nilsson、Dennis Kengo和Ulf E. Larson。“智能車輛的無線安全固件更新”。ICC研討會——2008年IEEE國際通信會議,2008年5月。
Benjamin Bucklin Brown
Benjamin Bucklin Brown [benjamin-b.brown@analog.com]于2016年從麥吉爾大學畢業并獲得電氣工程學士學位后加入ADI公司。目前他在消費電子檢測與處理技術(CSPT)部門工作,擔任嵌入式軟件工程師,為專用集成電路開發固件。此前,他曾在物聯網平臺技術部門工作,為ADuCM3029和ADuCM4050微控制器開發器件驅動程序和軟件參考應用程序。
推薦閱讀: