【導讀】低能耗藍牙被業界廣泛認為是實現物聯網(IoT)應用愿景的關鍵技術。事實上,極低的功耗使其成為電池供電的物聯網產品最理想的無線通信解決方案,盡管目前低能耗藍牙技術規范還是局限于幾種特定應用,但是,創新的解決方案可促使這項技術拓展到不同的應用領域,例如,多媒體流。按照這個發展方向,本文介紹一個叫做BlueVoice的低能耗藍牙設備語音流應用。
本文從支持語音流服務所需的擴展服務集開始介紹BlueVoice應用,然后在實際硬件設備上評估BlueVoice的性能。在所選的硬件平臺上,BlueVoice應用完全支持語音流服務,同時避免能源浪費。
I. 前言
經歷過去幾十年的快速增長,互聯網幾乎滲透到人類社會日常生活的方方面面。未來互聯網將擴展到萬物互聯,數十億甚至數百億個有唯一身份的“物品”通過無線通信與人類和周圍環境交互,執行高級任務。在這一構想中,“物品”可能是傳感器、致動器、家電、玩具,總之,可以是任何能夠被識別的虛擬或實體物品,這種互聯網演進構想被稱為物聯網(IoT)。
物聯網概念是通過標準協議解決方案(即互聯網協議)和無線通信接口,把所有產品設備連接在一起,組成一個全球網絡。實現萬物互聯,雖然可以使用現有的大量的射頻通信技術,但是當物聯網產品是部署在現場的自主型電池供電裝置時,低功耗無線通信技術才會是最適合的通信解決方案。在這個方面,低能耗藍牙(Bluetooth LE) [1]技術被視為最有效的物聯網通信解決方案,同時正在融入互聯網世界[2]。
在今天的物聯網應用中,低能耗藍牙解決方案主要用于生命參數監視用途。除傳統的監視服務外,近幾年業界開始探索基于其它技術的先進應用。例如,參考文獻[3]提出并分析了基于IEEE802.15.4的網絡[4]語音通信。在這個方面,通過低能耗藍牙傳輸多媒體數據還是處于起步階段,缺少可用的解決方案主要是因為最初設想時未考慮到這些應用(例如,最初主要考慮的是醫療、健身等應用)。本文以在低能耗藍牙設備上支持語音流服務的BlueVoice應用為例,探討如何解決這些技術限制問題。我們先了解一下低能耗藍牙技術,然后詳細介紹支持該新應用概念所需的擴展服務集,再介紹應用設計,最后在STM32 Nucleo L476板上測試實際性能。
本文的有要內容安排如下:第二章介紹低能耗藍牙工作原理,先描述整個工作棧;然后介紹配置文件(Profiles)概念。第三章介紹應用方案設計,描述其低能耗藍牙配置文件,然后介紹其設計原則、設計實現及實際性能。第四章是結論。
II. 低能耗藍牙技術概述
BLE低能耗藍牙規范于2010年寫入藍牙4.0核心規范,盡管與基本藍牙相似,但是低能耗藍牙規范主要是為超低功耗應用設計開發。通過低能耗藍牙技術連接電池供電設備的潛在應用非常少,醫療、健身和智慧家居是其中僅有的幾例。
圖1. 低能耗藍牙協議棧
如圖1所示,低能耗藍牙協議棧總體結構主要由兩個部分組成:控制器和主機。應用軟件使用協議棧主機層的協議提供的服務。主機層分為五層:邏輯鏈路控制和適配協議(L2CAP)、屬性協議(ATT)、通用屬性配置文件(GATT)、安全管理協議(SM)、通用訪問配置文件(GAP)。控制器部分只有兩層:物理層(PHY)和鏈路層(LL)。如圖1所示,主機-控制器(HCI)接口是控制器與主機的通信通道。
物理層負責比特調制,通過無線通道收發數據。最高數據速率是1 Mb/s,典型通信距離是幾十米。
鏈路層規定兩個設備之間雙向通信的功能。低能耗藍牙節點有兩個角色:主設備和從設備。通常是主設備(例如,筆記本電腦、智能手機)搜索從設備(例如,體感設備);必要時,從設備向主設備發送數據。從設備通常處于睡眠狀態,并在固定間隔內喚醒,以便被主設備搜到。
在鏈路層之上,邏輯鏈路控制和適配協議(L2CAP)有兩個主要功能。該協議的主要作用是提供多路傳輸功能,按照標準低能耗藍牙分組數據格式,封裝轉換頂層多協議數據。安全管理協議(SM)和通用訪問配置文件(GAP)分別提供數據安全和服務管理功能。詳細的說,安全管理協議定義密鑰的生成方式,以及如何在兩個設備(主從設備)之間交換密鑰,建立安全加密通信通道,而通用訪問配置文件則規定兩個設備如何在底層交互操作
屬性協議(ATT)和通用屬性配置文件是開發新應用時需要重點考慮的兩個協議組件。屬性協議是一個無狀態的客戶機/服務器協議:不考慮設備的底層角色是主設備還是從設備,每個設備都可以設為服務器、客戶機或是客戶機兼服務器。客戶機請求服務器數據發送數據,服務器向客戶機發送數據,數據以屬性的形式保存在服務器內,每個屬性都含有GATT管理的數據,而且該數據被分配一個通用唯一標識符(UUID)。通過一個L2CAP專用通道,屬性協議在服務器屬性與客戶機之間建立一條通信通道。通用屬性配置文件(GATT)在屬性協議層添加一個數據抽象模型,負責搜索屬性協議保存的數據,在兩個設備之間交換特征。每個低能耗藍牙設備都有一套可能屬性(存儲服務)和特征(與存儲服務相關的屬性)。如果在低能耗藍牙棧上建立一個新應用,則必須定義屬性和特征。某一特定應用的特征、屬性和底層規范合稱配置文件,標準配置文件可保證不同品牌的產品能夠互聯互通。
III. BLUEVOICE應用
下面我們介紹BlueVoice應用,首先定義語音通信低能耗藍牙配置文件,然后討論所涉及設備的通信角色、音頻處理和壓縮選擇、數據分組問題和帶寬要求。我們提出兩個在音頻采集和功耗方面不同的系統配置,以滿足不同的應用要求。本章最后一部分介紹在一個實際硬件設備上實現的BlueVoice應用,然后比較并討論實際測量到的應用性能,例如,功耗、存儲器占用、處理性能要求和自動語音識別(ASR)性能。
A. 服務定義
考慮到音頻流用例不屬于低能耗藍牙標準配置文件,為實現語音流服務,BlueVoice應用在低能耗藍牙協議棧上,定義了一個叫做BlueVoice Service(BVS)的“廠商專用配置文件”,指定了服務器與客戶機之間交換語音數據的方式。此外,考慮到半雙工通信需要特別的設計選擇,本章稍后詳細討論這個問題。
如前文所述,屬性協議ATT是通用屬性配置文件GATT在不同設備之間交換數據的傳輸協議,屬性是ATT定義的最小的實體,是可尋址的信息段(內置UUID標識碼),可能含有用戶數據或關于屬性本身架構的元信息,例如,權限、加密和授權屬性。GATT服務器屬性按特定順序組成一個服務序列,序列開始部分是服務聲明屬性,后面跟一個或多個特征和可能的描述符。每個特征都是一個被披露的屬性。除標準配置文件UUID外,在定制應用中,開發人員可使用獨有的和廠商專用的UUID開發有自己特征的新服務,BlueVoice應用就是這種情況。考慮到單向音頻流系統不對稱性,服務器通過BVS配置文件向客戶機披露數據類型和格式以及訪問方式。BVS服務包含下列屬性,如圖2所示。
服務聲明(Handle 0x0010)
– UUID: 標準16位UUID,用于主服務聲明(0x2800).
– 權限:讀
– 數值: 獨有128位BVS UUID.
特征聲明 (Handle 0x0011)
– UUID: 標準16位UUID,用于特征聲明 (0x2803).
– 權限: 讀
– 數值: 獨有128位音頻UUID, 僅用于通知, Handle: 0x012.
特征數據 (Handle 0x0012)
– UUID: 獨有128位音頻UUID.
– 權限: 無
– 數值: 實際音頻數據
特征聲明 (Handle 0x0014)
– UUID: 標準16位UUID,用于特征聲明 (0x2803).
– 權限:讀
– 數值: 獨有128位同步UUID,僅用于通知,Handle: 0x0015.
特征數據 (Handle 0x0015)
– UUID: 獨有128位同步UUID.
– 權限: 無
– 數值: 實際同步數據
根據該標準,主服務聲明是服務的第一個屬性,其數值域包含該聲明引入的UUID定義。BlueVoice應用聲明使用一個128位獨有的UUID(BVS UUID)。BVS包含兩個特征,分別叫做音頻(Audio)和同步(Sync) 特征。在低能耗藍牙規范中,每個特征至少包含兩個屬性,分別是特征聲明和特征數值。特征聲明以元數據的形式定義其屬性,特征數值則是包含實際特征數據。在BlueVoice情況中,音頻和同步特征都包含一個單一的由獨有128位UUID定義 (AudioData和SyncData UUID) 的屬性,分別含有實際音頻數據和邊信息同步數值。音頻和同步特征聲明將AudioData和SyncData屬性定義為”僅通知”,未取得客戶機的讀寫權限,表示音頻數據和同步數據只以通知的形式傳輸,服務器不答復客戶機。為與低能耗藍牙服務的分層架構一致,其它特征可能會增加到未來發布的BlueVoice應用。
圖2. BlueVoice服務(BVS)定義
B. 應用設計
本章主要介紹BlueVoice應用設計的(i)低能耗藍牙通信(ii)音頻處理。
1) 低能耗藍牙通信
按照低能耗藍牙協議,通信可以是多點廣播,也可以是點對點連接。BlueVoice應用鏈路層使用連接通信模式,在兩個設備之間建立永久性的點對點連接,這兩個設備扮演兩個不同的角色:中央設備和周邊設備。中央設備又稱主設備,支持與周邊設備(從設備)相關的復雜功能。中央設備是發起通信連接,執行自適應跳頻,數據加密,管理通信時序,定義設備間數據交換方式。該角色分配符合低能耗藍牙的非對稱設計概,為能效要求高的設備分配更少的工作任務。電池供電的便攜設備通常是從設備,不過,必須說明的是,根據規范[1],每個設備在每個連接事件發生時可單獨發送數據,且角色不在數據吞吐量上強加限制或優先權。考慮到半雙工通信情況,BlueVoice應用可運行在自主的電池供電無線傳感設備上,且這些設備配備麥克風(和最終標量傳感器,如典型物聯網概念中無處不在的監視應用), 因此,角色分配不再與收發功能有關。
在鏈路層之上,GATT層定義互動設備的客戶機和服務器角色,與前文描述的主設備和從設備無關。服務器是提供信息的設備,而客戶機是請求或接收最新信息的設備。考慮到單向音頻流是非對稱系統,裝備麥克風的設備是唯一有語音信息的設備,因此可將其視為通信服務器,另一個設備是客戶機,向服務器發送信息請求,并接收服務器發起的含有語音數據的更新信息。在雙向通信系統中,語音數據是雙向傳輸,架構是對稱的,中央設備和周邊設備都配備麥克風,都可以充當服務器,輸出任何屬性格式的音頻數據。同時,服務器也能充當客戶機,發送信息請求,并接受另一個設備發送的更新信息。
雙向語音數據流是基于服務器以固定間隔向客戶機發送通知,不需要接收設備發送請求或回復信號。從設備在上電階段進入廣播模式,以低頻發送廣播數據包,主設備進入搜索模式,掃描是否有其它設備存在,反之亦然。收到廣播數據包代表主設備發現了相關從設備,然后,主設備發送一個連接請求。在連接建立過程結束后,按照所選的通信傳輸方向:中央設備至周邊設備或周圍設備-中央設備,以固定間隔從服務器向客戶機發送含有音頻數據的異步通知數據包。圖3所示是BlueVoice在GATT 層的角色分配。
圖3:BlueVoice配置文件角色分配
2)音頻處理
BlueVoice的音頻處理目的是在根據應用所選的接收端上,取得8kHz 或16 kHz的目標音頻采樣。事實上,對于低功耗要求極其嚴格但是對音質要求不高的應用場景,例如,無需人耳聽清楚的自動語音識別服務輸入音頻,8kHz采樣率可能是一個不錯的選擇。
使用自適應差分脈沖碼調制算法壓縮低能耗藍牙音頻傳輸信號,可使音頻信號適用于現有的數據傳輸速率,同時最大限度縮減射頻傳輸時間以及功耗。我們使用數字MEMS麥克風設計一個全數字解決方案,尺寸和音質等特性使其適用于無線傳感器設備。圖4所示是16 kHz采樣率的完整語音處理鏈。該解決方案首先采集數字MEMS麥克風生成的1 MHz 的1位脈沖密度調制(PDM)信號,并將其轉換成16 kHz 的16位脈沖編碼調制(PCM)采樣,然后以16000個采樣/秒的采樣率,再將其壓縮成4位ADPCM采樣信號,并準備發送。
此外,以較低的頻率發送邊信息同步數據集合,所需帶寬是64 kbps音頻數據與300 bps同步信息數據之和,總計64.3 kbps。對于8kHz采樣率,最終ADPCM采樣率是8000個采樣/秒,導致31.3 kbps帶寬需求,包括邊信息。下面章節深入介紹上述模塊。
圖4:16kHz 配置的BlueVoice數據傳輸鏈
MEMS麥克風的容性傳感器生成的模擬信號經放大和高速率采樣后,交由整合量化和噪聲修整操作的內部sigma-delta調制器處理,輸出的數據是一個單一的高采樣率的PDM格式比特,PCM轉換是從PDM到無線通道發送壓縮音頻數據的整個處理鏈的中間環節。為了把PDM流轉換成PCM數據,需要使用一個抽取濾波器和兩個可單獨配置的濾波器(低通濾波器和高通濾波器。該處理模塊輸出16位PCM格式采樣流。按照所選采樣頻率,采用一個不同配置的抽取濾波器,以取得16位PCM數據采樣。
ADPCM編碼模塊壓縮PCM采樣,通過減少數據包傳輸量,節省傳輸帶寬,降低能耗,如前文所述,ADPCM 是一個用于損耗波形編碼的壓縮算法,其基本原理是根據上一個數值預測當前數值,只傳輸自適應量化步驟量化的實際值與預測值的差值。存在諸多可選壓縮標準,卻單單選用ADPCM標準,這是因為它是基于波形編碼方法,與基于聲碼器的復雜解決方案相比,更適用于傳感器網絡設備(通常基于微控制器)。在BlueVoice應用中,每個16位PCM采樣都壓縮成4位ADPCM數據,這樣所需的應用傳輸帶寬是32 kbps或64 kbps,至于具體速率取決于采樣頻率,而且兼容低能耗藍牙流媒體功能。
如前文所述,BlueVoice應用的總體帶寬實際需求高于32 kbps或64 kbps的理論值,這是因為BlueVoice為提高通信穩健性,在通過通道發送數據時增加了附加信息。16 kHz 配置采用10 ms連接間隔,而8 kHz 配置采用25 ms連接間隔。事實上,如果被傳輸的數據量較少,可提高連接間隔數值,從而節省能源。為盡可能地利用每個數據包現有有效載荷,語音數據包發送20個字節。
因此,在16 kHz配置中,語音數據每10 ms發送4個數據包,而在8 kHz配置中,語音數據每20 ms發送4個數據包,結果傳輸帶寬分別是64 kbps和32 kbps。發送器的邊信息發送頻率較低,每160 ms發送一個6字節的附加包,對應16個或8個連接間隔。圖5描述了低能耗藍牙協議棧上的數據分組總體策略。通過音頻特征,每10ms或20 ms連接間隔,發送4個語音數據包(每包20字節),而發送器邊信息的發送是,通過同步特征,每160ms間隔發送一個附加數據包。
圖5:BlueVoice數據分組機制
C. 在實際硬件上實現應用
為了在支持低能耗藍牙通信的不是十分復雜的實際硬件無線傳感器網絡平臺上評估BlueVoice的可行性,我們在實際硬件設備上實現了第三章B部分所描述的應用軟件的全部功能。所選硬件平臺是意法半導體的STM32 Nucleo L476開發板[5],這是一個基于STM32L476 80 MHz 32位ARM Cortex-M4微控制器的開放式開發平臺。我們選擇STM32 Nucleo開發板的原因是,板載微控制器的性能高于普通無線傳感器網絡平臺,同時還具備很高的靈活性和多功能性。該開發板配備很多接口和擴展排針,插接專用擴展板擴大板子功能簡單容易,方便設計人員研究、開發和驗證新創意。特別值得一提的是,STM32L4微控制器具有市場領先的低功耗特性,其內置數字濾波器配合Sigma-Delta調制器(DFSDM)外設,可實現圖4的PDM至PCM的格式轉換,這些特性使其特別適合BlueVoice應用。通過在STM32Nucleo開發板上接插一塊低能耗藍牙連接板和一塊麥克風擴展板,BlueVoice中央模塊和周邊模塊可以組成一個基于STM32Nucleo的對稱硬件配置,展示一個半雙工通信通道。低能耗藍牙連接板基于意法半導體的BlueNRG [6],BlueNRG是一個超低功耗的低能耗藍牙單模網絡處理器,兼容藍牙規范4.0版,可設為主設備和從設備模式,當低能耗藍牙協議棧啟動時,數據傳輸最大電流8.2 mA,可降至1.7 uA。附加的麥克風擴展板用于采集語音信號,基于意法半導體的MP34DT01 [7]數字萬向MEMS 麥克風,聲學過載點120 dBSPL, 信噪比63 dB,靈敏度-26 dBFS。MP34DT01采用一個容式傳感器和一個內置sigma-delta調制器和噪聲修整機制的集成電路,提供1-3.25 MHz的PDM輸出。
圖6是實際硬件設備的框圖:STM32微控制器通過與外設模塊DMA相連的DFSDM模塊采集麥克風的PDM采樣輸出,同時通過一套專用應用程序界面(API)和串行外設接口(SPI)與BlueNRG模塊通信,對于中央模塊和周邊模塊,模塊化架構是對稱的。框圖中還有一個USB音頻接口,用于向PC機提供重構的音頻信號。圖7是硬件設備的實際原型。
D. 性能
我們用第三章C部分描述的實際系統作為實驗平臺,評估BlueVoice應用的功能、存儲器占用、性能需求和ASR識別率。特別是考慮到現場部署一系列微型無線麥克風模塊的應用場景和低能耗藍牙本身的非對稱性(從設備-外設模塊必須尺寸緊湊且功耗極低),本章討論的性能評估主要討論 8 kHz和16 kHz兩種配置的從設備-外設模塊的功耗、存儲器占用和性能震求。此外,在接收端測量的ASR性能是另一個性能評估指標,實際上,該參數可能是語音通信的一個重要的音質指標,對于新興的聲控應用(遙控器、物聯網產品)具有重要意義。
圖6. BlueVoice框圖
圖7:發送器和接收器原型
1) 功耗、存儲器占用和性能需求
如前文所述,我們把BlueVoice應用實現在一個硬件設備上,該硬件設備使用意法半導體的 STM32 Nucleo開發板充當主機,并使用低能耗藍牙網絡模塊充當控制設備。表1列出了在BlueVoice的廣播、連接和傳輸三個不同狀態下,主機和控制設備(STM32和BlueNRG)的功耗值。這些數據是在3.3 V工作電壓時的測量值,對8 kHz和16 kHz配置的功耗進行了比較。必須強調的是,微控制器功耗完全取決于硬件特征和低功耗配置,因此,微控制器功率是在計算總功耗時加在總功耗中與平臺相關的數值。
本表所列數值可以視為一個指示性參考值,可能會隨實際應用情況而發生變化。
表I:BLUEVOICE功耗
按照低能耗藍牙標準,在兩個節點之間建立連接前,從設備是處于廣播模式,而主設備則是進入掃描模式。當主設備收到廣播數據包,發現從設備存在時,就立即建立連接。在BlueVoice解決方案中,考慮到一個外設模塊對中央模塊的通信,外設節點是發送器(服務器),而中央節點是接收器(客戶機):服務器以固定周期向客戶機發送通知。對于8 kHz配置中,在廣播階段,發送器外設模塊(STM32 + BlueNRG)總平均功耗極低,只有3.50mW,當建立連接時,功耗是3.98 mW。對于16 kHz配置,廣播階段功耗是8.22 mW,而連接階段是9.48 mW。這里應著重指出的是,連接階段的功耗與連接間隔選擇關系密切,這也是8 kHz和16 kHz配置(分別是20 ms和10 ms)的主要區別。在這兩情況中,連接間隔設為接近標準規定的最小值(7.5 ms),以確保傳輸延遲最小。一旦連接建立, BlueVoice應用立即進入傳輸狀態,8 kHz配置的平均功耗是10.07 mW,16 kHz配置的平均功耗是19.84 mW,因此,基于STM32 + BlueNRG的物聯網節點,假設電池容量是200 mAh,在連續傳送數據流時,兩種配置的理論續航時間分別是約65小時和33小時。這些功耗值表明BlueVoice方法的適用于以低能耗藍牙為載體的音頻流,特別是8 kHz配置,可大幅降低功耗。
除分析功耗外,通過考慮存儲器占用情況,我們還評估了應用的可行性。如表II所示,BlueVoice應用軟件兩種配置占用閃存空間相同(21.85 kB),但是,8 kHz配置占用13.32 kB的RAM空間,而16 kHz配置只占用7.86 kB的RAM空間。兩種配置占用RAM空間不同的原因是,為降低該解決方案的額外開銷和功耗,8 kHz和16 kHz分別每20 ms 和10 ms執行音頻處理步驟(PDM轉PCM和ADPCM壓縮),從而導致8 kHz配置在兩個連續步驟之間存儲的數據變大。在這兩種情況中,這些數值十分符合資源受限的系統要求。
表II
發送端BLUEVOICE存儲器占用
2) ASR性能
BlueVoice在功耗、處理性能和存儲器占用方面表現出的可行性并不能保證語音信號質量在接收端達到可以接受的水平,在BlueVoice解決方案性能評估最后,我們利用一個網絡ASR服務進行了大量的傳輸測試,在接收端測量ASR 性能。16 kHz USB麥克風和8 kHz/16 kHz BlueVoice系統以并行方式記錄若干個包含已知英文單詞的音頻采樣(作為參考),并將其傳輸到ASR引擎,表III列出了不同解決方案的單詞識別率比較測試結果。測試結果證明,ADPCM壓縮沒有降低信號質量,因此適合ASR應用:BlueVoice 16 kHz配置的性能十分接近USB麥克風,而 8 kHz系統的性能稍有降低(18 %),適用于低功耗要求極嚴的應用。事實上,8 kHz系統以16 kHz配置50%的功耗取得了相同的ASR性能。
表III
BLUEVOICE ASR性能
IV. 結論
本文介紹一個以低能耗藍牙為載體傳送音頻流的解決方案,首先介紹一個廠商專用的半雙工通信低能耗藍牙配置文件,然后介紹BlueVoice應用設計,并討論了慮涉及設備的通信角色、音頻處理和壓縮編碼選擇、數據分組和帶寬需求。BlueVoice應用由一個中央節點和一個外設節點組成,按照所選通信方向,分別充當低能耗藍牙的服務器和客戶機。在連接建立后,服務器按固定周期向客戶機發送通知。我們對8 kHz和16 kHz兩個沒配置進行了比較,在發送器節點上,MEMS麥克風的數字PDM格式輸出信號被采集并轉換成PCM格式,然后壓縮成ADPCM數據,最終在低能耗藍牙鏈接上產生32或64 kbps的藍牙帶寬。該配置文件還定義一個低頻邊信息機制,雖然需要一些額外的帶寬,但是提高了錯誤抑制功能。為評估解決方案的性能, BlueVoice被實現在實際硬件設備上。該設備是由MEMS麥克風和STM32微控制器組成與網絡模塊組成的全數字系統,前者充當主機,后者充當低能耗藍牙控制器。本文的性能評估表明,我們提出的解決方案在功耗、處理性能和存儲器占用方面適用于低功耗語音流應用。特別是,在8 kHz和16 kHz音頻流傳輸過程中,傳感器設備的功耗測量值分別為10.07 mW和19.84 mW,存儲器占用和性能需求完全可接受。此外,我們還測量了音頻質量指標ASR性能,8 kHz配置和816kHz配置的單詞識別率分別達到67%和82%,而16 kHz USB麥克風的識別率達到85%,這表明BlueVoice應用能夠在接收端達到非常高的音質,并具有極低的功耗。
【推薦閱讀】
超級電容在電動車中應用研究及發展趨勢分析
采用高度集成的電機控制方案應對最新的汽車趨勢
數字電路PCB設計中的EMI控制技術
新國標下的交流充電樁電源及信號接口解決方案
如何將EMC問題“扼殺”在產品開發過程中的“搖籃里”?