中心論題:
- 手勢識別的控制原理
- 系統描述
- 硬件描述
- 軟件描述
- 單片機硬件初始化、數據采集、動作檢測
- 演示終端
解決方案:
- 利用三軸加速度的值來判定對物體運動預定義的六種姿勢
- 系統由CT-298單片機、 MM-2860加速度傳感器、演示終端三個部分組成
引言
手機、MP3播放器、硬盤播放器、數碼相機、PDA等設備都是通過導航鍵對其進行控制的。目前比較流行的導航鍵控制方式有四維鍵、搖桿,這是最常見的兩種導航鍵,此外還有一些手機上有很新穎的導航鍵設計,例如:LG-KG70的滾軸鍵、LG-KE608的轉盤設計、索愛W830的觸摸式、多普達D802的飛梭滾輪等等。這里,我們用加速度傳感器設計一種看不見的導航鍵來代替四維鍵的功能,這種方案更能滿足消費者的好奇心,滿足消費者追逐時尚的需求。
手勢識別的控制原理
本系統利用三軸加速度的值來判定對物體運動預定義的六種姿勢。首先,分別對三個軸采樣,每個軸各獲得50個數據;然后,分別對每個軸上的數據進行處理來判定是否發生了預定義的動作。動作定義在下面的部分說明,這里僅用Y軸來說明判定的原理。
獲得Y軸上的50個數據存放到數組y_data[N]中,將這50個數求和取平均值。若y_data[N]中數據最大值與最小值之差在一個設定的閾值之內,則認為物體在Y軸向上是沒有動作的、靜止的,此時更新y_init值為y_data[N]求得的平均值;否則,y_data[N]中數據最大值與最小值之差超出一個設定的閾值,則認為物體是運動的,y_init值不變,仍然為上一次靜止狀態時的值。
圖1和圖2是Y軸分別向左、向右搖動時采樣得到的加速度抽樣值y_data[N]。圖中紅線代表上一次靜止時的采樣值,藍線代表運動時的采樣值。圖1為向左搖動時的值,可以明顯看出加速度的值較靜止時有明顯的變化,向著增大的方向變。
從圖1和圖2中可以看出,兩條黑線之間的數據很難斷定是哪個動作產生的,因為兩個動作都可能產生這樣的值。所以,利用黑線之外的數據來判定是向右還是向左搖。因為對于這兩個動作,黑線之外的數據有明顯的差異,數據相差很多。對于圖1這些數據大于150,圖2中這些數據小于90。因此這些數據至少相差60,可以很容易地將向左、向右的兩個動作區分開。
本系統就是根據這樣的原理來實現的,首先分別設定向左、向右搖時的閾值和兩個計數器;然后,將新采樣得到的50個值存放在y_data[N]中,將每個值與靜止時的值y_init比較,如果數據超出某個閾值,則在相應的計數器上累加,直到所有50個數全部比較完畢;最后,根據計數器值的大小來判定執行了某個動作。
同理,利用Z軸的采樣值來判定向上、向下搖,利用X、Y兩個軸來判定執行圖片向左翻轉還是向右翻轉,這里略去。
系統描述
a.系統組成及功能
系統由三個部分組成:CT-298單片機控制部分、 MM-2860加速度傳感器部分、演示終端,系統框圖如圖3所示。
CT-298單片機控制部分主要負責傳感器數據的A/D變換、動作檢測、與演示終端進行數據通信。MM-2860加速度傳感器部分負責加速度值的測量并將其轉換為電壓值。演示終端負責處理從單片機傳來的動作類型并執行相應的動作,同時向單片機返回進出二級菜單的指令。對于CT-298單片機系統更詳細的設計將在下面的部分介紹,這里首先介紹一下本系統設計的動作姿勢及代碼,以及與演示系統交互的指令。
b.預定義的動作
系統設計了六種動作,他們分別是左搖、右搖、下搖、上搖、圖片左轉、圖片右轉。圖4中的圖形象地說明了其中的兩個動作,其它的動作與此類似。
系統還為每個動作定義了相應的動作代碼,見表1。
當單片機檢測到某個動作時會將相應的值賦給變量type_action,之后通過SCI將type_action的值發送到演示終端。如果用戶執行的動作不在這六個動作之中,則將NO_ACTION賦給type_action,表示演示終端不執行任何動作。
系統還定義了單片機與演示終端交互的指令,用于系統在主菜單和二級菜單之間的界面切換,指令從演示系統通過SCI傳給單片機,單片機接收到之后進入或退出二級菜單,見表2。
這里僅定義了一個二級菜單,即圖片菜單,系統還可以定義更多的二級菜單和三級菜單。此外,需要說明動作MOVE_TURN_LEFT、MOVE_TURN_RIGHT用于圖片翻轉,僅在圖片菜單中可用,在主菜單不可用。動作下搖執行的是換下一幅圖片,動作上搖執行的是退出圖片菜單。
c.演示終端
本系統目標定位在便攜式消費類電子產品上,因此在軟件應用程序上必須選擇具有廣泛基礎的應用平臺。由于近年來J2ME在便攜式終端中的應用非常廣泛,因此本系統也采用了J2ME平臺進行開發。通過比較,選擇了J2ME的WTK開發包,它是專門針對移動無線設備而設計的開發包,并提供了一個統一的平臺。在WTK的框架下開發出來的java程序可以被眾多的移動設備所支持,所以能夠有效解決兼容性的問題。
在WTK下我們利用默認的一個手機樣機的仿真器DefaultColorPhone進行開發,DefaultColorPhone的樣子如圖6。
仿真器的外觀和操作類似一部移動電話,但是并不代表某個特定的設備,而是提供對其所支持的API 的正確實現,每個命令按鈕對應著相應的API函數。從圖6中可以看到手機的導航鍵,我們更改了導航鍵的API函數,使其從鼠標單擊觸發的方式轉換為串口動作代碼控制。首先,我們編寫了J2ME的串口接收程序,用于接收從單片機傳來的單字節的type_action值;然后將type_action以參數的形式傳給API,手機根據不同的type_action值執行不同的動作,包括菜單上下翻、進出二級子菜單、圖片翻轉等。手機動作與type_action的對應關系如表3。
根據type_action的值,在手機界面上產生相應的動作,手機界面發送不同的變化。演示終端的具體實現在下面的內容詳細介紹。
硬件描述
系統硬件分為兩個部分:CT-298和MM-2860。
CT-298是由MC9S08QG單片機構成、由USB總線電源供電的小型評估板。CT-298上安裝有按鈕開關、LED燈、蜂鳴器等作為開發的輸入輸出器件。同時,USB-COM轉換電路采用了FTDI公司制造的FT232R,容許單片機與電腦之間通過USB接口進行串行通信。BDM用于代碼的燒寫及系統的調試。
MM-2860是含有Freescale公司制造的MMA7260Q型三軸小量程加速度傳感器的模塊,它可以直接安裝在CT-298為其設計的插口上。MM-2860的電源是由CT-298上的MC9S08QG8單片機的PTB5端口來控制的,當PTB5端口為L時電源接通。此外,g-SELECT開關是選擇傳感器靈敏度的開關,使用時將MM-2860插入到CT-298的接口中即可。本系統采用加速度傳感器的靈敏度選擇為800 mV/g。
軟件描述
單片機主程序的流程如圖7所示。
系統上電后,首先要對單片機的硬件系統進行初始化、配置寄存器等操作,之后才可以進行數據采集,將加速度的值進行A/D轉換,得到量化的值。圖片菜單是二級菜單,如果沒有接到演示系統傳給單片機進入二級菜單的指令,則單片機一直在主程序運行,不斷地采集A/D值、進行動作判定,并向演示系統發送type_action的指令。演示系統可根據接收到的type_action的類型采取相應的動作。如果單片機接收到進入二級菜單的命令,則進入圖片菜單,同時也執行類似于主程序的動作判定程序,并不斷更新A/D采樣值,發送type_action,直到接收到退出二級菜單指令才退出。下面詳細介紹一下各個功能模塊的具體設置。
單片機硬件初始化
單片機系統主要的工作有:將加速度傳感器的模擬數據進行A/D轉換、向演示系統發送type_action的動作類型、接收演示系統發來的進出二級菜單的指令、設置采樣值,除此之外還需要對系統時鐘、外部設備(燈,buzzer)進行配置。根據單片機的主要工作內容選擇單片機內部的功能設備,包括A/D轉換器、模定時器、串行通信模塊(SCI)、內部時鐘源模塊。
數據采集
系統設置的采樣頻率為200Hz,每秒鐘分別對X、Y、Z 三軸采樣200個數據,因此定義了三個大小為N的數組對數據進行緩存,他們是:
char x_data[N];
char y_data[N];
char z_data[N];
這里N取50,每0.25s存取一次,1s鐘可以存取4次,保證采樣率為200。函數void acce_meas(void) 負責將采樣的數據分別放到這三個數組中,下面是程序的具體實現:
for(j=0;j<N;j++) //采集N個數據
{
for(i=0;i<3;i++)
{
if(i==0)
{
adc_go(0); //選擇A/D信道0
x_data[j]= ADC_val_L; //X軸
}
else if(i==1 )
{
adc_go(6); //選擇A/D信道6
y_data[j]= ADC_val_L; //Y軸
}
else
{
adc_go(7); //選擇A/D信道7
z_data[j]= ADC_val_L; //Z軸
}
}
delay(); //延時函數,用來設定采樣率
}
動作檢測
動作檢測主要是用獲得的三組數據值x_data[N]、y_data[N]、z_data[N]來判定當前動作是系統設定動作中的哪一個,如果符合,則發送這個動作對應的預定義值給演示終端,否則發送NO_ACTION。type_dectction()用來實現動作檢測,其中type_move為函數內部變量,用于記錄動作代碼。type_dectction()進行動作檢測的流程如圖8所示。
演示終端
a.J2ME平臺開發環境配置
進行J2ME的開發需要從網絡上下載免費的開發環境。運行Eclipse后進行最后的配置:Window->preferences->J2ME->Platform Component然后右鍵選擇 Wireless Toolkil,再選擇彈出菜單中的 Add Wireless Toolkil,選擇剛剛安裝的J2ME Toolkit的安裝路徑: C:\WTK22,這樣基本配置就完成了。
J2ME的WTK開發包是專門針對移動無線設備而設計的開發包,并提供了一個統一的平臺。在WTK的框架下開發出來的java程序可以被眾多的移動設備所支持,能夠有效解決兼容性的問題。
b.軟件應用程序
程序分為主進程、串口監視模塊和定制化用戶界面三大部分,分別基于J2ME不同的類庫派生而成,三部分之間通過消息機制相互聯系,共同構成整個程序的運行周期。具體每個模塊所實現的功能參考下節內容。
c.軟件應用程序的組織結構
本軟件應用程序在WTK的手機仿真器下進行設計,分為Base和display兩個package。在Base Package中包含MainRoutine.java和RS232Port.java兩個java文件;在display Package中的文件較多,主要實現了UI和基本的key響應。下面介紹軟件部分的實現方法:
MainRoutine類:MainRoutine為程序的入口類,它整合了程序中的所有的對象。MainRoutine派生于MIDlet類,重載實現了MIDlet中的startApp、pauseApp、destroyApp等方法,并且在constructor中加入了exitCommand命令,從而實現了手機的關機功能。
可以看出MainRoutine實現了程序的入口和退出,并同時標志了程序的基本框架,給具體的功能應用打下了堅實的基礎。
vCanvas類:vCanvas繼承了Canvas類,并增加了externalMsg方法。之所以在其中增加externalMsg方法,是因為其超類Canvas不能動態地響應key,而我們對Canvas的要求是能夠通過對串口導入的數據(或按鍵)得到的keyCode做出相應的動作,比如圖片的翻轉、文本的滾動等等。于是,我們可以通過vCanvas派生出一系列的子類,實現我們的具體要求,為將來的開發提供了方便。
DisplayItem類:DisplayItem是基礎類,提供了通用的string數據組合。該類的構造方法中需要輸入shortText、longText和extra三個string參數,這樣就保證了每個DisplayItem都可以返回三個不同長度的文本信息,在不同的場合使用。其中shortText用于UI中的標題顯示,longText為Item的主體內容,extra為Item的附加信息。 DisplayItem類在本系統中會被例化來描述菜單和子功能的內容,是應用廣泛的一個基礎類。
ImageCanvas類:ImageCanvas同樣繼承于基礎類vCanvas,它的主要功能是實現了對圖片的瀏覽及旋轉、鏡像等基本操作。
考慮到目前使用手機瀏覽圖片、拍攝圖片的多方向性,如果能夠通過加速度傳感器自動校正圖片的方向,使它自動滿足我們想要的方向,那么我們就免除了很多不必要的麻煩。于是我們對圖片的瀏覽功能模塊增加了向左或者向右旋轉90°的功能。這樣用戶就會驚喜地發現無論他的手機怎樣擺放,顯示的圖片將永遠保持與地面垂直。
ListCanvas類:ListCanvas提供了主畫面的顯示能力,并將用戶操作派生到內部聚合成員上面去。具體功能的Item將包含在ListCanvas之中,每一個Item擁有顯示在屏幕上的ShortItem,顯示在detail screen中的LongText,還有不被顯示的ExtraText,當然其信息我們也是可以得到的。在ListCanvas中,我們可以用“右鍵”顯示Item的詳細信息,也可以用SELECT鍵來標記每個Item。
ItemListCanvas類:ItemListCanvas同樣繼承了vCanvas類,實現了多條目文本瀏覽的功能,構造方法的輸入依次為Display、Displayable、Font、Title和ItemVector。將多條String構造為一個Vector傳遞給ItemListCanvas后,該類能夠提供一個多條目文本實現的用戶界面。本系統的“關于本系統”子功能就是通過實例化該類得到的。
結論
本系統采用Freescale的單片機MC9S08QG和加速度傳感器MMA7260Q實現了便攜式手持設備的手勢控制,并采用了開放的J2ME平臺實現了終端應用程序。系統完整,實用性強,成本低廉,在滿足用戶基本操作需要的同時,增加了移動設備操作的趣味性和靈活性。同時,加速度傳感器MMA7260Q較小的體積和獨特的節電模式更使其在移動設備的應用中有著極大的優勢。可以預見,在未來的手持設備系統中會大量采用類似的手勢識別功能,因此具有廣闊的市場應用前景。