【導讀】聲音是人與人交戶的重要手段,在AI興起的現今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。
著名作家海倫·凱勒曾說過這樣一句話,“盲隔絕了人與物,聾隔絕了人與人。”可見聽力的重要性,由此可以看出,人的一生耳朵是最忙的感知系統之一。
聲音是人與人交戶的重要手段,在AI興起的現今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。
據SIG預測,到2027年藍牙音頻傳輸設備年出貨量將達18.4億臺,2023年~2027年的年復合增長率為6%,藍牙數據傳輸設備年度出貨量將達到18.7億臺,2023年~2027年的復合年增長率為11%。
ICCAD 2023上,炬芯科技股份有限公司董事長兼CEO周正宇博士博士分享了炬芯在AI大背景下,如何為音頻芯片提供更多創新。
20多年專注音頻領域
“炬芯的前身就是原來的炬力集成,我們在行業中做了20多年音頻,2005年炬力集成基于便攜式音頻在美國上市,2021年炬芯基于藍牙音頻在科創板上市。”周正宇博士這樣介紹道。
炬芯2023年半年報和官網顯示,其核心產品包括藍牙音頻SoC芯片、端側AI處理器芯片、便攜式音視頻SoC芯片三類。
藍牙音頻 SoC 芯片系列主要應用于藍牙音箱(含TWS音箱、智能藍牙音箱)、Soundbar、智能手表、藍牙耳機(含TWS耳機、開放式OWS耳機)、無線電競耳機等。
端側AI處理器芯片系列是基于端側的帶有人工智能加速器的 系統級音頻處理器,致力于提供智能物聯網AIoT端側低功耗算力的芯片平臺,也是炬芯主營的音頻產品和人工智能技術的重要結合點,可滿足市場未來日新月異的低功耗端側設備的人工智能應用需求。
便攜式音視頻SoC芯片系列是炬芯最早耕耘的、最成熟的產品線,全球市場占有率長期較高,搭載了公司長期積累的、較先進的低功耗音視頻處理技術。該系列芯片主要針對便攜式高品質音視頻編解碼類產品的應用。
具體從市場來看,炬芯在中高端品牌藍牙音箱市場份額明顯增長,下一步會通過產品持續迭代升級和優化產品組合繼續提升在中高端品牌的滲透率;低延遲高音質市場從有線連接向無線連接轉換的趨勢,帶來了存量市場轉化和新增需求兩個機會,炬芯正在持續加大研發投入保持技術領先優勢并與各大品牌廠商繼續保持緊密合作以把握這一波市場轉型機會;此外,在智能手表市場,炬芯對中國、歐美和印度市場做了均衡的布局和節奏把握,智能手表作為貼合人體重要的健康數據監測產品,將持續深耕。
用存內計算創造更大算力和更低功耗
周正宇博士表示,過去以來,炬芯的芯片架構一般都是“CPU+DSP”的雙核架構,未來,AI時代,炬芯會在CPU和DSP的基礎上,從高端音頻芯片入手,整合低功耗 AI 加速引擎,逐步全面升級為 CPU+DSP+NPU(based MMSCIM)三核異構的AI SoC架構,為便攜式產品提供更大的算力。,最新一代基于MMSCIM的高端AI音頻芯片ATS286X,將會在明年將會Sample。
“算力和功耗是一對矛盾統一體。”周正宇博士認為,如何在同樣的制程、同樣的架構、同樣的設計下,創造更大算力和更低功耗是AI時代的關鍵。
比如說,TWS耳機電池容量通常在35m~40mAh,典型平均工作電流約在5mA左右,也就是說,留給芯片的功耗預算只有20mA左右。再比如,智能手表典型電池容量在280~300mAh,典型工作電流在3mA上下,也就是說在4.3V鋰電池中,只有15mA左右的功耗,還包括ADC、DAC等器件,也就是說留給藍牙音頻芯片功耗只有10mW。
與之相悖的是,AI驅動下,未來算力需求越來越大,也就是說,對藍牙音頻芯片商來說,要在10mW的功耗預算下,打造200~500GOPS算力是很大難題。
AI主要以復雜矩陣運算來形成,而復雜的矩陣運算最主要的算力功耗都來自于乘累加運算,過去芯片普遍采用DSP處理音頻,突破的關鍵就在于突破馮諾范式的存儲墻和功耗墻,即存內計算,通俗解釋就是把計算和存儲放在一個房間里去,讓它們零距離溝通。
存內計算擁有許多不同介質,到底哪一種介質適合做存內計算?周正宇博士認為各個介質均有其特點,不論哪種路徑,最主要的問題就是寫入次數,假若AI需要做自適應或模型不斷更新,那么它在寫入多次之后就會報廢,所以這種介質不適合做自適應應用,類似于Transformer這一類擁有自學能力的模型。
對比來看,SRAM讀寫速度快,擁有無限次讀寫能力,不僅采用標準工藝制造,還可以集成在SoC內,但它的弱點是存儲密度低。不過,雖然如此,SRAM依舊是低功耗AI算力的首選。一方面,音頻只需要200~500GOPS的算力,而非幾十TOPS,密度低的缺陷因此而被規避,另一方面,標準的CMOS工藝不僅可以現在就能大規模量產,還可以集成在單芯片上跟隨制程工藝演進到2nm。加之無限次寫入,可以支持自適應計算,長遠來看,RL(強化學習)和ML(機器學習)可能也會為它帶來更多驚喜。
存內計算也擁有模擬和數模混合兩個技術路徑,它們最大的差異主要在于運算用ADC+模擬電路實現的,還是基于數字電路實現。
炬芯科技選擇的是模數混合的存內計算,暫時命名為“Mixed-Mode SRAM based CIM”,簡稱MMSCIM,其優勢是精度無限,可靠性和量產的一致性非常高,容易在制程上升級,容易提升速度或PPA。
目前,該芯片雖然還沒有進入量產階段,但進展非常快。它在全矩陣運算情況下,未來22nm就有望達到每瓦7.8TOPS的能效比。值得一提的是,在12nm情況下,它就已經接近50TOPS,足以挑戰在10mW范圍內釋放200~500GOPS算力。
邊緣與AI融合,挑戰與機遇并存
在周正宇博士看來,未來端側也會實現像ChatGPT、Tranformoer或類似的功能,或許是手機,或者是手表,未來這些能力都能被人所觸及。就比如說,早年軟盤只有1.44MB的存儲空間,而現在TWS耳機中的存儲空間都超過了幾十兆。
端側是AI非常好的載體,以手表為例,它是唯一一個長時間佩戴且緊貼皮膚的裝置,因此,非常方便成為健康監測裝置,隨著傳感器發展,心率、血壓信息都成為了可測量的數據。而最終,它會成為一個能夠隨時監測健康狀態的能手。
把幾億人的信息全部送到云端處理顯然不現實,而當邊緣端擁有AI,把專業的醫學知識灌注給它,它就會像一個移動醫生一樣,隨時判斷心率、血氧變化是否健康。這就是邊緣AI的重要意義,這樣的例子在邊緣AI中不勝枚舉。
當然,挑戰與機遇并存。對國產來說,在端側做AI挑戰有兩方面,一方面如何以更好的能效比、PPA來實現人工智能,另一方面則是在于芯片制造,如何利用主流制程做到先進制程的產品性能,這是國產芯片設計公司必須面對的挑戰。
自從ChatGPT問世,最大的變化是自學習和自適應,而在其中隱私是很大問題,未來端側也必然也要面對這樣的挑戰。
”我認為現在AI最缺乏的是生態。”事實上,芯片行業大多情況都會把重點放在硬件設計,但實際上,一個行業必須擁有自己的生態,國內更需要自己的生態。就比如說,TensorFlow與算力之前其實中間還間隔了很多層,或者說工具,如果能做好這一層,就能建設好更好的國產生態。炬芯也會持續深耕,為國產芯片與生態建設添磚加瓦。
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯系小編進行處理。
推薦閱讀:
以工藝窗口建模探索路徑:使用虛擬制造評估先進DRAM電容器圖形化的工藝窗口