無芯片不AI,芯片是支撐人工智能(néng)的基礎。2019年,雲端AI芯片迎來亞馬遜、高通、阿裡(lǐ)巴巴、Facebook等新玩家,軟硬一體化趨勢加強;終端芯片功耗比競争加強,語音芯片持續火熱;邊緣AI芯片勢頭初現。2020年,AI芯片將(jiāng)逐漸進(jìn)入洗牌期,機遇與挑戰并存。

邊緣AI芯片進(jìn)入搶灘戰

AI正在從雲端向(xiàng)邊緣端擴展,邊緣計算被視爲人工智能(néng)的下一個戰場。寒武紀副總裁劉道(dào)福表示,在邊緣計算種(zhǒng)類中,邊緣往往和各類傳感器相連,而傳感器的數據往往是非結構化的,很難直接用于控制和決策,因此需要邊緣人工智能(néng)計算將(jiāng)非結構化的數據結構化,從而用于控制和決策。

2019年,圍繞邊緣AI芯片的搶灘布局已經(jīng)開(kāi)始。一方面(miàn),英偉達、寒武紀、百度等已經(jīng)在雲、端有所積累的廠商,希望以邊緣芯片完善雲、邊、端生态,打造一體化的計算格局。英偉達發(fā)布了面(miàn)向(xiàng)嵌入式物聯網的邊緣計算設備Jetson Nano,适用于入門級網絡硬盤錄像機、家用機器人以及具備全面(miàn)分析功能(néng)的智能(néng)網關等應用,之後(hòu)又發(fā)布了邊緣AI超級計算機Jetson Xavier NX,能(néng)夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能(néng)。寒武紀發(fā)布用于深度學(xué)習的SoC邊緣加速芯片思元220,采用台積電16nm工藝,最大算力32TOPS(INT4),功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯合三大運營商、中興、愛立信、英特爾等,發(fā)起(qǐ)百度 AI 邊緣計算行動計劃,旨在利用 AI 推理、函數計算、大數據處理和産業模型訓練推動 AI 場景在邊緣計算的算力支撐和平台支持。

另一方面(miàn),自動駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量産國(guó)内首款車規級AI芯片“征程二代”,采用台積電28nm工藝,可提供超過(guò)4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務模式下可以同時運行超過(guò)60個分類任務,每秒鍾識别目标數超過(guò)2000個,面(miàn)向(xiàng)車聯網對(duì)強實時響應的需求。

多個新玩家入局雲端

雲端仍然是AI芯片的主要戰場。2019年,雲端芯片迎來多個新玩家,算力大戰持續升級。高通推出了面(miàn)向(xiàng)數據中心推理計算的雲端AI芯片Cloud AI 100,峰值性能(néng)超過(guò)350 TOPS,與其他商用方案相比每瓦特性能(néng)提升10倍。雲服務領跑者亞馬遜推出了機器學(xué)習推理芯片AWS Inferentia,最高算力爲128 TOPS,在AI推理實例inf1可搭載16個Inferentia芯片,提供最高2000TOPS算力。阿裡(lǐ)巴巴推出号稱全球最高性能(néng)AI推理芯片含光800,采用自研芯片架構和達摩院算法,在Resnet50基準測試中獲得單芯片性能(néng)第一。騰訊投資的燧原科技發(fā)布了面(miàn)向(xiàng)雲端數據中心的AI加速卡雲燧 T10,單卡單精度算力達到20TFLOPS,支持單精度FP32和半精度BF16的混合精度計算,并爲大中小型數據中心提供了單節點、單機櫃、集群三種(zhǒng)模式,在集群模式下通過(guò)片間互聯實現1024節點集群。

芯片是AI的載體,而軟件是完成(chéng)智能(néng)操作的核心。随着異構計算逐漸導入AI芯片,軟硬件協同成(chéng)爲雲端AI的重要趨勢。英特爾推出了面(miàn)向(xiàng)異構計算的統一軟件平台One API,以隐藏硬件複雜性,根據系統和硬件自動适配功耗最低、性能(néng)最佳的加速方式,簡化并優化編程過(guò)程。賽靈思也推出了軟件平台Vitis AI,向(xiàng)用戶開(kāi)放易于訪問的軟件接口,可根據軟件或算法自動适配賽靈思硬件架構。

功耗比仍是終端側重點

在終端側,功耗比仍然是角逐焦點。尤其在手機等對(duì)于續航能(néng)力锱铢必較的終端,主力廠商推出的AI引擎都(dōu)對(duì)低功耗有所強調。麒麟990 5G的NPU采用雙大核+微核的方式,大核負責性能(néng),微核擁有超低功耗。據介紹,微核在人臉檢測的應用場景下,能(néng)耗比大核工作降低24倍。高通發(fā)布的骁龍865集成(chéng)了傳感器中樞,讓終端能(néng)夠以極低功耗感知周圍情境。三星提出通過(guò)較低功耗的NPU實現終端設備上的AI處理,實現在設備端直接執行更複雜的任務。

除了手機,終端側的另一個當紅炸子雞是AI語音芯片。科大訊飛、阿裡(lǐ)巴巴、探境科技、清微智能(néng)等都(dōu)發(fā)布了針對(duì)智能(néng)家居的AI語音芯片,反映了AI芯片在特定領域的專業化、定制化趨勢。阿裡(lǐ)達摩院公布了首款專用于語音合成(chéng)算法的 AI FPGA芯片技術Ouroboros,使用了端上定制硬件加速技術,降低對(duì)雲端網絡的依賴,支持實時語音合成(chéng)和AI語音識别,有望在天貓精靈搭載。

2020機遇挑戰并存

2019-2021年,中國(guó)AI芯片市場規模仍將(jiāng)保持50%以上的增長(cháng)速度,到2021年,市場規模將(jiāng)達到305.7億元。賽迪智庫預測,2019-2021年,雲端訓練芯片增速放緩,雲端推理芯片、終端推理芯片市場增長(cháng)速度將(jiāng)持續呈上升趨勢。預計2021年,中國(guó)雲端訓練芯片市場規模將(jiāng)達到139.3億元,雲端推理芯片市場規模將(jiāng)達到82.2億元,終端推理芯片達到84.1億元。

集邦咨詢分析師姚嘉洋向(xiàng)記者指出,2019年,AI芯片大緻已經(jīng)走出一條較爲清晰的道(dào)路,端、邊、雲的芯片規格相對(duì)明确。2020年,各大芯片廠會延續在2019年的産品發(fā)展路徑,持續深化芯片的性價比及功耗比表現。從訓練端來看,值得關注的是HBM(高頻寬存儲器)的整合與相關的封裝技術良率,這(zhè)會牽動芯片廠商與存儲器及封測廠商之間合作關系的變化。推理端的決戰點在INT8領域,重點在于如何進(jìn)一步提升芯片本身的性能(néng)及功耗表現。

5G、VR/AR等新技術,也將(jiāng)爲AI芯片,尤其是邊緣側的AI芯片提供更多的發(fā)揮空間。Arm ML事(shì)業群商業與營銷副總裁Dennis Laudick曾向(xiàng)記者表示,5G通信技術改變了數據處理的方式,讓邊緣AI的工作負載也有了處理需求。可以說,5G帶來了網絡邊緣的更多創新。姚嘉洋也表示,AI在5G核心網絡存在機會,由于5G帶來了更多元的頻譜組合,AI可以輔助核心網絡更有效地調度網絡資源,將(jiāng)頻寬資源的利用達到極大化。同時,5G也涵蓋車聯網,AI將(jiāng)在自動駕駛將(jiāng)大有機會。在VR/AR端,AI也在導入,主要聚焦在人眼追蹤或是場景識别等應用,有望改善VR/AR的流暢度與實時性表現。

清華大學(xué)微電子所所長(cháng)魏少軍表示,從産業發(fā)展規律來看,在2019-2020年,AI芯片將(jiāng)持續火熱,企業紮堆進(jìn)入;但是到了2020年前後(hòu),則將(jiāng)會出現一批出局者,行業洗牌開(kāi)始。由于目前AI算法還(hái)在不斷演進(jìn)彙總的過(guò)程中,最終的成(chéng)功與否則將(jiāng)取決于各家技術路徑的選擇和産品落地的速度。

痛點尚待攻克

近兩(liǎng)年,AI在語音識别、圖像識别等應用領域取得突破,但要從單點突破走向(xiàng)全面(miàn)開(kāi)花,需要AI領域誕生如同CPU一樣的通用AI計算芯片。清華大學(xué)微納電子系副教授尹首一等專家指出,AI芯片短期内以異構計算爲主,中期要發(fā)展自重構、自學(xué)習、自适應,長(cháng)期則朝向(xiàng)通用計算芯片發(fā)展。

具體來說,AI要從應用适應硬件走向(xiàng)硬件适應應用,就要求AI芯片具備可編程性、動态可變的計算架構,來應對(duì)層出不窮的新算法和新應用。魏少軍表示,AI芯片一要适應算法的演進(jìn),二要有适應所有應用的架構,這(zhè)就要求架構具備高效的轉化能(néng)力。在成(chéng)本敏感的消費電子領域,還(hái)需關注AI芯片的計算效能(néng),達到低功耗、小體積、開(kāi)發(fā)簡易,這(zhè)些都(dōu)需要探索架構上的創新。

全球AI芯片産業仍處于産業化早期階段,國(guó)産處理器廠商與國(guó)際廠商在人工智能(néng)這(zhè)一全新賽場上處在同一起(qǐ)跑線。耐能(néng)創始人兼CEO 劉峻誠表示,中國(guó)擁有龐大的智能(néng)手機、智能(néng)家居、智能(néng)安防等市場,對(duì)中國(guó)的AI公司而言,不僅在服務國(guó)内客戶時具有本土化的優勢,還(hái)可借助這(zhè)些客戶的生産制造優勢進(jìn)軍海外市場,實現“立足中國(guó),放眼全球”的商業布局。