AI芯片怎麼(me)就進(jìn)入了洗牌期？ - 北京中代科技有限公司

無芯片不AI，芯片是支撐人工智能(néng)的基礎。2019年，雲端AI芯片迎來亞馬遜、高通、阿裡(lǐ)巴巴、Facebook等新玩家，軟硬一體化趨勢加強;終端芯片功耗比競争加強，語音芯片持續火熱;邊緣AI芯片勢頭初現。2020年，AI芯片將(jiāng)逐漸進(jìn)入洗牌期，機遇與挑戰并存。

邊緣AI芯片進(jìn)入搶灘戰

AI正在從雲端向(xiàng)邊緣端擴展，邊緣計算被視爲人工智能(néng)的下一個戰場。寒武紀副總裁劉道(dào)福表示，在邊緣計算種(zhǒng)類中，邊緣往往和各類傳感器相連，而傳感器的數據往往是非結構化的，很難直接用于控制和決策，因此需要邊緣人工智能(néng)計算將(jiāng)非結構化的數據結構化，從而用于控制和決策。

2019年，圍繞邊緣AI芯片的搶灘布局已經(jīng)開(kāi)始。一方面(miàn)，英偉達、寒武紀、百度等已經(jīng)在雲、端有所積累的廠商，希望以邊緣芯片完善雲、邊、端生态，打造一體化的計算格局。英偉達發(fā)布了面(miàn)向(xiàng)嵌入式物聯網的邊緣計算設備Jetson Nano，适用于入門級網絡硬盤錄像機、家用機器人以及具備全面(miàn)分析功能(néng)的智能(néng)網關等應用，之後(hòu)又發(fā)布了邊緣AI超級計算機Jetson Xavier NX，能(néng)夠在功耗10W的模式下提供最高14TOPS，在功耗15W模式下提供最高21 TOPS的性能(néng)。寒武紀發(fā)布用于深度學(xué)習的SoC邊緣加速芯片思元220，采用台積電16nm工藝，最大算力32TOPS(INT4)，功耗控制在10W，支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯合三大運營商、中興、愛立信、英特爾等，發(fā)起(qǐ)百度 AI 邊緣計算行動計劃，旨在利用 AI 推理、函數計算、大數據處理和産業模型訓練推動 AI 場景在邊緣計算的算力支撐和平台支持。

另一方面(miàn)，自動駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量産國(guó)内首款車規級AI芯片“征程二代”，采用台積電28nm工藝，可提供超過(guò)4TOPS的等效算力，典型功耗僅2瓦，延遲少于100毫秒，多任務模式下可以同時運行超過(guò)60個分類任務，每秒鍾識别目标數超過(guò)2000個，面(miàn)向(xiàng)車聯網對(duì)強實時響應的需求。

多個新玩家入局雲端

雲端仍然是AI芯片的主要戰場。2019年，雲端芯片迎來多個新玩家，算力大戰持續升級。高通推出了面(miàn)向(xiàng)數據中心推理計算的雲端AI芯片Cloud AI 100，峰值性能(néng)超過(guò)350 TOPS，與其他商用方案相比每瓦特性能(néng)提升10倍。雲服務領跑者亞馬遜推出了機器學(xué)習推理芯片AWS Inferentia,最高算力爲128 TOPS，在AI推理實例inf1可搭載16個Inferentia芯片，提供最高2000TOPS算力。阿裡(lǐ)巴巴推出号稱全球最高性能(néng)AI推理芯片含光800，采用自研芯片架構和達摩院算法，在Resnet50基準測試中獲得單芯片性能(néng)第一。騰訊投資的燧原科技發(fā)布了面(miàn)向(xiàng)雲端數據中心的AI加速卡雲燧 T10，單卡單精度算力達到20TFLOPS，支持單精度FP32和半精度BF16的混合精度計算，并爲大中小型數據中心提供了單節點、單機櫃、集群三種(zhǒng)模式，在集群模式下通過(guò)片間互聯實現1024節點集群。

芯片是AI的載體，而軟件是完成(chéng)智能(néng)操作的核心。随着異構計算逐漸導入AI芯片，軟硬件協同成(chéng)爲雲端AI的重要趨勢。英特爾推出了面(miàn)向(xiàng)異構計算的統一軟件平台One API，以隐藏硬件複雜性，根據系統和硬件自動适配功耗最低、性能(néng)最佳的加速方式，簡化并優化編程過(guò)程。賽靈思也推出了軟件平台Vitis AI，向(xiàng)用戶開(kāi)放易于訪問的軟件接口，可根據軟件或算法自動适配賽靈思硬件架構。

功耗比仍是終端側重點

在終端側，功耗比仍然是角逐焦點。尤其在手機等對(duì)于續航能(néng)力锱铢必較的終端，主力廠商推出的AI引擎都(dōu)對(duì)低功耗有所強調。麒麟990 5G的NPU采用雙大核+微核的方式，大核負責性能(néng)，微核擁有超低功耗。據介紹，微核在人臉檢測的應用場景下，能(néng)耗比大核工作降低24倍。高通發(fā)布的骁龍865集成(chéng)了傳感器中樞，讓終端能(néng)夠以極低功耗感知周圍情境。三星提出通過(guò)較低功耗的NPU實現終端設備上的AI處理，實現在設備端直接執行更複雜的任務。

除了手機，終端側的另一個當紅炸子雞是AI語音芯片。科大訊飛、阿裡(lǐ)巴巴、探境科技、清微智能(néng)等都(dōu)發(fā)布了針對(duì)智能(néng)家居的AI語音芯片，反映了AI芯片在特定領域的專業化、定制化趨勢。阿裡(lǐ)達摩院公布了首款專用于語音合成(chéng)算法的 AI FPGA芯片技術Ouroboros，使用了端上定制硬件加速技術，降低對(duì)雲端網絡的依賴，支持實時語音合成(chéng)和AI語音識别，有望在天貓精靈搭載。

2020機遇挑戰并存

2019-2021年，中國(guó)AI芯片市場規模仍將(jiāng)保持50%以上的增長(cháng)速度，到2021年，市場規模將(jiāng)達到305.7億元。賽迪智庫預測，2019-2021年，雲端訓練芯片增速放緩，雲端推理芯片、終端推理芯片市場增長(cháng)速度將(jiāng)持續呈上升趨勢。預計2021年，中國(guó)雲端訓練芯片市場規模將(jiāng)達到139.3億元，雲端推理芯片市場規模將(jiāng)達到82.2億元，終端推理芯片達到84.1億元。

集邦咨詢分析師姚嘉洋向(xiàng)記者指出，2019年，AI芯片大緻已經(jīng)走出一條較爲清晰的道(dào)路，端、邊、雲的芯片規格相對(duì)明确。2020年，各大芯片廠會延續在2019年的産品發(fā)展路徑，持續深化芯片的性價比及功耗比表現。從訓練端來看，值得關注的是HBM(高頻寬存儲器)的整合與相關的封裝技術良率，這(zhè)會牽動芯片廠商與存儲器及封測廠商之間合作關系的變化。推理端的決戰點在INT8領域，重點在于如何進(jìn)一步提升芯片本身的性能(néng)及功耗表現。

5G、VR/AR等新技術，也將(jiāng)爲AI芯片，尤其是邊緣側的AI芯片提供更多的發(fā)揮空間。Arm ML事(shì)業群商業與營銷副總裁Dennis Laudick曾向(xiàng)記者表示，5G通信技術改變了數據處理的方式，讓邊緣AI的工作負載也有了處理需求。可以說，5G帶來了網絡邊緣的更多創新。姚嘉洋也表示，AI在5G核心網絡存在機會，由于5G帶來了更多元的頻譜組合，AI可以輔助核心網絡更有效地調度網絡資源，將(jiāng)頻寬資源的利用達到極大化。同時，5G也涵蓋車聯網，AI將(jiāng)在自動駕駛將(jiāng)大有機會。在VR/AR端，AI也在導入，主要聚焦在人眼追蹤或是場景識别等應用，有望改善VR/AR的流暢度與實時性表現。

清華大學(xué)微電子所所長(cháng)魏少軍表示，從産業發(fā)展規律來看，在2019-2020年，AI芯片將(jiāng)持續火熱，企業紮堆進(jìn)入;但是到了2020年前後(hòu)，則將(jiāng)會出現一批出局者，行業洗牌開(kāi)始。由于目前AI算法還(hái)在不斷演進(jìn)彙總的過(guò)程中，最終的成(chéng)功與否則將(jiāng)取決于各家技術路徑的選擇和産品落地的速度。

痛點尚待攻克

近兩(liǎng)年，AI在語音識别、圖像識别等應用領域取得突破，但要從單點突破走向(xiàng)全面(miàn)開(kāi)花，需要AI領域誕生如同CPU一樣的通用AI計算芯片。清華大學(xué)微納電子系副教授尹首一等專家指出，AI芯片短期内以異構計算爲主，中期要發(fā)展自重構、自學(xué)習、自适應，長(cháng)期則朝向(xiàng)通用計算芯片發(fā)展。

具體來說，AI要從應用适應硬件走向(xiàng)硬件适應應用，就要求AI芯片具備可編程性、動态可變的計算架構，來應對(duì)層出不窮的新算法和新應用。魏少軍表示，AI芯片一要适應算法的演進(jìn)，二要有适應所有應用的架構，這(zhè)就要求架構具備高效的轉化能(néng)力。在成(chéng)本敏感的消費電子領域，還(hái)需關注AI芯片的計算效能(néng)，達到低功耗、小體積、開(kāi)發(fā)簡易，這(zhè)些都(dōu)需要探索架構上的創新。

全球AI芯片産業仍處于産業化早期階段，國(guó)産處理器廠商與國(guó)際廠商在人工智能(néng)這(zhè)一全新賽場上處在同一起(qǐ)跑線。耐能(néng)創始人兼CEO 劉峻誠表示，中國(guó)擁有龐大的智能(néng)手機、智能(néng)家居、智能(néng)安防等市場，對(duì)中國(guó)的AI公司而言，不僅在服務國(guó)内客戶時具有本土化的優勢，還(hái)可借助這(zhè)些客戶的生産制造優勢進(jìn)軍海外市場，實現“立足中國(guó)，放眼全球”的商業布局。