寒武紀科創闆新進(jìn)展,AI芯片第一股將(jiāng)至

寒武紀科創闆新進(jìn)展,AI芯片第一股將(jiāng)至

6月23日,媒體報道(dào),證監會宣布同意寒武紀科創闆首次公開(kāi)發(fā)行股票注冊,科創闆將(jiāng)迎來國(guó)内首家人工智能(néng)芯片領域龍頭公司。

資料顯示,寒武紀成(chéng)立于2016年3月,注冊資本3.6億元,公司主業爲應用于各類雲服務器、邊緣計算設備、終端設備中人工智能(néng)核心芯片的研發(fā)、設計和銷售,主要産品包括終端智能(néng)處理器IP、雲端智能(néng)芯片及加速卡、邊緣智能(néng)芯片及加速卡以及與上述産品配套的基礎系統軟件平台。

産品方面(miàn),寒武紀先後(hòu)推出了用于終端場景的寒武紀1A、寒武紀1H、寒武紀1M系列芯片,基于思元100和思元270芯片的雲端智能(néng)加速卡系列産品以及基于思元220芯片的邊緣智能(néng)加速卡等産品。

客戶方面(miàn),雖然成(chéng)立不久,但寒武紀已爲華爲海思、紫光展銳、晨星(MStar)/星宸半導體等多家公司的SoC芯片和智能(néng)終端提供智能(néng)處理器IP。

招股書顯示,寒武紀此次IPO計劃融資28.01億元,將(jiāng)投入到新一代雲端訓練芯片及系統、新一代雲端推理芯片及系統、新一代邊緣人工智能(néng)芯片及系統、補充流動資金4個項目中。

接受上市輔導 AI芯片企業寒武紀開(kāi)啓科創闆IPO征程

接受上市輔導 AI芯片企業寒武紀開(kāi)啓科創闆IPO征程

日前,中國(guó)證監會北京監管局披露了中信證券關于中科寒武紀科技股份有限公司(以下簡稱“寒武紀”)首次公開(kāi)發(fā)行股票并科創闆上市之輔導基本情況表。信息顯示,寒武紀與中信證券于2019年12月5日簽署關于首次公開(kāi)發(fā)行A股股票之輔導協議。

根據輔導備案信息,此次輔導目的包括促進(jìn)公司建立良好(hǎo)的公司治理結構,形成(chéng)獨立運營和持續發(fā)展的能(néng)力,督促寒武紀的董事(shì)、監事(shì)、高級管理人員及持股5%以上(含5%)股東和實際控制人(或其法定代表人)全面(miàn)理解境内發(fā)行上市的有關法律法規、境内證券市場規範運作和信息披露的要求,樹立進(jìn)入證券市場的誠信意識、法制意識,具備進(jìn)入證券市場的基本條件;同時促進(jìn)輔導機構履行勤勉盡責義務。

資料顯示,寒武紀成(chéng)立于2016年3月,注冊資本3.6億元,其團隊來源于中科院計算所,主要聚焦端雲一體、端雲融合的智能(néng)新生态,緻力打造各類智能(néng)雲服務器、智能(néng)終端以及智能(néng)機器人的核心處理器芯片,并爲用戶提供IP授權、芯片服務、智能(néng)子卡和智能(néng)平台等服務。

雖成(chéng)立不久,但寒武紀已爲華爲海思、紫光展銳、晨星(MStar)/星宸半導體等多家公司的SoC芯片和智能(néng)終端提供智能(néng)處理器IP,此前華爲麒麟970芯片和麒麟980芯片均采用了寒武紀的NPU(神經(jīng)網絡單元),而這(zhè)兩(liǎng)款芯片已搭載于華爲多款旗艦手機上。

在産品方面(miàn),寒武紀于2016年推出了首款AI處理器;2018年,寒武紀推出思元100(MLU100)機器學(xué)習處理器芯片;2019年6月,寒武紀推出雲端AI芯片中文品牌“思元”、第二代雲端AI芯片思元270(MLU270)及闆卡産品;2019年11月,寒武紀發(fā)布邊緣AI系列産品思元220(MLU220)芯片及模組産品。

近年來,人工智能(néng)在國(guó)内掀起(qǐ)投資熱潮,作爲人工智能(néng)芯片領域的獨角獸,寒武紀在資本市場上頗受青睐。工商資料顯示,寒武紀此前已進(jìn)行了多輪融資,投資方包括中科院、阿裡(lǐ)巴巴、聯想創投、科大訊飛、國(guó)投創業等一衆明星資本。

2016年4月,寒武紀獲得來自中科院的數千萬元天使輪融資;2016年8月,寒武紀獲得來自元禾原點、科大訊飛、湧铧投資的Pre-A輪融資;2017年8月,寒武紀完成(chéng)1億美元A輪融資,投資方包括聯想創投、阿裡(lǐ)巴巴創投、國(guó)投創業,國(guó)科投資、中科圖靈、元禾原點、湧铧投資。2018年6月,寒武紀完成(chéng)由中國(guó)國(guó)有資本風險投資基金、國(guó)新啓迪、國(guó)投創業、國(guó)新資本聯合領投的數億美元B輪融資;2019年,寒武紀亦完成(chéng)了股權融資,注冊資本多次擴增。

随着5G時代到來,人工智能(néng)的應用將(jiāng)有望走向(xiàng)新階段,而人工智能(néng)芯片作爲基石與核心,亦將(jiāng)迎來新一輪發(fā)展,登陸資本市場有利于寒武紀持續大規模投入研發(fā),科創闆爲其提供了一個好(hǎo)機會。如今,寒武紀已進(jìn)行上市輔導,正式踏上了IPO之路,但最終能(néng)否結果如何則有待後(hòu)續觀察。

接受上市輔導 寒武紀拟登陸科創闆

接受上市輔導 寒武紀拟登陸科創闆

人工智能(néng)芯片巨頭中科寒武紀科技股份有限公司(以下簡稱“寒武紀”)向(xiàng)科創闆發(fā)起(qǐ)沖擊。北京證監局官網2月28日晚間披露的信息顯示,中信證券與寒武紀在2019年12月5日簽署輔導協議,寒武紀計劃在科創闆上市。

具體來看,中信證券和寒武紀于2019年12月5日簽署《中科寒武紀科技股份有限公司與中信證券股份有限公司關于首次公開(kāi)發(fā)行A股股票之輔導協議》。

通報信息顯示,寒武紀拟在科創闆上市。此次中信證券對(duì)其進(jìn)行上市輔導目的在于促進(jìn)寒武紀建立良好(hǎo)的公司治理結構,形成(chéng)獨立運營和持續發(fā)展的能(néng)力,督促寒武紀的董事(shì)、監事(shì)、高級管理人員及持股5%以上(含5%)股東和實際控制人(或其法定代表人)全面(miàn)理解境内發(fā)行上市的有關法律法規、境内證券市場規範運作和信息披露的要求,樹立進(jìn)入證券市場的誠信意識、法制意識,具備進(jìn)入證券市場的基本條件。同時,促進(jìn)輔導機構履行勤勉盡責義務。

公開(kāi)資料顯示,寒武紀成(chéng)立于2016年,是聚焦端雲一體、端雲融合的智能(néng)新生态,緻力打造各類智能(néng)雲服務器、智能(néng)終端以及智能(néng)機器人核心處理器芯片的AI芯片領域獨角獸。寒武紀與中國(guó)電信、中興通訊等均有合作。

“未來之芯” IC PARK 年産值已突破240億元

“未來之芯” IC PARK 年産值已突破240億元

剛滿周歲,“未來之芯”IC PARK 年産值已突破240億元5G與AI的齊頭并進(jìn),使得中國(guó)集成(chéng)電路在制造、封測、設計領域迎來了前所未有的發(fā)展機遇。

5G芯片市場上演了一出“強強争霸”的大戲。

2019年的12月5日,高通推出了全新處理器“骁龍865”和“骁龍765/765G”。就在同一天,華爲發(fā)布已經(jīng)搭載了麒麟990芯片的最新款5G手機nova6。再早些時候,聯發(fā)科舉行5G方案發(fā)布會,在中國(guó)正式推出“天玑1000”,三星Exynos 980也于2019年9月問世。一場5G二代芯片的競技正式拉開(kāi)帷幕。

5G芯片行業鏖戰未消,AI技術也開(kāi)始走向(xiàng)商業化階段,中國(guó)芯片産業正處在一個高速發(fā)展的時期。各方面(miàn)利好(hǎo)不斷,以中關村集成(chéng)電路設計園(IC PARK)爲代表的各地集成(chéng)電路産業園區也日漸成(chéng)熟,讓業界對(duì)芯片産業的未來十分看好(hǎo)。

IC和AI正在引發(fā)一場深刻變革

被譽爲現代工業“糧食”的芯片,一定程度上也被視爲國(guó)家科技創新能(néng)力的體現。直到最近幾年,以華爲、中興爲首的中國(guó)科技企業才開(kāi)始嶄露頭角。

“5G是三十年一遇的大變化,很多産業和模式將(jiāng)被颠覆。”中國(guó)移動前董事(shì)長(cháng)王建宙曾在公開(kāi)場合這(zhè)樣表示。從諾基亞,到摩托羅拉,無數事(shì)實證明,每一代通信技術的更叠,都(dōu)伴随着手機品牌和芯片廠商的洗牌。

行業從來不缺乏掉隊者,受制于技術與市場等諸多因素,目前全球能(néng)夠參與5G芯片競争的也隻有高通、三星、華爲、聯發(fā)科以及展銳。

行業也從不缺乏後(hòu)繼者,國(guó)内一國(guó)産手機廠商負責人曾表示:“如果想要做更好(hǎo)的産品,芯片自研是一條必經(jīng)之路,雖然投資巨大,但在行業内,逐漸成(chéng)爲共識。”目前,包括蘋果、三星、華爲、小米、OPPO和vivo在内的手機廠商都(dōu)在芯片層面(miàn)或早或晚開(kāi)始了投資。

“新陳代謝”正在行業的各個層面(miàn)悄無聲息地進(jìn)行着,在市場巨大潛力的推動下,誰都(dōu)有可能(néng)成(chéng)爲下一個科技巨頭。

在5G芯片行業之外,一場人工智能(néng)的變革也正在醞釀着。經(jīng)過(guò)幾年的發(fā)酵,中國(guó)的AI技術已經(jīng)取得了巨大的進(jìn)步。

技術的進(jìn)步帶來市場的增長(cháng),到2020年我國(guó)人工智能(néng)産業規模有望突破1600億元,帶動相關産業突破1萬億元。

5G與AI的齊頭并進(jìn),使得中國(guó)集成(chéng)電路的技術和市場均保持良好(hǎo)的發(fā)展态勢。IC PARK也給自己定下了“打造世界一流的集成(chéng)電路設計産業園區”的目标,進(jìn)一步優化營商環境,提高園區綜合服務能(néng)力,增強對(duì)高端企業和項目吸引力。

理性投資,全面(miàn)發(fā)展

在前不久的一場智能(néng)大會上,李開(kāi)複如此說到:“AI行業正在回歸理性,這(zhè)是一個退潮知道(dào)誰在裸泳的時刻,需要回歸商業本質。”他透露,AI作爲最火的投資領域,曾有過(guò)許多不理性的投資,導緻一些企業被過(guò)高估值。而到了2019年,上市則成(chéng)爲了他們無法越過(guò)的大山。

但回歸理性,并不意味着市場冷卻,事(shì)實上,更多的優質融投資正在改變AI行業的現狀。

AI行業白皮書顯示,2019年,産業資本和企業投資正在快速跟進(jìn)。同時,AI技術與傳統行業進(jìn)一步産生了實質性融合,得益于聊天機器人和智能(néng)對(duì)話終端應用的大規模落地,企業級、消費級對(duì)話式人工智能(néng)平台市場驅動了整個人工智能(néng)軟件市場的發(fā)展。

資金實力強勁的互聯網巨頭也加強了AI産業的戰略布局。阿裡(lǐ)巴巴重點布局安防和基礎組件,投資了商湯、曠視和寒武紀科技等;騰訊投資的重點主要集中在智慧健康、教育、智慧汽車等領域,代表性的公司包括蔚來汽車、碳雲智慧等企業;百度投資的重點主要在汽車、零售和智慧家居等領域。

一場關乎未來的投資之戰正在上演,而這(zhè)也表明,我國(guó)人工智能(néng)已進(jìn)入商業化階段。

行業的跨越性發(fā)展,使得市場對(duì)人才的需求劇增。根據《中國(guó)集成(chéng)電路産業人才白皮書(2018-2019年版)》,到2020年前後(hòu),我國(guó)集成(chéng)電路行業人才需求規模約爲72萬人左右,而我國(guó)現有人才存量46萬人,人才缺口將(jiāng)達到26萬人。城市之間,圍繞着人才的争奪未曾停歇,各地紛紛出台人才政策,一個個激勵IC創新研發(fā)的項目也在高校落地。

在區域産業聚集方面(miàn),中國(guó)集成(chéng)電路已經(jīng)形成(chéng)上海爲中心的長(cháng)三角、北京爲中心的環渤海、深圳爲中心的泛珠三角以及武漢、西安、成(chéng)都(dōu)爲代表的中西部四個各具特色的産業集聚區;北京、上海、合肥等數十個城市已建或者準備建設集成(chéng)電路産業園。

IC PARK位于北京市海澱區,是一所建築面(miàn)積近22萬平方米的IC設計産業園,正在以超越行業整體發(fā)展的速度,成(chéng)爲全國(guó)領先的園區範本,也爲行業提供了諸多值得借鑒的經(jīng)驗。

被點贊的IC PARK ,如何做到了行業領先

好(hǎo)的園區要有頭部企業,産生聚集效應;要有優秀設計人才,打造人才聚集高地;要有政策支持,扶持引導戰略性産業發(fā)展;要有貼心服務,培養優秀的運營服務團隊,用好(hǎo)公共科技創新服務平台。

政策、企業、人才、服務四個方面(miàn),也正是IC PAKR的優勢所在。

經(jīng)濟學(xué)家馬光遠曾表示:“在下一個十年,海澱最有前景的地方就是海澱北部新區,北京科技創新的新增長(cháng)點以及中關村未來的新發(fā)展就在海澱北部新區。”

依托于海澱北部新區的IC PARK,是北京“三城一區”的發(fā)展戰略中,中關村科學(xué)城的核心之一,享受首都(dōu)扶持創新産業和引進(jìn)創新人才的政策優惠,入駐園區的企業在稅收方面(miàn),可以兩(liǎng)年免征,三至五年按25%的法定稅率減半征收企業所得稅。

不僅如此,這(zhè)裡(lǐ)還(hái)彙聚了清華大學(xué)、北京大學(xué)、中國(guó)人民大學(xué)等一批高精尖科研院校,是中國(guó)人才最紮堆的區域。

ICPARK董事(shì)長(cháng)苗軍曾總結到:“IC PARK最大的優勢其實也是北京的優勢,那就是人才、技術、項目、資本密集。”

在園區的服務上,IC PARK構建了“一平台三節點”産業服務體系。一平台指線上線下相結合的一站式企業服務平台,構建面(miàn)向(xiàng)企業全生命周期的全方位、全過(guò)程服務價值鏈,其中的“三個節點”指的是投融資節點、孵化節點和人才節點。

近日,IC PARK主導的集成(chéng)電路産業基金——芯創基金正式成(chéng)立。這(zhè)标志IC PARK以芯創基金爲主導,“科技金融+認股權池+基金投資”的全生命周期的投融資體系已經(jīng)形成(chéng)。IC PARK成(chéng)立的認股權池,與進(jìn)駐園區企業簽署認股權協議,在企業的增資擴股中,園區享有認股權,助力企業發(fā)展。

據了解,芯創基金總投資規模達15億元,重點關注5G、雲計算、汽車電子和AIOT等領域的投資。在2019年,芯創基金接收企業商業計劃書300餘個,調研對(duì)接企業150餘家,儲備項目40餘個,立項5個,實現當年成(chéng)立當年投資。2020年還(hái)將(jiāng)持續聚焦集成(chéng)電路行業,預計投資額1.2億左右。

在孵化方面(miàn),爲了扶持中小型、創業公司的發(fā)展,IC PARK設立了3000平米孵化器“芯創空間”,以供小型的IC設計企業在園區進(jìn)行獨立研發(fā)或與園區内的大公司展開(kāi)合作,還(hái)配有導師團隊輔導創業者。

在人才方面(miàn),IC PARK聯合七所在京示範性微電子學(xué)院和北京半導體行業協會、賽迪智庫、中關村芯園、安博教育、摩爾精英共同發(fā)起(qǐ)成(chéng)立中關村芯學(xué)院,園區與龍頭企業共同發(fā)起(qǐ)成(chéng)立人才産業化聯盟,充分利用海澱區的人才資源,搭建起(qǐ)高校與企業人才培養和成(chéng)果轉化的橋梁,通過(guò)培養集成(chéng)電路領域的複合型人才,助力“芯火”雙創平台的建設與實施,緩解集成(chéng)電路人才痛點問題。

芯片産業最關鍵的是産業鏈建設,在這(zhè)方面(miàn),以龍頭企業爲引領、中小微創企業爲補充,吸引了比特大陸、兆易創新、兆芯等數十家頭部企業進(jìn)駐,彙聚芯片企業50多家,産業組織模式日益成(chéng)熟,産業配套也日益完善。

向(xiàng)來重視文化、生活配套的IC PARK,還(hái)在載體空間以及服務手段上進(jìn)行了革新與創造。園區内配置了北京市唯一一家2000平方米的專業集成(chéng)電路科技館、建築面(miàn)積4200平方米的配套圖書館、2400平方米的IC國(guó)際會議中心,以及能(néng)夠滿足IC精英品質生活需求的兩(liǎng)萬平米的商業街區……足不出園,入駐人員的大部分商務、生活、交流需求都(dōu)可以被滿足。不設圍牆的開(kāi)放式空間布局,也惠及周邊企業和居民。

如今,開(kāi)園剛滿周年的IC PARK,IC設計企業的年産值已經(jīng)達到240億元,占據全市集成(chéng)電路設計領域産值的42%,創造稅收40億元,企業研發(fā)投入5億元,專利數也達到了6068項,成(chéng)爲了一顆“未來之芯”。

AI芯片怎麼(me)就進(jìn)入了洗牌期?

AI芯片怎麼(me)就進(jìn)入了洗牌期?

無芯片不AI,芯片是支撐人工智能(néng)的基礎。2019年,雲端AI芯片迎來亞馬遜、高通、阿裡(lǐ)巴巴、Facebook等新玩家,軟硬一體化趨勢加強;終端芯片功耗比競争加強,語音芯片持續火熱;邊緣AI芯片勢頭初現。2020年,AI芯片將(jiāng)逐漸進(jìn)入洗牌期,機遇與挑戰并存。

邊緣AI芯片進(jìn)入搶灘戰

AI正在從雲端向(xiàng)邊緣端擴展,邊緣計算被視爲人工智能(néng)的下一個戰場。寒武紀副總裁劉道(dào)福表示,在邊緣計算種(zhǒng)類中,邊緣往往和各類傳感器相連,而傳感器的數據往往是非結構化的,很難直接用于控制和決策,因此需要邊緣人工智能(néng)計算將(jiāng)非結構化的數據結構化,從而用于控制和決策。

2019年,圍繞邊緣AI芯片的搶灘布局已經(jīng)開(kāi)始。一方面(miàn),英偉達、寒武紀、百度等已經(jīng)在雲、端有所積累的廠商,希望以邊緣芯片完善雲、邊、端生态,打造一體化的計算格局。英偉達發(fā)布了面(miàn)向(xiàng)嵌入式物聯網的邊緣計算設備Jetson Nano,适用于入門級網絡硬盤錄像機、家用機器人以及具備全面(miàn)分析功能(néng)的智能(néng)網關等應用,之後(hòu)又發(fā)布了邊緣AI超級計算機Jetson Xavier NX,能(néng)夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能(néng)。寒武紀發(fā)布用于深度學(xué)習的SoC邊緣加速芯片思元220,采用台積電16nm工藝,最大算力32TOPS(INT4),功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯合三大運營商、中興、愛立信、英特爾等,發(fā)起(qǐ)百度 AI 邊緣計算行動計劃,旨在利用 AI 推理、函數計算、大數據處理和産業模型訓練推動 AI 場景在邊緣計算的算力支撐和平台支持。

另一方面(miàn),自動駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量産國(guó)内首款車規級AI芯片“征程二代”,采用台積電28nm工藝,可提供超過(guò)4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務模式下可以同時運行超過(guò)60個分類任務,每秒鍾識别目标數超過(guò)2000個,面(miàn)向(xiàng)車聯網對(duì)強實時響應的需求。

多個新玩家入局雲端

雲端仍然是AI芯片的主要戰場。2019年,雲端芯片迎來多個新玩家,算力大戰持續升級。高通推出了面(miàn)向(xiàng)數據中心推理計算的雲端AI芯片Cloud AI 100,峰值性能(néng)超過(guò)350 TOPS,與其他商用方案相比每瓦特性能(néng)提升10倍。雲服務領跑者亞馬遜推出了機器學(xué)習推理芯片AWS Inferentia,最高算力爲128 TOPS,在AI推理實例inf1可搭載16個Inferentia芯片,提供最高2000TOPS算力。阿裡(lǐ)巴巴推出号稱全球最高性能(néng)AI推理芯片含光800,采用自研芯片架構和達摩院算法,在Resnet50基準測試中獲得單芯片性能(néng)第一。騰訊投資的燧原科技發(fā)布了面(miàn)向(xiàng)雲端數據中心的AI加速卡雲燧 T10,單卡單精度算力達到20TFLOPS,支持單精度FP32和半精度BF16的混合精度計算,并爲大中小型數據中心提供了單節點、單機櫃、集群三種(zhǒng)模式,在集群模式下通過(guò)片間互聯實現1024節點集群。

芯片是AI的載體,而軟件是完成(chéng)智能(néng)操作的核心。随着異構計算逐漸導入AI芯片,軟硬件協同成(chéng)爲雲端AI的重要趨勢。英特爾推出了面(miàn)向(xiàng)異構計算的統一軟件平台One API,以隐藏硬件複雜性,根據系統和硬件自動适配功耗最低、性能(néng)最佳的加速方式,簡化并優化編程過(guò)程。賽靈思也推出了軟件平台Vitis AI,向(xiàng)用戶開(kāi)放易于訪問的軟件接口,可根據軟件或算法自動适配賽靈思硬件架構。

功耗比仍是終端側重點

在終端側,功耗比仍然是角逐焦點。尤其在手機等對(duì)于續航能(néng)力锱铢必較的終端,主力廠商推出的AI引擎都(dōu)對(duì)低功耗有所強調。麒麟990 5G的NPU采用雙大核+微核的方式,大核負責性能(néng),微核擁有超低功耗。據介紹,微核在人臉檢測的應用場景下,能(néng)耗比大核工作降低24倍。高通發(fā)布的骁龍865集成(chéng)了傳感器中樞,讓終端能(néng)夠以極低功耗感知周圍情境。三星提出通過(guò)較低功耗的NPU實現終端設備上的AI處理,實現在設備端直接執行更複雜的任務。

除了手機,終端側的另一個當紅炸子雞是AI語音芯片。科大訊飛、阿裡(lǐ)巴巴、探境科技、清微智能(néng)等都(dōu)發(fā)布了針對(duì)智能(néng)家居的AI語音芯片,反映了AI芯片在特定領域的專業化、定制化趨勢。阿裡(lǐ)達摩院公布了首款專用于語音合成(chéng)算法的 AI FPGA芯片技術Ouroboros,使用了端上定制硬件加速技術,降低對(duì)雲端網絡的依賴,支持實時語音合成(chéng)和AI語音識别,有望在天貓精靈搭載。

2020機遇挑戰并存

2019-2021年,中國(guó)AI芯片市場規模仍將(jiāng)保持50%以上的增長(cháng)速度,到2021年,市場規模將(jiāng)達到305.7億元。賽迪智庫預測,2019-2021年,雲端訓練芯片增速放緩,雲端推理芯片、終端推理芯片市場增長(cháng)速度將(jiāng)持續呈上升趨勢。預計2021年,中國(guó)雲端訓練芯片市場規模將(jiāng)達到139.3億元,雲端推理芯片市場規模將(jiāng)達到82.2億元,終端推理芯片達到84.1億元。

集邦咨詢分析師姚嘉洋向(xiàng)記者指出,2019年,AI芯片大緻已經(jīng)走出一條較爲清晰的道(dào)路,端、邊、雲的芯片規格相對(duì)明确。2020年,各大芯片廠會延續在2019年的産品發(fā)展路徑,持續深化芯片的性價比及功耗比表現。從訓練端來看,值得關注的是HBM(高頻寬存儲器)的整合與相關的封裝技術良率,這(zhè)會牽動芯片廠商與存儲器及封測廠商之間合作關系的變化。推理端的決戰點在INT8領域,重點在于如何進(jìn)一步提升芯片本身的性能(néng)及功耗表現。

5G、VR/AR等新技術,也將(jiāng)爲AI芯片,尤其是邊緣側的AI芯片提供更多的發(fā)揮空間。Arm ML事(shì)業群商業與營銷副總裁Dennis Laudick曾向(xiàng)記者表示,5G通信技術改變了數據處理的方式,讓邊緣AI的工作負載也有了處理需求。可以說,5G帶來了網絡邊緣的更多創新。姚嘉洋也表示,AI在5G核心網絡存在機會,由于5G帶來了更多元的頻譜組合,AI可以輔助核心網絡更有效地調度網絡資源,將(jiāng)頻寬資源的利用達到極大化。同時,5G也涵蓋車聯網,AI將(jiāng)在自動駕駛將(jiāng)大有機會。在VR/AR端,AI也在導入,主要聚焦在人眼追蹤或是場景識别等應用,有望改善VR/AR的流暢度與實時性表現。

清華大學(xué)微電子所所長(cháng)魏少軍表示,從産業發(fā)展規律來看,在2019-2020年,AI芯片將(jiāng)持續火熱,企業紮堆進(jìn)入;但是到了2020年前後(hòu),則將(jiāng)會出現一批出局者,行業洗牌開(kāi)始。由于目前AI算法還(hái)在不斷演進(jìn)彙總的過(guò)程中,最終的成(chéng)功與否則將(jiāng)取決于各家技術路徑的選擇和産品落地的速度。

痛點尚待攻克

近兩(liǎng)年,AI在語音識别、圖像識别等應用領域取得突破,但要從單點突破走向(xiàng)全面(miàn)開(kāi)花,需要AI領域誕生如同CPU一樣的通用AI計算芯片。清華大學(xué)微納電子系副教授尹首一等專家指出,AI芯片短期内以異構計算爲主,中期要發(fā)展自重構、自學(xué)習、自适應,長(cháng)期則朝向(xiàng)通用計算芯片發(fā)展。

具體來說,AI要從應用适應硬件走向(xiàng)硬件适應應用,就要求AI芯片具備可編程性、動态可變的計算架構,來應對(duì)層出不窮的新算法和新應用。魏少軍表示,AI芯片一要适應算法的演進(jìn),二要有适應所有應用的架構,這(zhè)就要求架構具備高效的轉化能(néng)力。在成(chéng)本敏感的消費電子領域,還(hái)需關注AI芯片的計算效能(néng),達到低功耗、小體積、開(kāi)發(fā)簡易,這(zhè)些都(dōu)需要探索架構上的創新。

全球AI芯片産業仍處于産業化早期階段,國(guó)産處理器廠商與國(guó)際廠商在人工智能(néng)這(zhè)一全新賽場上處在同一起(qǐ)跑線。耐能(néng)創始人兼CEO 劉峻誠表示,中國(guó)擁有龐大的智能(néng)手機、智能(néng)家居、智能(néng)安防等市場,對(duì)中國(guó)的AI公司而言,不僅在服務國(guó)内客戶時具有本土化的優勢,還(hái)可借助這(zhè)些客戶的生産制造優勢進(jìn)軍海外市場,實現“立足中國(guó),放眼全球”的商業布局。

三星14nm助攻 百度AI芯片昆侖明年量産

三星14nm助攻 百度AI芯片昆侖明年量産

在雲端資料庫需求激增的當下,百度與三星共同宣布,將(jiāng)以百度自行開(kāi)發(fā)完成(chéng)的“昆侖”人工智能(néng)處理器爲基礎,2020年初以三星的14納米制程打造雲端服務器處理器。

根據雙方共同公布的資料顯示,百度“崑侖”人工智能(néng)處理器主要針對(duì)雲端運算、邊緣運算等應用所開(kāi)發(fā)的人工智能(néng)的類神經(jīng)處理器(XPU)架構。而處理器預計將(jiāng)采用三星的14納米制程技術,以及旗下的I-Cube TM封裝解決方案來打造。

百度表示,這(zhè)款處理器將(jiāng)能(néng)提供512GBps的存儲器頻寬,在150瓦的功率下達成(chéng)260TOPS的運算效能(néng)。此外,這(zhè)款新的處理器還(hái)將(jiāng)支援針對(duì)自然語言處理的預訓練模型Ernie,使得整體的推理速度比傳統GPU或FPGA的加速模型快3倍。

百度進(jìn)一步指出,藉助這(zhè)款芯片的計算能(néng)力和能(néng)效,百度可以支援包括大規模人工智能(néng)預算在内的多種(zhǒng)功能(néng),例如搜尋排序、語音識别、圖像處理、自然語言處理、自動駕駛和PaddlePaddle等深度學(xué)習平台。

百度表示與三星是首次處理器代工合作。百度將(jiāng)提供人工智能(néng)性能(néng)最大化的人工智能(néng)平台,而三星將(jiāng)把芯片制造業務拓展至專門用于雲端運算及邊緣計算的高性能(néng)計算(HPC)領域。

事(shì)實上,除了百度本身積極自行發(fā)展專用處理器,競争對(duì)手Google也已投入該項領域多年。包括企業與雲端服務器使用的處理器,Google也都(dōu)做了相當大量的投資,這(zhè)些處理器大多爲張量處理單元(Tensor Processing Units,TPU)。而透過(guò)這(zhè)些處理器的運算效能(néng),Google能(néng)提供業界優異的運算能(néng)力,以促進(jìn)機器學(xué)習和人工智能(néng)訓練的發(fā)展。

亞馬遜入局,AI芯片熱潮再起(qǐ)

亞馬遜入局,AI芯片熱潮再起(qǐ)

人工智能(néng)芯片熱潮再起(qǐ)。近日,全球最大的雲服務提供商亞馬遜AWS發(fā)布消息:Invent上發(fā)布了首款高性能(néng)機器學(xué)習加速芯片Inferentia。由騰訊領投的AI芯片企業燧原科技也于近日發(fā)布了首款雲端AI訓練芯片邃思DTU及加速卡雲燧T10。2019年人工智能(néng)技術加快滲透進(jìn)入實際應用當中,成(chéng)爲業内公認的AI落地之年。而其中關鍵在于AI芯片,算力的支撐成(chéng)爲人工智能(néng)發(fā)展的“發(fā)動機”。這(zhè)也使得人工智能(néng)芯片市場有望快速成(chéng)長(cháng)。

AI芯片開(kāi)發(fā)踴躍

全球最大的雲服務提供商亞馬遜AWS發(fā)布了首款高性能(néng)機器學(xué)習加速芯片Inferentia。作爲全球最大的雲服務提供商,亞馬遜AWS此舉頗爲引人關注。根據亞馬遜公布的指标,Inferentia芯片能(néng)夠提供128TOPS的算力,并支持INT-8和FP-16/bfloat-16計算類型。亞馬遜同時公布了幾種(zhǒng)搭載了Inferentia芯片的服務器配置,最高性能(néng)的版本可以搭載16顆Inferentia芯片,從而能(néng)提供高達2000TOPS的峰值算力。

實際上,關于亞馬遜自研AI芯片的情況早有消息傳出。2018年美國(guó)科技媒體The Information報道(dào)稱,亞馬遜已經(jīng)開(kāi)始設計定制人工智能(néng)芯片,未來將(jiāng)用在其開(kāi)發(fā)的智能(néng)語音設備Echo之上,以幫助Alexa語音助手獲得更快的響應速度,從而提升整體的使用體驗。2015年,亞馬遜斥資3.5億美元收購以色列芯片制造商Annapurna Labs。Annapurna Labs設計開(kāi)發(fā)的芯片用于數據存儲設備、WiFi路由器、智能(néng)家居設備和流媒體設備之上。

燧原科技的産品同樣引人關注。燧原科技是騰訊投資的第一家國(guó)内AI芯片企業,成(chéng)立不足一年半,就完成(chéng)超過(guò)6.6億元的累計融資。目前燧原已同騰訊一起(qǐ)針對(duì)通用AI應用場景項目展開(kāi)密切合作,未來也將(jiāng)會擴展到更多AI應用場景。燧原科技CEO趙立東介紹,此次發(fā)布的邃思DTU采用格羅方德12nm FinFET工藝,480平方毫米主芯片上承載141億個晶體管,實現2.5D高級立體封裝,算力可達20TFLOPS,最大功耗225W。産品將(jiāng)于2020年第一季度上市。同時,燧原科技發(fā)布首款計算及編程平台“馭算”,可支持開(kāi)源學(xué)習平台TensorFlow進(jìn)行開(kāi)發(fā)。

新應用驅動AI芯片增長(cháng)

一家大型一家初創,一家國(guó)際一家國(guó)内,亞馬遜AWS與燧原科技先後(hòu)發(fā)布AI芯片,顯示了AI芯片當前的火熱。實際上,近年來各類勢力均在發(fā)力AI芯片,參與者包括傳統芯片設計、IT廠商、技術公司、互聯網以及初創企業等,産品覆蓋了CPU、GPU、FPGA、ASIC等。

安富利亞洲供應商及産品管理高級總監鍾僑海指出,當前人工智能(néng)技術正在快速落地,正在滲透進(jìn)入實際應用。這(zhè)是AI芯片快速發(fā)展的原因之一。根據Fortunebusinessinsights的預測,2018年全球人工智能(néng)市場規模爲206.7億美元,至2026年有望增長(cháng)到2025.7億美元。而Gartner則預測,2018年AI芯片市場約爲42.7億美元規模,有望在2022年增長(cháng)至343億美元。

人工智能(néng)的應用首先是在雲端服務器市場展開(kāi),這(zhè)也是當前AI芯片開(kāi)發(fā)的重點。不過(guò)随着市場的不斷拓展,人工智能(néng)將(jiāng)向(xiàng)邊緣以及終端領域擴展。未來一段時間,邊緣計算將(jiāng)成(chéng)爲AI芯片發(fā)展最快的新領域。對(duì)此,清華大學(xué)電子工程系教授汪玉表示:“在發(fā)展過(guò)程中, AI芯片首先是受到了雲端服務器市場的關注和應用,國(guó)際公司如Google的TPU、亞馬遜的Inferentia、英特爾的SpringCrest,國(guó)内公司如寒武紀的MLU100、百度的昆侖、華爲的升騰、比特大陸的算豐,都(dōu)是面(miàn)向(xiàng)雲計算所開(kāi)發(fā)”不過(guò),随着邊緣計算的發(fā)展,面(miàn)向(xiàng)邊緣計算的AI芯片也開(kāi)始受到越來越多的重視。“新的邊緣啓用,數據密集型應用和工作負載將(jiāng)由AI提供支持。AI將(jiāng)用于分析和解釋來自這(zhè)些應用程序的數據,以幫助人們(在某些情況下,其他機器)實時做出關鍵決策。”汪玉表示。

鍾僑海也表示,人工智能(néng)在物聯網領域正在迅速展開(kāi)。在人工智能(néng)以及物聯網上,安富利已經(jīng)開(kāi)發(fā)出許多相關的成(chéng)功案例,如智能(néng)制造系統、智能(néng)農業系統、智慧城市系統等。“目前區分人工智能(néng)在雲服務和邊緣側的市場份額還(hái)比較難。但是,很多用戶都(dōu)希望在他們原有的物聯網系統當中能(néng)夠加上人工智能(néng)的功能(néng)。此外,越來越多的企業希望有他們自己的雲,他們自己的雲可以做訓練,他們自己的雲可以做數據的分析,這(zhè)些事(shì)情他們可能(néng)不希望通過(guò)公有雲來做。因此,可以預計未來人工智能(néng)在邊緣側的市場將(jiāng)會越來越大。”

架構彈性成(chéng)爲關注焦點

雖然前景看好(hǎo),但是AI芯片在應用落地同樣存在挑戰。鍾僑海認爲,人工智能(néng)落地還(hái)將(jiāng)面(miàn)臨三個挑戰:第一,人工智能(néng)需要繁多的訓練、數據分析、識别、大量計算。所以,AI解決方案應針對(duì)不同的應用對(duì)網絡和性能(néng)參數,要求不同速度、延遲、能(néng)耗、準确性。第二,神經(jīng)網絡技術需要大量的數據以訓練模型,在大量的運算中有數十億次乘積累加運算以及幾十兆字節參數,故需要大量運算符、自定義數學(xué)及存儲器層次結構。第三,人工智能(néng)算法的更新換代較爲迅速,在固定架構中會存在很多風險,一旦舊人工智能(néng)架構失靈,在新架構出現時,原本的固化架構很大程度上即刻失效。所以,架構的彈性成(chéng)爲業界需要聚焦關注的問題。

汪玉提出建議,目前AI芯片設計面(miàn)臨着太多種(zhǒng)的樞架,如TF 、Pytorch、Caffe、Mxnet等。同時現存的芯片平台也有很多,如CPU、GPU、FPGA、ASIC等。這(zhè)就給AI芯片的設計開(kāi)發(fā)帶來了極大的挑戰。如果能(néng)有公司設計開(kāi)發(fā)出一款中間層性質的平台産品,由它來向(xiàng)上支持不同類型的設計框架,向(xiàng)下支持各種(zhǒng)芯片平台,并最終服務于各個人工智能(néng)公司,將(jiāng)大大降低AI芯片設計中的複雜度,提高工作效率。這(zhè)其中蘊含着巨大的商機。汪玉也呼籲應當加強産學(xué)研的結合,以技術爲基本出發(fā)點,營造出有利于創新發(fā)展的環境。通過(guò)這(zhè)一系列的努力,中國(guó)完全可以抓住新一輪由5G商用所趨動的邊緣計算市場商機。

魏少軍:目前的AI芯片并不是真正的AI,要從架構上突破

魏少軍:目前的AI芯片并不是真正的AI,要從架構上突破

12月3日,一年一度的Imagination Inspire在上海拉開(kāi)序幕,同期第十代PowerVR圖形處理器架構IMG A系列新品推出。會議邀請了業内人士探讨AI芯片發(fā)展趨勢和方向(xiàng)。清華大學(xué)、北京大學(xué)雙聘教授魏少軍出席會議并發(fā)表題爲“深度學(xué)習與智慧芯片-路徑與架構”的演講。

架構創新推動智能(néng)化

“將(jiāng)AI芯片的計算能(néng)力與人類的計算能(néng)力比較,是走了一條錯誤的路線。與AI芯片相比,人腦的計算能(néng)力着實有限。”魏少軍表示,在計算能(néng)力方面(miàn),機器的計算能(néng)力遠超人類,可比性很小,多樣性的适應能(néng)力才是最大的差距。人類大腦具備适應多種(zhǒng)不同神經(jīng)網絡的功能(néng),這(zhè)是AI芯片最難完成(chéng)的功能(néng)之一。此外,功耗也讓兩(liǎng)者産生巨大差距。“人食三餐,就可以适應多樣化的神經(jīng)網絡。但是一台裝上AI芯片的設備,很可能(néng)需要一台發(fā)電機爲其專有供電,功耗可達2400W。”魏少軍說。

“所以,目前的AI芯片并不是真正的AI。”他認爲,真正的AI芯片要從架構方面(miàn)進(jìn)行突破。目前市場廠商流行的架構包括CPU+SW、CPU+GPU、CPU+FPGA等方式,“但這(zhè)些都(dōu)不是AI的理想架構。”魏少軍表示,宏觀上看,計算、軟件、優化、演進(jìn)、訓練是AI芯片的幾個重要的架構模塊,而在完成(chéng)這(zhè)些重要模塊的同時,是否可以設計出類似通用CPU獨立存在的“通用AI處理器”?如果存在的話,他的架構應該是怎樣的?

可重構的神經(jīng)網絡計算架構或許可以給出答案,這(zhè)是魏少軍認爲最有可能(néng)迎接未來複雜人工智能(néng)市場的AI架構。該架構的可重構性和可配置性爲AI芯片适應多重神經(jīng)網絡架構提供可能(néng),實現最佳能(néng)源效應。通過(guò)應用來決定神經(jīng)網絡的選擇,實現“定制化AI芯片”,打造可重構的神經(jīng)網絡計算架構“高效能(néng)、低功耗”的訓練引擎。

“架構創新讓AI芯片變得更智慧,讓機器模仿人的行爲,教機器學(xué)會人能(néng)做的事(shì)情。”魏少軍說。

AI芯片發(fā)展新增三要素

架構創新帶來了AI芯片基本要素發(fā)生微妙的變化。

傳統上,爲了更好(hǎo)的适應算法的演進(jìn)和應用的多樣性,AI芯片首先應該具備一定的可編程性。其次,AI芯片需要适應不同的算法,實現高效計算。因此,架構需要具備一定的動态可變性。“低開(kāi)銷、低延遲”屬性也需要AI芯片具備高效的架構變換能(néng)力。高計算效率也是AI芯片避免使用指令類低效率的架構的方法之一。“這(zhè)些是AI芯片應該具備的基本要素。”魏少軍說。

但即使具備這(zhè)些要素,AI芯片依舊“還(hái)不夠智慧”。“更加智能(néng)”的需求帶來了架構的創新,由此,類似于“軟件定義芯片”可重構的神經(jīng)網絡計算架構等創新帶來了AI芯片基本要素的變化。

魏少軍表示,架構創新後(hòu),AI芯片需要增加學(xué)習能(néng)力、接受教育并成(chéng)長(cháng)的能(néng)力。人類差異性的來源是教育和學(xué)習,芯片也如此。如果AI芯片可以接受教育并成(chéng)長(cháng),其不可替代性將(jiāng)會逐漸加強。因此,算法和軟件的自主演進(jìn)能(néng)力也成(chéng)爲了“智慧AI芯片”新增的基本要素之一。“更加智慧的AI芯片,還(hái)需要具備自主認知、自主判斷、自主選擇和自主決策等基本要素。”魏少軍說。

比特大陸發(fā)布全新智能(néng)服務器SA5 超強算力賦能(néng)AI

比特大陸發(fā)布全新智能(néng)服務器SA5 超強算力賦能(néng)AI

2019年10月27日,全球領先的算力芯片公司比特大陸在深圳召開(kāi)AI新品發(fā)布會,重磅推出了算豐第三代智能(néng)服務器SA5。該産品是基于比特大陸9月在福州城市大腦發(fā)布會上推出的最新AI芯片BM1684開(kāi)發(fā)而成(chéng),具備低功耗、高算力、高密度的特點,擁有強大的深度學(xué)習加速能(néng)力,可以爲視頻/圖像智能(néng)分析提供巨大算力。

值得一提的是,比特大陸也將(jiāng)攜新産品亮相10月28日-10月30日的深圳安博會現場,屆時也將(jiāng)看到比特大陸在城市大腦、智慧安防、智慧社區等領域的最新進(jìn)展。

比特大陸AI業務線總裁王晨光在發(fā)布會現場表示,“比特大陸算豐智能(néng)服務器SA5主要面(miàn)向(xiàng)視頻及圖像智能(néng)分析領域,可搭載第三方算法,運行視頻結構化、人臉檢測識别、車輛檢測識别、物品檢測識别、視頻檢測等多類安防和互聯網視頻智能(néng)分析應用,是目前人工智能(néng)領域最爲成(chéng)熟、穩定的智能(néng)服務器”。

性能(néng)8倍提升 可提供422T算力

算豐智能(néng)服務器SA5的核心是比特大陸最新研發(fā)的AI芯片BM1684。BM1684聚焦于雲端及邊緣應用的人工智能(néng)推理,采用台積電12nm工藝,在典型功耗僅16瓦的前提下,FP32精度算力達到2.2TFlops,INT8算力可高達17.6Tops,在Winograd卷積加速下,INT8算力更提升至35.2Tops,是一顆低功耗、高性能(néng)的SoC芯片。

基于BM1684的SA5是 19 英寸的标準 2U 服務器,内置 3 個智能(néng)分析單元,包含24顆BM1684 芯片,可以提供2.2*24TFlops@FP32 ,17.6*24Tops@INT8的峰值計算力。SA5整體功耗小于700w,INT8模式下可提供高達422T的算力,性能(néng)較上一代産品提升約8倍。

值得一提的是,單台SA5 具備768路 30幀每秒的1080P視頻的處理能(néng)力或每秒12000張人臉圖片的檢測分析,大大提升了智慧城市、智慧安防、互聯網等行業視頻/圖像智能(néng)分析的效率。

SA5采用可插拔模塊化設計,極大便利于後(hòu)期運維,内置主控單元、算力單元、存儲單元等核心模塊。

主控單元(MPU)是SA5的大腦,基于X86架構的智能(néng)管理調度系統,實現算法部署、系統升級、算力性能(néng)監控、能(néng)耗管理、算力動态負載均衡。爲AIU單元提供管理以及數據交換,高達10G的網絡接口以滿足算力數據的輸入輸出。

其中作爲整機靈魂的算力單元(AIU),集成(chéng)了比特大陸第三代算力芯片BM1684,單個單元最多集成(chéng)8塊BM1684芯片,整機可以按需配置多個單元,爲具體應用場景下的需求提供澎湃算力。

一站式工具鏈 便捷實現AI賦能(néng)

爲了提升産品的易用性,比特大陸還(hái)爲客戶提供了包括底層驅動環境、編譯器、推理部署工具等一站式的工具包,名爲BMNNSDK(BITMAIN Neural Network SDK)。

BMNNSDK易用便捷,最大程度降低算法和軟件的開(kāi)發(fā)周期和成(chéng)本,使開(kāi)發(fā)者和使用者能(néng)快速在智能(néng)服務器SA5上部署深度學(xué)習算法,便捷地實現視頻結構化分析、人臉識别等智能(néng)應用。

通過(guò)BMNNSDK,可以將(jiāng)開(kāi)發(fā)者基于深度學(xué)習框架開(kāi)發(fā)訓練的模型,自動編譯轉化成(chéng)在SA5高性能(néng)計算平台效運行的應用,當前支持的深度學(xué)習框架包括TensorFlow、Caffe、mxnet、ONNX、Caffe2等,支持CNN/RNN/DNN等神經(jīng)網絡模型,具有極佳的編程靈活性。

與衆不同的是,比特大陸還(hái)在BM1684芯片内置多種(zhǒng)加解密算法,可保護客戶的算法安全、模型安全可靠,創建安全可信的計算環境。

比特大陸作爲領先的算力芯片公司,始終將(jiāng)客戶利益放在首位,始終以創新爲本,以爲客戶創造價值爲根本出發(fā)點,不斷引領着科技的發(fā)展方向(xiàng)和新的行業潮流。在本次發(fā)布會上,比特大陸與中科雲從、以薩、深瞐、千視通、英飛拓、智慧眼科技、華付、南澤智能(néng)、華尊科技、藍典科技、靈想科技、航康信息、偉視清、叁拾柒号倉、考斯、鑫和彙通、小牛智能(néng)等17家生态合作夥伴同時簽約,共同搭建友好(hǎo)開(kāi)放的生态系統,使客戶輕松享受新技術帶來的優質用戶體驗。其中,來自中科雲從、以薩、深瞐、千視通的嘉賓,還(hái)爲現場觀衆奉獻了精彩的主題演講。

比特大陸未來將(jiāng)持續快速響應客戶需求,以先進(jìn)技術、精密制造和卓越的資源整合能(néng)力爲客戶提供最具競争力的智能(néng)設備技術解決方案,精誠合作引領科技前沿,共赢全球市場。

阿裡(lǐ)和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關系生變

阿裡(lǐ)和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關系生變

2019年杭州雲栖大會上,阿裡(lǐ)首款AI芯片含光800雖然隻有短短幾分鍾的介紹,卻成(chéng)了外界最爲關注的消息。互聯網巨頭進(jìn)入自研芯片領域早已不是新聞,但每次他們自研芯片的正式推出和商用的宣布,依舊會吸引了無數的關注。

不少人應該也會疑問,這(zhè)是不是芯片巨頭們要被替代的開(kāi)始?

互聯網巨頭造芯的初衷

在互聯網企業造芯的路上,谷歌跑在了最前面(miàn)。早在2006年,谷歌就開(kāi)始考慮在其數據中心部署 GPU或者 FPGA,或專用集成(chéng)電路(ASIC),當時的結論是,能(néng)在專門的硬件上運行的應用并不多,使用谷歌大型數據中心的富餘計算能(néng)力即可。

情況在2013年發(fā)生了轉變,當時谷歌用戶每天使用語音識别 DNN 語音搜索三分鍾,使得谷歌數據中心的計算需求增加了一倍,而如果使用傳統的 CPU 將(jiāng)非常昂貴。因此,谷歌啓動了一項優先級别非常高的項目,快速生産一款定制芯片(ASIC)用于推理,并購買現成(chéng)的 GPU用于訓練。

谷歌的目标是將(jiāng)性價比提高 10 倍,爲了完成(chéng)這(zhè)項任務,谷歌在其數據中心設計、驗證、構建并部署了 TPU(張量處理器,Tensor Processing Unit),這(zhè)一過(guò)程用了15個月。

2016年,谷歌I/O開(kāi)發(fā)者大會上,谷歌正式發(fā)布了首代TPU。不過(guò),TPU剛開(kāi)始隻僅限谷歌内部使用,直到2018年2月,谷歌才在其雲平台博客上宣布TPU服務開(kāi)放的消息,價格大約爲每雲 TPU 每小時 6.50 美元,而且數量有限。

阿裡(lǐ)和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關系生變

也就是說,2018年,谷歌才開(kāi)啓了TPU的商業化。同年的I/O大會上,TPU 3.0宣布推出,計算性能(néng)相比TPU 2.0提升八倍,可達 100PFlops(每秒 1000 萬億次浮點計算)。

可以明确,谷歌TPU的推出,主要還(hái)是因爲市場上沒(méi)有滿足其需求的芯片,使得他們進(jìn)入了自研芯片領域,并且,TPU作爲雲端推理芯片并不對(duì)外出售,而是通過(guò)谷歌雲對(duì)外提供算力。

阿裡(lǐ)的自研芯片之路與谷歌類似。1999年以淘寶起(qǐ)家的阿裡(lǐ),如今的業務早已橫跨電商、金融、物流、雲計算、大數據、全球化等場景。不同的場景就有不同的計算需求,比如淘寶裡(lǐ)的拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識别需要1小時。除了需要花費1小時的時間,這(zhè)個時間裡(lǐ)GPU的耗電量也非常巨大。

根據數據統計顯示,2017年中國(guó)有40個中小型數據中心,這(zhè)些中小數據中心2017年消耗電量比三峽大壩的發(fā)電量還(hái)多,等量的碳排放量兩(liǎng)倍于民航的碳排放量。對(duì)于阿裡(lǐ)和谷歌這(zhè)樣擁有大型數據中心的科技公司,電量消耗也帶來了巨大的成(chéng)本。

如果谷歌和阿裡(lǐ)想要通過(guò)購買算力更強的最新款英偉達GPU來提升效率,GPU高昂的售價也是科技巨頭們無法忽視的問題。

因此阿裡(lǐ)也開(kāi)啓了自研芯片之路。2017年的雲栖大會上,阿裡(lǐ)宣布成(chéng)立達摩院,由全球建設的自主研究中心、高校聯合實驗室,全球開(kāi)放研究計劃三大部分組成(chéng),涵蓋量子計算、機器學(xué)習、基礎算法、網絡安全、視覺計算、自然語言處理、下一代人機交互、芯片技術、傳感器技術、嵌入式系統等,涵蓋機器智能(néng)、智聯網、金融科技等多個産業領域。

2018年雲栖大會,阿裡(lǐ)又宣布成(chéng)立獨立芯片企業“平頭哥半導體有限公司”,由中天微與達摩院芯片團隊整合而成(chéng)。

還(hái)是雲栖大會宣布者還(hái)是張建鋒,2019年阿裡(lǐ)首款AI雲端推理芯片含光800正式推出。在業界标準的ResNet-50測試中,含光800推理性能(néng)達到78563 IPS,比目前業界最好(hǎo)的AI芯片性能(néng)高4倍;能(néng)效比500 IPS/W,是第二名的3.3倍。

性能(néng)提升帶來的效果顯而易見,繼續用上面(miàn)的拍立淘舉例,阿裡(lǐ)表示,采用含光800後(hòu),每天新增10億商品圖片的識别時間可以從GPU識别的1小時,可縮減至5分鍾。另外,根據雲栖大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時爲300ms,使用含光800僅需4顆,延時降至150ms。

由此做一個簡單的換算,那就是1個含光800的算力等于10個GPU。

相比谷歌遲遲沒(méi)有商用TPU,阿裡(lǐ)在發(fā)布含光800之時表示這(zhè)款産品已經(jīng)已經(jīng)實現了大規模應用,應用于阿裡(lǐ)巴巴集團内多個場景,例如視頻圖像識别/分類/搜索、城市大腦等,并且宣布基于含光800的AI雲服務也正式上線。

顯然,阿裡(lǐ)自研AI芯片最核心的目标同樣是爲了獲得更低的經(jīng)濟成(chéng)本。

科技巨頭與芯片巨頭不再隻是合作

由此看來,目前阿裡(lǐ)和谷歌商用的自研AI芯片都(dōu)是雲端推理芯片,對(duì)于傳統芯片巨頭英特爾和英偉達而言,這(zhè)并不會帶來巨大的改變,但雙方的關系會從此前緊密合作變爲競合關系。

如何理解?雖然有了面(miàn)向(xiàng)視覺場景的含光800推理芯片,但是這(zhè)是一款ASIC芯片,其定位也是CNN類模型推理加速爲主,通用可擴展到其它DNN模型。但對(duì)于更多的深度學(xué)習算法,含光800這(zhè)款ASIC可以在一定支持,但無法體現出性能(néng)和能(néng)效最優化。

所以,無論是阿裡(lǐ)還(hái)是谷歌,他們依舊需要英特爾的CPU提供通用的計算能(néng)力,也需要FPGA進(jìn)行AI的加速。另外,阿裡(lǐ)性能(néng)強大的神龍架構服務器,也需要英偉達GPU提供算力。

這(zhè)種(zhǒng)競合關系不僅會局限在雲端。2018年7月,谷歌推出Edge TPU芯片,從命名上就可以看出這(zhè)是此前推出的雲TPU的簡化版本,是專門設計的加速器芯片,用于在邊緣運行TensorFlow Lite機器學(xué)習模型。

英雄所見略同,阿裡(lǐ)也有端雲一體的戰略。在含光800雲端AI芯片發(fā)布之前的7月和8月,阿裡(lǐ)接連發(fā)布了高性能(néng)RISC-V架構處理器玄鐵910以及SoC芯片平台“無劍”。也就是說,阿裡(lǐ)的C-Sky系列、玄鐵系列AIoT終端芯片IP,一站式芯片設計平台無劍,以及最新發(fā)布的雲端AI芯片構建了阿裡(lǐ)端雲一體的芯片生态,平頭哥端雲一體全棧芯片産品家族雛形已現。

另外,2019雲栖大會期間還(hái)有一個芯片的重磅宣布,阿裡(lǐ)人工智能(néng)實驗室和平頭哥共同定制開(kāi)發(fā)的智能(néng)語音芯片TG6100N,會在即將(jiāng)推出的音箱産品中使用。

科技巨頭們的自研AI芯片要涵蓋雲端和終端其實也很容易理解,無論是芯片巨頭還(hái)是科技巨頭,他們都(dōu)認爲未來數據將(jiāng)像石油一樣具有價值。因此,巨頭們需要端雲一體的戰略挖掘數據的價值,在數據的時代保持領先,而這(zhè)個戰略非常重要的支撐就是雲端和終端的AI芯片。

此時科技巨頭和芯片巨頭都(dōu)會有雲端和終端的AI芯片,競争就難以避免。雷鋒網認爲,競争激烈的程度更多會取決于科技巨頭,由于他們對(duì)自己的業務和數據有更深的理解,他們定制化的ASIC芯片更容易達到性能(néng)和能(néng)效的最優。即便自研的AI處理器性能(néng)弱于芯片巨頭的産品,如果科技巨頭出于自主可控的考慮,用自身的業務和場景去支撐自研芯片的叠代和優化,爲此付出一些代價,最終也能(néng)研發(fā)出在特定領域非常具有競争優勢的芯片。

注意,科技巨頭們會在與自己業務和生态相關的領域自主研發(fā)AI芯片。但如果想要替代現有的成(chéng)熟芯片,比如英特爾的至強CPU和英偉達GPU,既沒(méi)有價值也面(miàn)臨巨大的風險。歸根結底,科技巨頭們自研AI芯片的初衷是爲了獲得更大的經(jīng)濟效益,通過(guò)自主研發(fā)的芯片保持其技術和生态的領先性。同樣,他們的自研芯片也更多的會服務于自己的業務和生态,而非搶食芯片巨頭們的市場。

小結

AI時代,科技巨頭們與芯片巨頭們不再隻是緊密的合作夥伴,也會在特定領域成(chéng)爲競争對(duì)手。也就是說,對(duì)于芯片巨頭們而言,想要在科技巨頭擁有自研芯片的領域獲得訂單,需要付出更多的努力。

反過(guò)來,芯片作爲一個技術、資本、人才都(dōu)密集的行業,其長(cháng)周期的特點也與互聯網和移動互聯網快速叠代的模式不同,如何找到軟硬之間的最佳平衡點,以及如何與芯片巨頭們多年在芯片領域積累的優勢競争,也都(dōu)是科技巨頭自主研發(fā)芯片面(miàn)臨的挑戰。