2020年GPU行業發展前景：GPU是人工智能的重要組成部分，市場空間廣闊[圖]

GPU 管小紅 2020-04-01 05:46 來源：智研咨詢

一、從世界巨頭尋找發展的足跡

１、GPU的作用與分類

GPU（graphicsprocessingunit，圖形處理器）又被稱為顯示芯片，多用于個人電腦、工作站、游戲主機以及移動設備（智能手機、平板電腦、VR設備）上專門運行繪圖運算的微處理器。

結構決定GPU更適合并行計算，GPU與CPU主要區別在于片內的緩存體系和數字邏輯運算單元的結構差異：GPU核（尤其ALU運算單元）的數量遠超CPU但是結構較CPU簡單，因此被稱為眾核結構。眾核結構非常適合把同樣的指令流并行發送到眾核上，采用不同的輸入數據執行，從而完成圖形處理中的海量簡單操作，如對每一個頂點進行同樣的坐標變換，對每一個頂點按照同樣的光照模型計算顏色值。GPU利用自身處理海量數據的優勢，通過提高總的數據吞吐量（Throughput）來彌補執行時間（Latency）長的缺點。

一般而言，消費者在選購消費電子產品的時候，例如在選購移動電話或者筆記本時，會更加關注CPU（CentralProcessingUnit，中央處理器）的性能，例如CPU的品牌、系列、核心數量等等，而GPU受到的關注就相對較少。GPU（GraphicProcessingUnit），及圖形處理器,是一種專門在個人電腦、工作站、游戲機和一些移動設備（如平板電腦、智能手機等）上做圖像和圖形相關運算工作的微處理器。在PC誕生之初，并存在GPU的念，所有的圖形計算都由CPU進行計算。然而，使用CPU做圖形計算速度較慢，于是就設計了專門的圖形加速卡用以幫助處理圖形計算。再后來，NVIDIA提出了GPU的概念，將GPU提升帶了一個單獨的計算單元的地位。

CPU一般由邏輯運算單元、控制單元和存儲單元組成。CPU雖然有多核，但總數沒有超過兩位數，每個核都有足夠大的緩存;CPU有足夠多的數字和邏輯運算單元，并輔助有很多加速分支判斷甚至更復雜的邏輯判斷的硬件。因此，CPU擁有超強的邏輯能力。GPU的優勢在于多核，核數遠超CPU，可以達到數百個，每個核擁有的緩存相對較小，數字邏輯運算單元少且簡單。因此，GPU相對于CPU更適用于處理數據并行計算問題

CPU與GPU的區別

－	CPU	GPU
設計目標	側重于程序執行的效率	重在對大量趨同計算的并行處理
設計目標	運行復雜程度高，需要處理各種不同的數據行，同時邏輯判斷有需要處理大量分支跳轉和中斷	運行復雜度低，面對的是不被打斷的計算環境，處理類型統一的、無相關性的大規模數據
內部架構	大部分晶體管用于控制，緩存的等的設計，負責算數邏輯的處理單元不多	大部分的警惕管用于算數邏輯處理單元
內部架構	邏輯核心復雜	邏輯核心簡單
適用任務	適合運行具有分支密集型，不規則數據結構、邏輯更加靈活復雜等特點的串行程序。	合適處理計算密集型、數據耦合度低、高度并行化的計算任務

數據來源：公開資料整理

GPU具有兩種分類方式，一種根據與CPU的關系，另一種是根據GPU所在的應用端類別。根據與CPU的關系，GPU可以分為獨立CPU和GPU。獨立GPU一般焊接在顯卡的電路板上，位置在顯卡的風扇下面。獨立GPU使用的是專用的顯示存儲器，顯存帶寬決定了和GPU的連接速度。集成GPU一般與CPU集成在一起。集成GPU與CPU共有一個風扇和緩存。集成GPU由于設計制作、驅動程序都由CPU廠家完成，因此兼容性較好；此外,由于CPU與GPU實現了集成，因此，集成GPU的占用空間小；實現GPU與CPU的適配與兼容，集成GPU的性能相對獨立GPU較弱，因此功耗和成本相對獨立GPU較低。獨立GPU由于擁有獨立的顯存，更大的空間和更好的散熱，因此在性能上面獨立顯卡更好；但需要額外的空間，能夠滿足復雜龐大的圖形處理需求，并提供高效的視頻編碼應用。然而，強勁的性能意味著更高的耗能，獨立GPU需要額外的供電，并且成本也更高。

集成顯卡與獨立顯卡的區別

區別	集成顯卡	獨立顯卡
與CPU的關系	集成在CPU里面的圖像處理單位，構成CPU的一部分	單獨插在主板上的圖像處理單位，其接口是PCIE接口，是一個單獨的電腦組件
價格	低	高
兼容性	較好	較差
性能	較差	較好
升級成本	低	高
功耗	低	高
是否占用電腦內存	是	否
主要生產商與產品	Intel(HD系列）、AMD（APU系列）	AMD（Radeon系列），NVIDIA（GeForce系列）
主要應用領域	移動計算市場，如筆記本和智能手機	高性能游戲電腦，VR/AR，人工智能

數據來源：公開資料整理

根據應用終端類別，可以分為PCGPU,服務器GPU，移動GPU。PCGPU應用于PC端。根據其所在產品定位既可以使用集成GPU，也可以使用獨立GPU。例如，若PC以輕辦公，文字編纂為主，一般產品會選擇搭載集成GPU;若PC需要制作高清圖片，編輯視頻，渲染游戲等，則選擇的產品搭載獨立GPU。服務器GPU應用于服務器，可做專業可視化、計算加速、深度學習等應用，根據云計算、人工智能等一系列技術的發展，服務器GPU將會以獨立GPU為主。移動端輕薄化已經成為趨勢，終端內部凈空間由于多種功能模組的增加已經快速下降；同時就目前移動端需要處理的視頻和圖像而言，集成GPU已經能夠滿足。所以移動GPU一般采用集成GPU。

GPU按終端類別分類

數據來源：公開資料整理

２、GPU市場：寡頭競爭時代已經來臨

PCGPU市場，Intel優勢明顯。智研咨詢發布的《2020-2026年中國GPU行業市場競爭格局及行業發展前景預測報告》顯示：全球2019年第四季度PC領域GPU出貨量，Intel是全球最大的處理器供應商。目前主流的處理器架構是X86，主要的供應商是Intel，AMD，VIA。截至2019年第四季度，消費級x86CPU市場中，包括桌面品臺，移動端平臺（筆記本和平臺LOT物聯網）中，Intel占據了84.4%的市場份額，AMD占據了15.5%的市場份額。Intel憑借在CPU出貨量上的優勢，通過銷售集成GPU，實現了在GPU市場的霸主地位。Intel以63%的市場份額排名第一，對比2019年第三季度環比下滑了2個百分點；AMD作為全球第二大的X86架構處理器供應商，既受益于CPU出貨帶動的集成GPU出貨量，也受益于自身優秀的獨立GPU的出貨。

AMD以19%的市場份額排名二，環比上升3個百分點；NVIDIA是全球領先的獨立GPU供應商，同時結合ARM架構處理器，出貨集成GPU，市場份額為18%，環比下降了1個百分點。

全球PCGPU市場份額

數據來源：公開資料整理

Intel與AMD處理器出貨量之間的對比

數據來源：公開資料整理

獨立GPU領域，AMD奮起直追。截至2019年第四季度，在獨立GPU域中，NVIDIA以68.92%的市場份額占據較大的優勢。AMD方面，AMD得益于在2018Q4所推出RX5500及RX5600系列，以及RX5700系列的放量，多方因素共同促使AMD顯卡份額大漲，從2018年18.77%上升至31.08%。AMD推出的Radeon系列部分型號采用7nm工藝，并且在與NVIDIA的產品對比中（RTX2070對標RX5700，RTX2070S對標5700XT），同系列AMD性能略強，價格更低，重點是功耗一樣。更強的性能，更低的功耗，AMD的產品無疑對NVIDIA的市場份額造成了挑戰。

全球獨顯的市場份額

數據來源：公開資料整理

NVIDIA與AMD產品性能對比

數據來源：公開資料整理

整機功耗測試（單位：瓦）

數據來源：公開資料整理

五雄爭霸，手機廠商不甘寂寞。在移動GPU領域，主要以Imagination、ARM、Qualcomm、Vivante、NVIDIA為主。高通目前是Android陣營最大的處理器供應商。移動端主要使用集成GPU，因此，高通GPU因其處理器的市場優勢也有所受益。ARMMailGPU的主要使用者是華為和三星。ARMMail的GPU性能相對較弱，因此華為在2018年通過推出GPUTurbo軟硬件優化彌補短板。三星方面已經與AMD前敵多年的IP授權，AMD將向三星授權最新的7nmRDNA架構Radeon顯卡IP,并且嘗試自研GPU。蘋果在與Imagination取消合作兩年后，再次選擇與Imagination合作，并給予支付授權費。雖然目前手機巨頭都是采取購買GPU廠商IP的方式，但是目前三星、蘋果、華為等有相關計劃進行GPU自研項目。手機已經進入同質化時代，手機之間的差異性已經成為手機廠商競爭優勢的關鍵。公版GPU難以使手機廠商產生本質的差異性。因此，手機需要通過自研GPU以及CPU實現手機性能的差異化，從而獲得市場的競爭優勢。

全球移動GPU主要供應商

廠商	GPU核心	授權商
Imagination	PowerVR系系列列，SGX	Intel、聯發科、LG、高通、瑞薩、三星、海思
ARM	Mail系列	三星、海思、瑞芯微、展訊、意法半導體、全志
Qualcomm	Adreno系列	自用、不對外授權
Vivante	GC系列	飛思卡爾、軍政、Marvell
NVIDIA	Geforce系列、Tegra	開普勒架構已對外授權

數據來源：公開資料整理

二、中國GPU服務器

１、中國GPU服務器市場發展規模

２018年下半年中國GPU服務器市場規模為7.8億美金（約合人民幣53.8億元），同比增長107.3%。 2018年全年中國GPU服務器市場規模為13.05億美金（約合人民幣90.05億元），同比增長131.2%。IDC預測，到2023年中國GPU服務器市場規模將達到43.2億美金（約合人民幣298億元），未來5年整體市場年復合增長率（CAGR）為27.1%。

2018-2023年中四ＧＰＵ服務器市場規模同比增長走勢預測

數據來源：公開資料整理

2018年中國GPU服務器市場量價齊升，出貨量和銷售額均實現快速增長。

從行業來看，互聯網為主要采購行業，占據60%以上的市場份額，是拉動市場增長的主要行業；政府的采購量也有所上升，超過了10%的市場份額；

從產品來看，4卡及以上GPU服務器占據了8成以上的市場份額，其中4卡、8卡、16卡均占有20%以上的市場份額；

從廠商來看，浪潮、華為和曙光在出貨量和銷售額方面均位列市場前三；

從市場趨勢來看，AI服務器和邊緣計算服務器等面向特定工作負載的細分服務器市場迎來爆發，各大廠商加速布局該領域并推出新產品，2019年這些細分市場仍將是市場的熱點。

2018年中國ＧＰＵ服務器廠商市場份額情況

數據來源：公開資料整理

“計算和數據是人工智能不可缺少的組成部分。2018年，人工智能的發展引領中國GPU服務器市場的高速增長；訓練依然是GPU服務器的主要工作負載，未來幾年推理工作負載的服務器也會逐漸上升；在深度學習的不斷推動下人工智能取得重要突破；到目前為止，除了專業人工智能公司以外，許多大型公司也同時開始涉足深度學習，并應用在廣泛的商業實踐中。2018年以前，互聯網是GPU服務器的主要采購行業，如今，許多傳統行業對GPU服務器也慢慢有所需求，嘗試將人工智能技術與自己的行業相結合。由此看來，GPU服務器市場規模還有很大上升空間。

２、GPU將在數據中心長足發展

GPU在A.I數據中心領域對A.I專用芯片的技術突襲防御性較強。相比于由圖形處理器演進而來的GPU，當前許多公司基于FPGA、ASIC從事A.I專用芯片研發，以挑戰GPU在A.I領域的霸主地位， GPU在A.I數據中心領域對A.I專用芯片的防御性較強。GPU的性能特點與A.I數據中心對處理器的需求非常契合，并且在長時間的發展中已經形成了完整的生態，相比較而言，無論是FPGA、還是ASIC路線A.I專用芯片，都尚處于發展階段，而要成功打造一款通用芯片，時間的積淀非常重要。

GPU具有較為完整的技術生態。高運算性能硬件、驅動支撐、API接口、通用計算引擎/算法庫、較為成熟的開發環境都為應用GPU的深度學習開發者提供了足夠友好、易用的工具環境。開發者可以迅速獲取到深度學習加速算力，降低了深度學習模型從研發到訓練加速的整體開發周期。

驅動程序，獨立顯卡廠商不僅提供高性能硬件，也一直提供配套驅動來支持其GPU調用計算資源。早期圖形處理、游戲業務的優勢地位使得英偉達一直在GPU驅動下了不少功夫，公司總部大多數員工都是從事驅動程序的研發工作。從圖形接口API來看，不同的獨立顯卡廠商提供不同的圖形標準API，而不同的API接口適應于不同的計算系統，如OpenGL標準支持Unix系統的服務器計算平臺，Direct3D支持windows系統的PC。英偉達推出的CUDA(ComputeUnifiedDeviceArchitecture)通用并行計算平臺，是為利用GPU并行運算能力開發的計算平臺。可以讓開發人員用C語言編寫的程序在其處理器上高速運行，大大提升了通用GPU的易用性。

算法庫，CUDA包括了大量的GPU加速庫和基于C語言的編程工具，開發者可以在熟悉的編程環境下便捷地調用加速庫。CUDA提供的算法庫可以讓應用程序像調用庫函數一樣簡單實現一些深度學習算法。CUDA開發人員的數量在5年里增長了14倍，超過60萬人，CUDASDK的下載量達到180萬。眾多CUDA開發人員對于維持英偉達GPU客戶黏性非常重要。

GPU完整的技術生態，吸引了大量A.I企業采用GPU進行人工智能加速，建立了良好的行業生態。英偉達與科研機構開展合作項目，深入了解科研領域需要的運算問題，為其提供專業的超級計算加速解決方案。英偉達與不同應用領域的企業合作，如醫療、金融、天氣等，開發面向不同領域的加速產品。截止2016年底，與英偉達合作開發深度學習項目的公司已經達到了19,439家。除了傳統的互聯網巨頭公司以外，還有很多創業公司，用于圖像識別、語音識別、自然語言處理、計算機視覺、搜索引擎、醫學成像、機器人、數據挖掘等應用加速。

ＧＰＵ浮點運算能力

數據來源：公開資料整理

GPU的高運算性能使其迅速占領A.I數據中心市場，完備的生態環境可幫助其維持霸主地位。從上圖可以看出，GPU的浮點運算能力一直保持著直線上升。英偉達在2017年GPU技術大會上發布的全新一代人工智能GPU芯片—TeslaV100能夠達到15Tflops的單精度浮點性能，7.5Tflops的雙精度浮點性能，可以滿足當前A.I深度學習的運算能力。GPU持續提升的運算能力是其維持在A.I數據中心這一運算密集型應用場景中霸主地位的根本，而面對眾多新興A.I芯片的挑戰，GPU已經建立起的完備的生態環境可幫助其提高防御能力。

GPU的生態環境有利于其將在訓練學習領域（A.I數據中心）建立的優勢延續至推理應用領域（前端電子產品）。當前GPU已經占據了A.I數據中心市場，學習階段處理器需求已經被GPU占領。未來隨著A.I行業應用的逐漸落地，推理階段處理器需求將持續放量。從學習到推理階段，算法部署的平滑、便捷性是需要考慮的重要問題。如果從數據中心、云端到前端應用，整個產品線都采用英偉達的CUDA計算平臺，可以極大地減少算法跨平臺的難度，實現平滑過渡，省去了變更運行環境所需的協同工作。

相比較而言，無論是FPGA、還是ASIC，都尚處于發展階段。目前有一些公司基于FPGA技術路線或ASIC技術路線開發的A.I專用芯片，是為滿足自身的需求而進行的個性化開發。典型的就是谷歌的TPU，公司并沒有計劃將其做成一款通用芯片推向市場。有些公司也在基于FPGA或ASIC開發通用的A.I專用芯片，但是都未達到GPU的成熟程度。一款芯片要做的具有通用性，性能穩定優異，需要較長時間的應用、優化、驗證。但是不可否認的是，長期來看，GPU能耗高、價格貴等問題也給A.I專用芯片留下了機會。

A.I數據中心需求增加。當前深度學習對海量數據的處理需求，需要專業的A.I數據中心來支撐。隨著A.I的縱深發展，未來A.I數據中心的數據、流量和處理能力也將隨之提升，對專業數據中心需求將會增多。具體表現為：當前許多從事A.I研發的互聯網巨頭，像亞馬遜、百度、騰訊等，都已部署自己的數據中心，并嘗試承載A.I業務，許多A.I潛在應用行業客戶尚未部署自己的A.I數據中心。隨著A.I行業應用繼續深入發展，A.I數據中心的數量和規模將會持續增加。預測到2020年超大規模數據中心將占全部數據中心服務器安裝量的47%，達到485個。預計專業的A.I數據中心增長趨勢與之相同，未來幾年A.I數據中心也呈現直線上升。

超大規模數據中心數量走勢預測（個）

數據來源：公開資料整理

GPU的A.I數據中心市場將繼續保持高速增長。2015-2017財年（2017財年時間為：2016年2月1日-2017年1月31日，其他時間依次類推），英偉達數據中心業務收入達到了：3.17、3.39和8.3億美元。說明CPU+GPU異構系統已經廣泛部署，GPU在數據中心發揮的強大作用已經被廣泛認可。當前英偉達GPU在數據中心滲透率還不到1%，市場成長空間仍然很大。

目前，A.I數據中心（A.I數據中心只是GPU的全部數據中心市場的一部分，GPU應用于數據中心也有可能進行A.I以外的超級計算）尚處于早期發展階段，主要是互聯網巨頭在A.I深度學習研發階段部署的A.I數據中心，隨著A.I縱深發展，A.I數據中心需求會繼續保持高速增長，GPU在數據中心的市場規模會進一步爆發。IDC和Bernstein的研究報告對未來A.I數據中心GPU的市場規模進行了較為保守的估算和預測。2016年A.I數據中心GPU的市場規模達4.71億美元，預計到2020年A.I數據中心的GPU市場規模會達到近40億美元，繼續保持高速增長。

ＡＩ數據中心ＧＰＵ市場規模

－	2016Ａ	2017	2018Ｅ	2019Ｅ	2020Ｅ
訓練階段	471	892	1551	2446	3593
增長率	90.02%	73.30%	57.70%	46.80%	90.02%
推理階段	0	57	143	259	404
增長率	－	－	150.88%	81.12%	55.98%
總規模	471	952	1694	2705	3997
增長率	－	101.12%	77.94%	59.68%	47.76%

數據來源：公開資料整理

三、捕捉GPU應用的三大方向之一

（一）、追求極致的娛樂與性能平衡

１、全球游戲市場穩步發展

移動端占據主要市場，PC端游戲市場規模繼續擴大。近年來，隨著移動終端與PC終端的普及率不斷提升，游戲開發商提供各類吸引玩家的游戲，游戲市場出現了蓬勃發展。數據顯示，2019年，全球游戲市場預計將產生1521億美元的收入，年同比增長9.6%；并且預計全球游戲市場從2018年到2022年會維持穩定增長，年復合增長率達到9%，到2020年全球游戲市場收入達到1960億美元。2019年，在各類游戲中，移動游戲（智能手機及平板電腦）是最大的細分市，產生685億美元的市場收入，占據全球游戲市場規模的45%。由于越來越多玩家轉向了移動端，網頁游戲的市場收入同比下滑15.1%，但是PC游戲收入規模同比增長4%。因此，PC端游戲市場整體規模維持上升態勢。

2018-2022年全球游戲市場各細分市場收入預測

數據來源：公開資料整理

2019年全球游戲市場設備及細分市場年同比

數據來源：公開資料整理

２、游戲發展，電競市場功不可沒

電競圈人氣快速攀升。游戲市場的蓬勃發展離不開電競市場的貢獻。暴雪集團推出了《魔獸爭霸》、《星際爭霸》、《Dota》等一系列經典爆款游戲，玩家人數不斷上升。為提升游戲的知名度，吸引更多的玩家，游戲圈舉辦了相關的電子競技比賽。隨著游戲行業的不斷發展，游戲行業已經產生多款適用于電子競技的熱門產品，端游方面有Dota2、英雄聯盟、風暴英雄等；手游方面有王者榮耀、絕地求生等。熱門游戲的推出加上相關的賽事的宣傳，全球電競圈人氣愈發旺盛。2018年，全球電競觀眾人數為3.95億，其中電競愛好者人數為1.763億；預計2023年，全球電競觀眾人數達到6.46億，同比增長10.4%。

全球電競觀眾人數

數據來源：公開資料整理

中國是全球電子競技產業重點區域。2018年，全球電子競技收入規模為7.76億美元；2019年，全球電子競技總收入為9.50億美元，同比增長22.4%，實現快速增長。當前，電子競技產業已經在全球多個地區開展，以英雄聯盟為例，中國賽區為LPL賽區，北美賽區為LCS賽區，韓國為LCK賽區等，還有部分外卡隊伍所在區域。2018年，北美地區的電子競技收入在全球電子競技行業所有地區的收入中，排名第一，為38.1%；西歐賽區為18.7%，排名第二；中國賽區排名第三，為18.10%。

全球電競收入規模

數據來源：公開資料整理

2018年全球電子競技行業主要地區收入占比統計

數據來源：公開資料整理

中國賽區具備良好的電競市場土壤，市場規模巨大。中國電競用戶分布更為分散。數據顯示，中國有48.1%的電競用戶是在24歲以下的學齡段用戶，更有高達28.1%的30歲以上用戶。廣泛的年齡段分布意味著中國電競市場受眾人數較多，基礎良好，具備順延性。第二，中國的電競用戶有下沉趨勢。從區域的角度來看，三線及以下城市電競用戶占比達到51.5%，下沉趨勢明顯。第三，中國有優秀的電競產業鏈，內容授權方面有騰訊游戲、完美世界等；賽事內容有LPL、KPL；電競戰隊有LGD、RNG、IG等；賽事承辦方有阿里體育，聯盟電競等等；還有內容傳播商斗魚、虎牙直播、企鵝電競等。廣大的電競全體、電競用戶群不斷下城，疊加完善的電競產業鏈造就了中國電競市場的快速發展。2016年，中國電競產業為532.2億元，2017年為772.8億元，2018年已經達到912.6億元，年復合增長率為30.9%。預計2019年中國電競產業規模為1150.6億元，到2024達到2720億元，年復合增長率為18.79%，有望維持快速增長。

2016-2019H1中國電子競技產業市場規模

數據來源：公開資料整理

2019-2024年中國電子競技產業規模預測

數據來源：公開資料整理

中國電競市場的快速發展離不開電競用戶規模的快速增長。數據顯示，2017年中國電競用戶為1.3億人，全球為3.4億人，中國電競市場用戶在全球中占比為38.24%。2018年，中國電競用戶已經達到2.1億人，同比上升61.54%，占全球電競用戶超過50%。MOB研究院預測，2022年中國電競用戶人數快速增長，將達到4.3億人，年復合增長（從2012年開始計算）為35.91%，占全球電競用戶數53.75%。

電競市場用戶規模

數據來源：公開資料整理

2018/2019主要筆記本類別關注度對比

數據來源：公開資料整理

（二）、人工智能與深度學習

１、未來經濟社會發展的助推器——人工智能

人工智能影響深遠，三大因素驅動發展。當前，人工智能已進入新一輪爆發期，主要驅動因素來自三個方面：一是互聯網發展提供了海量大數據資源，大大提升了算法有效性；二是計算機變革降低了硬件成本，縮短了運算時間，推動人工智能再次崛起；三是基礎算法和AI平臺自身創新加速，克服了傳統算法和人類手工總結不完備的缺點，實現算法有效性大幅提升。人工智能快速發展，人工智能已經成為新一輪科技革命和產業變革的核心驅動力，正在對世界經濟、經濟進步和人類生活產生極其深刻的影響。據預測，人工智能將為全球貢獻13萬億美元增量GDP，在2018年的基礎上增長15%，平均每年給GDP貢獻1.2個百分點的增長，對經濟社會具有巨大貢獻潛力，并可能從根本上改變人類社會的生產方式。

人工智能前景廣闊，是經濟社會發展的一大助推器，吸引世界主要國家爭相布局。近年來，美國、中國、日本、英國、法國、韓國、歐盟委員會都發布了促進AI研究、開發和應用的戰略，積極在人工智能領域進行卡位：美國于2011年推出《國家機器人計劃》，推出2.0版機器人路線圖并大力發展協作機器人；2013年公布《推進創新神經技術腦研究計劃》，計劃在未來12年投入45億美元，用于探索人類大腦工作機制；日本于2015年1月公布《機器人新戰略》，計劃到2020年，通過包括政府制度改革在內的多種政策，擴大機器人開發投資，推進千億日元規模機器人的扶持項目；歐盟的人腦計劃則于2013年入選了歐盟的未來旗艦技術項目，15個歐洲國家參與其中，預期將獲得歐盟10億歐元的資金支持。

我國：三步走戰略積極推動AI發展。于2016年8月發布《“十三五”國家科技創新規劃》，明確將人工智能作為發展新一代信息技術的主要方向；2017年7月，國務院頒布《新一代人工智能發展規劃》，制定了三步走的戰略目標：①在2020年人工智能總體技術和應用于世界先進水平同步，人工智能產業成為新的重要經濟增長點；②到2025年，人工智能基礎理論實現重大突破，部分技術與應用達到世界領先水平，AI成為帶動我國產業升級和經濟轉型的主要動力；③到2030年，我國人工智能理論、技術與應用總體達到世界領先水平，成為世界主要人工智能創新中心。

世界主要國家和地區近年AI戰略及規劃

國家	時間	政策及規劃	推動機構
美國	2016年11月	《為人工智能的未來做準備》	國家科學技術委員會、白宮科技政策辦公室、國家預算辦公室、人工智能特別委員會
		《國家人工智能研究與發展戰略計劃》
		《人工智能、自動化及經濟報告》
	2018年5	月白宮人工智能峰會
中國	2015年5月	《中國制造2025》	國務院、科技部、工信部等
	2016年8月	《“十三五”國家科技創新規劃》
	2017年7月	《新一代人工智能發展規劃》
日本	2015年1月	《機器人新戰略》	人工智能技術戰略會議等
日本	2017年3月	《人工智能技術戰略》	人工智能技術戰略會議等
印度	2018年6月	《國家人工智能戰略》	中央部門成立人工智能小組
歐盟	2018年4月	《歐盟人工智能》	歐盟委員會等
德國	2018年7月	《聯邦政府人工智能戰略要點》	德國教育研究部、德國工程研究院
英國	2017年10月	《在英國發展人工智能》	英國政府
英國	2018年啟動	《人工智能行業新政》	英國政府
韓國	2018年5月	《人工智能發展戰略》	科技信息通信部

數據來源：公開資料整理

全球人工智能市場將在未來幾年經歷現象級的增長。德勤預測，未來2025年世界人工智能市場將超過6萬億美元，2017-2025年復合增長率達30%。我國2017年人工智能產業規模為206.9億元，2018年將達到339.0億元，同比增長63.85%；到2020年人工智能帶動規模將達到710.0億元，2017-2020年復合增速為48.37%。

全球人工智能市場規模

數據來源：公開資料整理

我國人工智能產業規模快速增長

數據來源：公開資料整理

２、GPU是人工智能的重要組成部分

人工智能是實現數字化和智能化社會必不可少的條件。人工智能的三大要素：數據、算力、算法。數據是人工智能算法的原材料。人工智能需要對大數據的處理與分析，挖掘出數據背后的信息與規律。算力是對大數據進行處理的能力。算法是計算機通過對數據的處理獲得的數據模型。深度學習的本質是通過對大數據的處理并建立的算法模型，可以實現各行業的AI應用，算法將數據和算力連到一起，共同針對不同細分場景，提供效率優化方案。

人工智能運行過程中有兩部分：訓練與推理。“訓練”可以看作算法產生的過程。具體而言就是，在現有數據基礎上，經過大量計算，確定模型參數，即建立算法模型的過程。“推理”可以看作將算法應用的過程，即在已建立的算法模型基礎上，將新數據通過算法模型處理，得出結果的過程

深度學習模型的訓練與推理

數據來源：公開資料整理

“訓練”階段GPU具備明顯優勢。雖然CPU的功能模塊較多，但是大部分晶體管主要用于構建控制電路和高速緩沖存儲器，只有少部分的晶體管可以組成各類專用電路。CPU的優點在于調度、管理、協調能力強，計算能力不是重點。因此，從運算性能和效率看，CPU不是計算芯片的最佳選擇。深度學習算法需要處理海量數據，需要進行大量的簡單運算，因此，深度學習對并行計算計算能力有較高的要求。在這一方面，GPU擁有較強的優勢，尤其是在訓練過程中。首先，GPU提供了多個并行計算的基礎結構，并且核心數較多，可以執行海量數據的并行計算；第二，GPU擁有更高的訪存速度；第三，GPU擁有更高的浮點運算能力。因為人工智能時代需要大量的多媒體與3D圖形，所以更高的浮點計算能力意味著對圖形與媒體的快速處理。

“推理”階段GPU是其中一種選擇。訓練與推理階段對運算的要求有所不同，訓練階段需要大量繁復的運算，并且為了讓人工智能模型獲得更佳的參數調整數據，運算的精準細膩度較高，而推理階段則相反，模型已經訓練完成，不再需要龐大運算量，且為了盡快獲得推理結果，允許以較低的精度運算。因此，在推理過程中，芯片有多種選擇，主要用CPU、GPU、FPGA、ASIC四種芯片。CPU：適合進行邏輯控制、串行計算等通用計算；GPU并行計算能力強，但是無法單獨工作，必須由CPU進行控制調用才能工作；FPGA適用于多指令，單數據流的分析，因此常用于預測階段，如云端。但是FPGA在實現復雜算法方面有一定的難度，運算量相對GPU小，量產成本高；ASIC專用性強，但是開發周期較長，開發環境需要底層硬件編程，開發難度極高。

３、GPU在深度學習領域空間廣闊

芯片是人工智能領域不可或缺的成分。隨著AI使用的廣泛使用，帶動AI芯片常常的蓬勃發展。數據顯示，2019年-2021年，中國AI芯片市場規模為124億元\193.7億元\305.7億元，分別同比增長53.6%\56.21%\57.82%，年復合增長率為57.01%。

其中云端芯片市場份額最大，接近50%，市場規模從2019年的61.4億元增長至2020年139.4億元。

GPU、FPGA和ASIC的優缺點對比

－	GPU	FPGA	ASIC
一次性成本	高	極低（接近于0）	高
量產成本	高	高	低
延遲	高	低	低
開發周期	很短	短	長
市場風險	低	低	高
開發環境	開發工具豐富，生態系統完善，容易上手	設置FPGA需要硬件知識，編程和配置門檻非常高	需要底層硬件編程，開發難度極高

數據來源：公開資料整理

其中云端芯片市場份額最大，接近50%，市場規模從2019年的61.4億元增長至2020年139.4億元

中國人工智能芯片市場規模

數據來源：公開資料整理

各類市場智能芯片產品結構

數據來源：公開資料整理

GPU提供了多個并行計算的基礎結構，并且核心數較多，可以進行海量數據的并行計算；擁有更高的訪存速度；第三，GPU擁有更高的浮點運算能力。因此，GPU是AI“訓練”階段較為適合的芯片。GPU在AI時代的云端訓練芯片中占據較大的份額，達到64.%。雖然后期由于FPGA以及ASIC技術的突破，GPU的市場份額有所下降，但是仍然是云端訓練市場份額最大的芯片，2019年-2021年年復合增長率達到40%。

2019-2021年中國云端訓練芯片市場規模

數據來源：公開資料整理

2019-2021年中國云端訓練芯片產品結構

數據來源：公開資料整理

從目前的技術看，FPGA由于量產成本高，并且設置需要FPGA硬件姿勢，編程和配置較高；ASIC由于開發周期較長，開發難度，GPU在云端推理階段仍然是較為合適的芯片，但是有GPU也存在功耗高，量產成本高等問題，所以GPU在云端推理階段的市場份額并沒有明天優勢，約為41.84%，年復合增長率為56.5%。

2019-2021年中國云端推斷芯片市場規模

數據來源：公開資料整理

2019-2021年中國云端推斷芯片產品結構

數據來源：公開資料整理

隨著人工智能應用的推進，人工智能生態不斷完善，在終端設備上將會出現越來越多的越來越多的AI應用，對推斷計算的需求會越來越多，終端推斷芯片的需求也會隨之增加。未來，隨著終端細分場景的落地，終端推斷芯片將呈現出專業化發展趨勢，同時由于終端對于性能、功耗、成本都更為敏感，這也使得相比GPU、FPGA更為專用、能效更高、成本更低的ASIC芯片將呈現快速增長勢頭。但是GPU目前依然是主流終端設備中的必須器件，所以市場份額不會下降太多。

2019-2021年中國終端推斷芯片市場規模

數據來源：公開資料整理

2019-2021年中國終端推斷芯片產品結構

數據來源：公開資料整理

（三）、自動駕駛

１、自動駕駛市場空間廣闊

當前，汽車正由人工操控的機械產品逐步向電子信息系統控制的智能產品轉變。智能汽車是指通過搭載先進傳感器等裝置，運用人工智能等新技術，具有自動駕駛功能，逐步成為智能移動空間和應用終端的新一代汽車。當前，自動駕駛技術已經成為整個汽車產業的最新發展方向。應用自動駕駛技術可以全面提升汽車駕駛的各方面性能，滿足更高層次的市場需求。5G的加速推進使自動駕駛的落地可能性在不斷增大，同時近兩年隨著感知技術、算法、芯片、決策控制、系統融合等關鍵技術的快速發展。預測2025年全球自動駕駛汽車銷量將達到60萬輛，2035年將達到2100萬輛。預計2020年L1/2滲透率有望達到40%，2025年L3、L4/5滲透率分別有望達到15%、5%。伴隨5G推動L4/5自動駕駛逐步落地，2030年中國自動駕駛出行服務收入規模有望突破萬億。根據《智能汽車創新發展戰略》，到2025年，中國實現有條件自動駕駛的智能汽車達到規模化生產，實現高度自動駕駛的智能汽車在特定環境下市場化應用。

２、自動駕駛目前以GPU為主

過去汽車電子芯片以與傳感器一一對應的電子控制單元（ECU）為主，主要分布與發動機等核心部件上。隨著汽車智能化的發展，汽車傳感器越來越多，傳統的分布式架構逐漸落后，由中心化架構DCU、MDC逐步替代。

自動駕駛的實現，需要依賴感知傳感器對道路環境的信息進行采集，包括超聲波、攝像頭、毫米波雷達、激光雷達等，采集的好的數據需要傳送到汽車中央處理器進行處理，用來識別障礙物、可行道路等，最后依據識別的結果，規劃路徑、制定速度，自動驅使汽車行駛。整個過程需要在瞬時完成，延時必須要控制在毫秒甚至微秒級別，才能保證自動駕駛的行駛安全。因此，對中央處理器的算力要求非常高。

以用于感知道路環境的攝像頭為例。一般而言，自動駕駛車身需要配置12個攝像頭。為了識別障礙物，處理器需要對多路攝像頭實時拍攝的數據進行解析。因此，單顆1080P的高清攝像頭每秒可以產生超過1G的數據。12個攝像頭每秒產生12G數據量。瞬時海量的數據處理對計算能力要求非常高，GPU有著較強的優勢。相比GPU在傳統的車載儀表盤渲染能力要求，ADAS更強調GPU的并行計算能力，已實現對圖像進行分析和處理。ADAS和全自動駕駛平臺將使用GPU來分析傳感器數據，以此迅速做出反應。這些數據不僅來自傳感器，還來自攝像頭。圖像處理本身需要的是能對計算密集度較高得并行計算做出反應，在并行計算方面，GPU有著較強的優勢。

目前，自動駕駛的主流方案是GPU+CPU。這是由于FPGA的技術門檻較高，處于創業類自動駕駛公司而言在短期內掌握足夠熟練的FPGA編程技術并實現硬件可靠性設計的難度太大，因此使用通用型CPU+GPU來做自動駕駛計算平臺或域控制器的開發成為當前的主流。

本文采編：CY315