AI芯片+AI服務(wù)器,受益于A(yíng)IGC+類(lèi)GPT等應用的鯰魚(yú)效應,帶來(lái)約百倍算力需求。原有英偉達等供給有限(根據IDC咨詢(xún),預測2025年AI服務(wù)器市場(chǎng)空間僅僅318億美元,預計21-25年CAGR僅僅19.5%),因此國產(chǎn)AI芯片在邏輯上有爆發(fā)彈性,此外AI服務(wù)器也有成長(cháng)空間。
人工智能芯片主要分為“訓練(Training)”芯片和“推理(Inference)”芯片。從技術(shù)架構來(lái)看,AI芯片主要分為圖形處理器(GPU)、現場(chǎng)可編程門(mén)陣列(FPGA)、專(zhuān)用集成電路(ASIC)、中央處理器(CPU)四大類(lèi)。其中,GPU是較為成熟的通用型人工智能芯片,FPGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進(jìn)行大規模計算。
三類(lèi)芯片用于深度學(xué)習時(shí)各有優(yōu)缺點(diǎn):
(1)通用性:GPU>FPGA>ASIC,通用性越低,代表其適合支持的算法類(lèi)型越少。
(2)性能功耗比:GPU<FPGA<ASIC,性能功耗比越高越好,意味著(zhù)相同功耗下運算次數越多,訓練相同算法所需要的時(shí)間越短。
目前AI芯片主要被國際廠(chǎng)商壟斷,根據Counterpoint、IDC數據,Intel和AMD共計占2022年全球數據中心CPU市場(chǎng)收入的92.45%,Nvidia占2021年中國加速卡市場(chǎng)份額的80%以上。
在不同的應用場(chǎng)景之下,已經(jīng)形成了不同的AI芯片競爭格局。
1.云和數據中心AI芯片市場(chǎng)
在云和數據中心AI芯片市場(chǎng),“訓練”和“推理”兩個(gè)環(huán)節都是英偉達GPU一家獨大,幾乎占據90%以上份額,包括AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云在內的大部分公有云廠(chǎng)商上線(xiàn)的AI加速計算公有云服務(wù)絕大部分都是基于英偉達Tesla系列GPU。
(1)云端訓練
云端訓練用的幾乎全部是英偉達GPU,公有云廠(chǎng)商中僅谷歌云一家除了提供以英偉達GPU為主的云計算加速服務(wù)之外,還推出了基于自研AI芯片TPU的深度學(xué)習訓練服務(wù);
(2)云端推理
云端推理目前出現了基于GPU、FPGA、ASIC三種不同芯片云計算服務(wù),但是市場(chǎng)份額仍然以英偉達GPU為主,其中AWS、阿里云、騰訊云、華為云等公有云廠(chǎng)商均推出了FPGA加速計算云服務(wù),另外AWS推出了基于自研AI芯片Inferentia的ASIC加速計算服務(wù),華為云推出了基于自研AI芯片昇騰310的ASIC加速計算服務(wù)。
2.設備端和邊緣計算“推理”市場(chǎng)
在設備端和邊緣計算“推理”市場(chǎng),各類(lèi)型芯片各自為陣,尚無(wú)絕對優(yōu)勢地位的芯片廠(chǎng)商出現——手機市場(chǎng)以高通、華為、蘋(píng)果原主控芯片廠(chǎng)商為主,自動(dòng)駕駛、安防IPC領(lǐng)域英偉達暫時(shí)領(lǐng)先。
(1)國產(chǎn)CPU加速追趕
全球服務(wù)器CPU市場(chǎng)目前被Intel和AMD所壟斷,國產(chǎn)CPU在性能方面與國際領(lǐng)先水平仍有差距。根據Counterpoint數據,在2022年全球數據中心CPU市場(chǎng)中,Intel以70.77%的市場(chǎng)份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠(chǎng)商僅占據9.39%的市場(chǎng)份額,整體上處于壟斷局面;目前國內CPU廠(chǎng)商主有海光信息、海思、飛騰、龍芯中科、申威等。通過(guò)產(chǎn)品對比發(fā)現,目前國產(chǎn)服務(wù)器CPU性能已接近Intel中端產(chǎn)品水平。
值得一提的是,龍芯CPU從指令集、IP核、芯片模塊等完全自主設計,目前基于LoongArch(龍架構)的第四范式Sage AIOS平臺已完成與龍芯3C5000系列芯片的深度適配。通過(guò)軟硬件協(xié)同調優(yōu),邏輯回歸、決策樹(shù)模型、深度稀疏神經(jīng)網(wǎng)絡(luò )等機器學(xué)習算法在龍芯3C5000系列上的性能,接近某國外主流CPU的水平。
龍芯中科CPU方案推薦
龍芯中科設計推出軌道交通專(zhuān)用無(wú)風(fēng)扇ECU,整機采用龍芯3號CPU,板貼4G DDR4內存顆粒,最大支持8G。支持3*VGA+1*LVDS顯示接口,最大支持4路獨立顯示。支持14個(gè)COM,6個(gè)USB,2個(gè)RJ45千兆網(wǎng)口,24路DIO。支持DC 9-36V寬壓輸入。該設備可廣泛應用于軌道交通、輕軌和高鐵行業(yè)各種自助售檢票系統、屏蔽門(mén)等場(chǎng)景。


龍芯3號工控機
全球GPU芯片市場(chǎng)主要由海外廠(chǎng)商占據壟斷地位,國產(chǎn)廠(chǎng)商加速布局。全球GPU市場(chǎng)被英偉達、英特爾和AMD三強壟斷,英偉達憑借其自身CUDA生態(tài)在A(yíng)I及高性能計算占據絕對主導地位;國內市場(chǎng)中,景嘉微在圖形渲染GPU領(lǐng)域持續深耕,另外天數智芯、壁仞科技、登臨科技等一批主打AI及高性能計算的GPGPU初創(chuàng )企業(yè)正加速涌入。
(3)FPGA/ASIC國產(chǎn)替代正當時(shí)
FPGA全球市場(chǎng)呈現“兩大兩小”格局,Altera與Xilinx市占率共計超80%,Lattice和Microsemi市占率共計超10%;整體來(lái)看,安路科技、紫光同創(chuàng )等廠(chǎng)商處于國際中端水平,仍需進(jìn)一步突破。工藝制程方面,當前國產(chǎn)廠(chǎng)商先進(jìn)制程集中在28nm,落后于國際16nm水平;在等效LUT數量上,國產(chǎn)廠(chǎng)商旗艦產(chǎn)品處于200K水平,僅為XILINX高端產(chǎn)品的25%左右。
ASIC不同于CPU、GPU、FPGA,目前全球ASIC市場(chǎng)并未形成明顯的頭部廠(chǎng)商,國產(chǎn)廠(chǎng)商快速發(fā)展;通過(guò)產(chǎn)品對比發(fā)現,目前國產(chǎn)廠(chǎng)商集中采用7nm工藝制程,與國外ASIC廠(chǎng)商相同;算力方面,海思的昇騰910在BF16浮點(diǎn)算力和INT8定點(diǎn)算力方面超越Googel最新一代產(chǎn)品TPUv4,遂原科技和寒武紀的產(chǎn)品在整體性能上也與Googel比肩。未來(lái)國產(chǎn)廠(chǎng)商有望在A(yíng)SIC領(lǐng)域繼續保持技術(shù)優(yōu)勢,突破國外廠(chǎng)商在A(yíng)I芯片的壟斷格局。
END