你的位置:首頁(yè) > 互連技術(shù) > 正文

拿什么追趕英偉達、AMD?“AI芯片大戰”最新進(jìn)展

發(fā)布時(shí)間:2023-05-24 責任編輯:Doris




AI芯片+AI服務(wù)器,受益于A(yíng)IGC+類(lèi)GPT等應用的鯰魚(yú)效應,帶來(lái)約百倍算力需求。原有英偉達等供給有限(根據IDC咨詢(xún),預測2025年AI服務(wù)器市場(chǎng)空間僅僅318億美元,預計21-25年CAGR僅僅19.5%),因此國產(chǎn)AI芯片在邏輯上有爆發(fā)彈性,此外AI服務(wù)器也有成長(cháng)空間。


01
AI芯片分類(lèi)及優(yōu)缺點(diǎn)

人工智能芯片主要分為“訓練(Training)”芯片和“推理(Inference)”芯片。從技術(shù)架構來(lái)看,AI芯片主要分為圖形處理器(GPU)、現場(chǎng)可編程門(mén)陣列(FPGA)、專(zhuān)用集成電路(ASIC)、中央處理器(CPU)四大類(lèi)。其中,GPU是較為成熟的通用型人工智能芯片,FPGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進(jìn)行大規模計算。

三類(lèi)芯片用于深度學(xué)習時(shí)各有優(yōu)缺點(diǎn):

(1)通用性:GPU>FPGA>ASIC,通用性越低,代表其適合支持的算法類(lèi)型越少。

(2)性能功耗比:GPU<FPGA<ASIC,性能功耗比越高越好,意味著(zhù)相同功耗下運算次數越多,訓練相同算法所需要的時(shí)間越短。


02
AI芯片市場(chǎng)競爭格局

目前AI芯片主要被國際廠(chǎng)商壟斷,根據Counterpoint、IDC數據,Intel和AMD共計占2022年全球數據中心CPU市場(chǎng)收入的92.45%,Nvidia占2021年中國加速卡市場(chǎng)份額的80%以上。

在不同的應用場(chǎng)景之下,已經(jīng)形成了不同的AI芯片競爭格局。

1.云和數據中心AI芯片市場(chǎng)


在云和數據中心AI芯片市場(chǎng),“訓練”和“推理”兩個(gè)環(huán)節都是英偉達GPU一家獨大,幾乎占據90%以上份額,包括AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云在內的大部分公有云廠(chǎng)商上線(xiàn)的AI加速計算公有云服務(wù)絕大部分都是基于英偉達Tesla系列GPU。


(1)云端訓練


云端訓練用的幾乎全部是英偉達GPU,公有云廠(chǎng)商中僅谷歌云一家除了提供以英偉達GPU為主的云計算加速服務(wù)之外,還推出了基于自研AI芯片TPU的深度學(xué)習訓練服務(wù);


(2)云端推理


云端推理目前出現了基于GPU、FPGA、ASIC三種不同芯片云計算服務(wù),但是市場(chǎng)份額仍然以英偉達GPU為主,其中AWS、阿里云、騰訊云、華為云等公有云廠(chǎng)商均推出了FPGA加速計算云服務(wù),另外AWS推出了基于自研AI芯片Inferentia的ASIC加速計算服務(wù),華為云推出了基于自研AI芯片昇騰310的ASIC加速計算服務(wù)。


2.設備端和邊緣計算“推理”市場(chǎng)


在設備端和邊緣計算“推理”市場(chǎng),各類(lèi)型芯片各自為陣,尚無(wú)絕對優(yōu)勢地位的芯片廠(chǎng)商出現——手機市場(chǎng)以高通、華為、蘋(píng)果原主控芯片廠(chǎng)商為主,自動(dòng)駕駛、安防IPC領(lǐng)域英偉達暫時(shí)領(lǐng)先。

03
國產(chǎn)AI芯片多領(lǐng)域追趕


(1)國產(chǎn)CPU加速追趕

全球服務(wù)器CPU市場(chǎng)目前被IntelAMD所壟斷,國產(chǎn)CPU在性能方面與國際領(lǐng)先水平仍有差距。根據Counterpoint數據,在2022年全球數據中心CPU市場(chǎng)中,Intel以70.77%的市場(chǎng)份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠(chǎng)商僅占據9.39%的市場(chǎng)份額,整體上處于壟斷局面;目前國內CPU廠(chǎng)商主有海光信息、海思、飛騰、龍芯中科、申威等。通過(guò)產(chǎn)品對比發(fā)現,目前國產(chǎn)服務(wù)器CPU性能已接近Intel中端產(chǎn)品水平。

值得一提的是,龍芯CPU從指令集、IP核、芯片模塊等完全自主設計,目前基于LoongArch(龍架構)的第四范式Sage AIOS平臺已完成與龍芯3C5000系列芯片的深度適配。通過(guò)軟硬件協(xié)同調優(yōu),邏輯回歸、決策樹(shù)模型、深度稀疏神經(jīng)網(wǎng)絡(luò )等機器學(xué)習算法在龍芯3C5000系列上的性能,接近某國外主流CPU的水平。


龍芯中科CPU方案推薦

軌道交通/地鐵站級系統設備解決方案

龍芯中科設計推出軌道交通專(zhuān)用無(wú)風(fēng)扇ECU,整機采用龍芯3號CPU,板貼4G DDR4內存顆粒,最大支持8G。支持3*VGA+1*LVDS顯示接口,最大支持4路獨立顯示。支持14個(gè)COM,6個(gè)USB,2個(gè)RJ45千兆網(wǎng)口,24路DIO。支持DC 9-36V寬壓輸入。該設備可廣泛應用于軌道交通、輕軌和高鐵行業(yè)各種自助售檢票系統、屏蔽門(mén)等場(chǎng)景。

龍芯3號工控機

產(chǎn)品特點(diǎn)

1. 采用龍芯3號低功耗版;

2. 采用全鋁型材無(wú)風(fēng)扇機箱設計;

3. 板貼4G DDR4內存顆粒,最大可支持8G;

4. MiniITX 板型設計;

5. 獨立雙顯/獨立四顯可選,最大支持4路獨立顯示:1*LVDS+3*VGA;

6. 支持4*USB2.0/2*USB3.0/14*COM/2*LAN/2*SATA/1*MSATA/12*DI/12*DO;

7. 支持DC 9-36V寬壓輸入;

8. 支持專(zhuān)用設備版/Loongnix/UOS/麒麟等操作系統;

9. 支持上電啟動(dòng)/網(wǎng)絡(luò )喚醒/定時(shí)開(kāi)機;


方案應用

自動(dòng)/半自動(dòng)售票機框圖


智慧高速ETC收費系統解決方案

龍芯中科推出交通行業(yè)專(zhuān)用邊緣計算設備,基于龍芯3A5000 CPU,采用無(wú)風(fēng)扇被動(dòng)散熱設計,板載多路USB, COM, DIO 等接口,支持WIFI,可適應多種應用場(chǎng)景。其中12路3模式可選換串口RS232/422/485,現場(chǎng)適用性更廣;每個(gè)串口和每種模式均采用2.5KV光電隔離保護,提高串口應用可靠性;24路2.5KV光隔離DIO,提高開(kāi)關(guān)控制的可靠性。軟件方面完美支持K8S, .Net6.0, Java8/11/17等常用基礎組件,大大提升系統構建的靈活性和兼容性。

1684834930860.jpg

龍芯3A5000

產(chǎn)品特點(diǎn)

1. 龍芯3A5000 CPU, 主頻2.3-2.5GHz,四核;

2. 2*DDR4 3200MHz UDIMM內存,最大64GB;

3. 1*VGA 和1*HDMI 獨立雙顯示;

4. 2*SATA,1*M.2 2280 NVMe存儲;

5. 4*USB3.0/2*USB2.0/2*LAN,/1*M.2 2230 E-Key支持WiFi&BT模塊/Audio out和Mic;

6. 12*DI/12*DO/12*COM;

7. DC 9-36V寬壓供電,帶反接、過(guò)流、過(guò)壓保護;

8. 無(wú)風(fēng)扇被動(dòng)散熱設計,采用超大鋁擠型材+雙銅管導熱+高導熱率硅脂散熱設計方案;

9. 工作溫度:-20~60℃,IP51防護等級;

10. 適配Loongnix、統信、麒麟、OpenEuler系統;


方案應用


ETC車(chē)道收費系統框圖


ETC門(mén)架收費系統框圖


申請樣片,方案技術(shù)資料,請掃二維碼。


(2)國產(chǎn)GPU生態(tài)體系逐步完善

全球GPU芯片市場(chǎng)主要由海外廠(chǎng)商占據壟斷地位,國產(chǎn)廠(chǎng)商加速布局。全球GPU市場(chǎng)被英偉達、英特爾和AMD三強壟斷,英偉達憑借其自身CUDA生態(tài)在A(yíng)I及高性能計算占據絕對主導地位;國內市場(chǎng)中,景嘉微在圖形渲染GPU領(lǐng)域持續深耕,另外天數智芯、壁仞科技、登臨科技等一批主打AI及高性能計算的GPGPU初創(chuàng )企業(yè)正加速涌入。



(3)FPGA/ASIC國產(chǎn)替代正當時(shí)

FPGA全球市場(chǎng)呈現“兩大兩小”格局,Altera與Xilinx市占率共計超80%,Lattice和Microsemi市占率共計超10%;整體來(lái)看,安路科技、紫光同創(chuàng )等廠(chǎng)商處于國際中端水平,仍需進(jìn)一步突破。工藝制程方面,當前國產(chǎn)廠(chǎng)商先進(jìn)制程集中在28nm,落后于國際16nm水平;在等效LUT數量上,國產(chǎn)廠(chǎng)商旗艦產(chǎn)品處于200K水平,僅為XILINX高端產(chǎn)品的25%左右。

ASIC不同于CPU、GPU、FPGA,目前全球ASIC市場(chǎng)并未形成明顯的頭部廠(chǎng)商,國產(chǎn)廠(chǎng)商快速發(fā)展;通過(guò)產(chǎn)品對比發(fā)現,目前國產(chǎn)廠(chǎng)商集中采用7nm工藝制程,與國外ASIC廠(chǎng)商相同;算力方面,海思的昇騰910在BF16浮點(diǎn)算力和INT8定點(diǎn)算力方面超越Googel最新一代產(chǎn)品TPUv4,遂原科技和寒武紀的產(chǎn)品在整體性能上也與Googel比肩。未來(lái)國產(chǎn)廠(chǎng)商有望在A(yíng)SIC領(lǐng)域繼續保持技術(shù)優(yōu)勢,突破國外廠(chǎng)商在A(yíng)I芯片的壟斷格局。




END




特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页