奇米超碰,男男激情网站,少妇无码免费专区,九色视频老

  • 元宇宙:本站分享元宇宙相關(guān)資訊,資訊僅代表作者觀點與平臺立場無關(guān),僅供參考.

英偉達(dá)的江山,還能坐多久?

  • 2023年9月06日 20:50



當(dāng)下的AI賽場上,英偉達(dá)無疑是最閃耀的一顆明星。
十多年來,英偉達(dá)在生產(chǎn)能夠執(zhí)行復(fù)雜AI任務(wù)(如圖像、面部和語音識別)的芯片方面,建立了幾乎無法撼動的領(lǐng)先地位。然而,凡事總有變化。近期,隨著谷歌、IBM等巨頭開始在芯片方面一齊發(fā)力,GPU領(lǐng)域的競爭格局,開始有了些微妙的改變。
最近,IBM推出一款全新的14nm模擬AI芯片,效率達(dá)到了最領(lǐng)先GPU的14倍。其最大的亮點,就是借助神經(jīng)網(wǎng)絡(luò)在生物大腦中運行的關(guān)鍵特征,來減少能耗。從而最大限度地減少人們在計算上花費的時間和精力。同樣的,身為科技巨頭的谷歌,也在8月底的GoogleCloudNext2023大會上,發(fā)布了一款全新AI芯片CloudTPUv5e,專為大模型訓(xùn)練推理所設(shè)計。
具體來說,CloudTPUv5e允許多達(dá)256個芯片互連,聚合帶寬超過400Tb/s和100petaOps的INT8性能。根據(jù)速度基準(zhǔn)測試,在CloudTPUv5e上訓(xùn)練和運行人工智能模型的速度提高了5倍。
由此可見,各大巨頭其實并不甘于在算力問題上永遠(yuǎn)被英偉達(dá)“卡脖子”,并開始紛紛推出了各自的芯片,對英偉達(dá)的GPU霸權(quán)地位發(fā)起了“圍攻”。那么,在英偉達(dá)深不見底的護(hù)城河面前,這樣的挑戰(zhàn)前景究竟如何?1
“霸主”的遠(yuǎn)慮


英偉達(dá)的江山還能坐多久?從某種程度上說,決定這件事的,不僅僅是英偉達(dá)本身的創(chuàng)新能力,還有科技發(fā)展固有的定律。作為計算機(jī)行業(yè)的黃金定律,摩爾定律一直指導(dǎo)著芯片開發(fā)。但是隨著芯片工藝升級速度的放緩,圍繞在這一定律身上的爭議也在不斷擴(kuò)大。所謂摩爾定律,指的是集成電路上可以容納的晶體管數(shù)目在大約每經(jīng)過18個月到24個月便會增加一倍。然而,隨著芯片技術(shù)的不斷發(fā)展,摩爾定律正逐漸遭遇瓶頸。CIC灼識咨詢曾披露,受制于芯片尺寸的物理極限、光刻技術(shù)、隧道效應(yīng)、功耗和散熱、供電能力等問題,從5nm到3nm再到2nm,其間隔都超過了2年時間。面對這種情況,即使是以“刀法精湛”著稱的黃仁勛,也不得不無奈地宣布“摩爾定律已死”,漲價身不由己!其在去年發(fā)布的 AD102(RTX4090) 芯片,尺寸為 608mm,這僅比 628mm 的 GA102(RTX3090Ti)略小。按照這樣的技術(shù)路徑,傳統(tǒng)GPU的天花板,似乎已經(jīng)越來越近。也正因如此,各路巨頭在解決算力之困的同時,也在積極地“另辟蹊徑”,找到一條有別于傳統(tǒng)路線的破局之策。前面提到的IBM模仿人腦神經(jīng)結(jié)構(gòu)的類腦芯片,就是這樣的嘗試之一。然而,在面對傳統(tǒng)芯片瓶頸方面,業(yè)界存在著很多種不同的方案,比如量子芯片、光子芯片、類腦芯片,但如同當(dāng)年GPU取代CPU,成為今天AI計算的主力一樣,在多種技術(shù)路徑的博弈中,最終往往會有一個“最優(yōu)”的路徑勝出,成為新時代通用的芯片范式。而這樣的“最優(yōu)”路徑,則理應(yīng)是一種在技術(shù)成熟度、通用性和市場需求等方面,都做到了較好兼顧的一種方案。就目前的情況來看,量子芯片、光子芯片、類腦芯片等都還處于研發(fā)階段,其技術(shù)成熟度還有待實踐的檢驗。此外,量子芯片、光子芯片、類腦芯片等都是針對特定的計算問題而設(shè)計的,其在通用性、兼容性上,往往還存在著一定的不足,例如量子芯片適合解決一些經(jīng)典計算機(jī)難以解決的重要問題。光子芯片適合解決一些高速數(shù)據(jù)處理和傳輸?shù)膯栴},如光通信、光互連、光計算等。而綜合比較下來,目前最有可能勝出的方案,則是多種芯片模塊組合的超異構(gòu)計算。2
新的賽道
什么是超異構(gòu)計算?簡單來說,就像是一個拼圖游戲,把不同的芯片模塊(如CPU、GPU、FPGA等)按照不同的規(guī)則和目標(biāo)來拼接,形成不同的計算方案。從而處理不同類型的數(shù)據(jù)和工作負(fù)載的技術(shù)。超異構(gòu)計算的目的是實現(xiàn)計算的最優(yōu)化,即在性能、功耗、延遲等方面達(dá)到最佳的平衡。在CPU同構(gòu)計算階段,100%工作由CPU完成;但在GPU異構(gòu)階段,80%工作由GPU完成,CPU只完成剩余的20%的工作;而在超異構(gòu)計算階段,則80%的工作由各類更高效的DSA完成,GPU只完成剩余20%工作的80%,即16%的工作,剩余的4%交給CPU。這里的DSA,是一種針對特定領(lǐng)域和場景的計算單元,可以實現(xiàn)高效的數(shù)據(jù)處理和算法加速。例如神經(jīng)網(wǎng)絡(luò)處理器(NPU)、圖形處理器(GPU)、數(shù)字信號處理器(DSP)、視覺處理器(VPU)、安全處理器(SPU)等 。這些“術(shù)業(yè)有專攻”的特定芯片可以比傳統(tǒng)的GPU更快、更省電、更小巧、更靈活。但同時,由于高度特化的DSA不太適合做其他方面的工作。所以,還需要用到一些GPU和CPU來輔助和協(xié)調(diào)這些芯片,完成剩下的一些計算工作。這樣,在“專人專職”的分工搭配下,芯片就可以實現(xiàn)計算的最優(yōu)化,即在性能、功耗、延遲等方面達(dá)到最佳的平衡。在面對AI大模型、自動駕駛、元宇宙等新興的領(lǐng)域和應(yīng)用場景時,AI要做的事情越來越多,越來越難,而傳統(tǒng)的同構(gòu)芯片已經(jīng)跟不上AI的步伐,難以給AI提供足夠的算力和速度。而超異構(gòu)計算可以提供更高的靈活性和可擴(kuò)展性,能夠根據(jù)不同的數(shù)據(jù)和工作負(fù)載,動態(tài)地分配和調(diào)度計算資源,實現(xiàn)計算的自適應(yīng)和智能。具體來說,超異構(gòu)計算可以分為兩種模式:靜態(tài)超異構(gòu)計算和動態(tài)超異構(gòu)計算。靜態(tài)超異構(gòu)計算,是指在設(shè)計階段就確定好各個處理器之間的分工和協(xié)作方式,適用于一些穩(wěn)定且可預(yù)測的場景,如視頻編解碼、圖像處理等;動態(tài)超異構(gòu)計算是指在運行時根據(jù)實時數(shù)據(jù)和工作負(fù)載來動態(tài)地選擇和調(diào)度最合適的處理器,適用于一些更具變化的場景,如云計算、邊緣計算、物聯(lián)網(wǎng)等;通過這類“動靜結(jié)合”的方式,超異構(gòu)計算就能靈活調(diào)整負(fù)載,實現(xiàn)高效地算力調(diào)度。除此之外,從成本上說,超異構(gòu)計算同樣是一種有效降低大算力芯片成本的方案。隨著傳統(tǒng)GPU芯片尺寸的不斷縮小,人們就需要更多的研發(fā)投入和更精密的制造設(shè)備,這就導(dǎo)致了成本的上升。知名半導(dǎo)體研究機(jī)構(gòu)Semiengingeering統(tǒng)計了不同工藝下芯片所需費用,其中7nmNode需要的費用已經(jīng)達(dá)到了2.97億美元;但超異構(gòu)計算,卻憑借多種芯片間靈活的分工、協(xié)作,巧妙地解決了這一難題。用一個形象的比喻來說,傳統(tǒng)GPU芯片就像是一輛跑車,要想讓它跑得更快,就需要不斷地改進(jìn)發(fā)動機(jī)、輪胎、剎車等部件,因而制造成本會成倍上升。而超異構(gòu)計算就像是一輛多功能汽車,它可以根據(jù)不同的路況和需求,切換不同的驅(qū)動模式,如越野、運輸、載客等,如此一來,就不用一味地改進(jìn)發(fā)動機(jī)(縮小芯片尺寸)來提高性能了。3
彎道超車
正是由于這樣的優(yōu)勢,超異構(gòu)計算不僅突破了傳統(tǒng)GPU的瓶頸,并且也對了國產(chǎn)大算力芯片提供了“彎道超車”的歷史時機(jī)。就目前來看,在超異構(gòu)計算的賽道上,英偉達(dá)等巨頭的布局也非常積極和全面,推出了Hopper超級芯片,與GraceCPU和BluefieldDPU集成,構(gòu)成一個完整的超異構(gòu)系統(tǒng)。但國內(nèi)廠商也同樣開始在這一方向進(jìn)行了發(fā)力,如華為推出了鯤鵬920處理器,這是一款基于ARM架構(gòu)的高性能CPU,可以與華為自研的昇騰 AI 芯片和昆侖 AI 芯片實現(xiàn)異構(gòu)協(xié)同,支持云、邊、端等多種場景。
還有一些國內(nèi)廠商也在研發(fā)自己的超異構(gòu)芯片,例如紫光展銳推出了虎賁 T7520處理器,這是一款集成了CPU、GPU、NPU、ISP等多種計算單元的超異構(gòu)芯片,專為5G終端而設(shè)計。從總體來說,超異構(gòu)計算是否會給國內(nèi)芯片廠商提供彎道超車的機(jī)會,主要取決于以下幾個因素:
·國內(nèi)芯片廠商在不同類型的計算單元上的技術(shù)水平和競爭力,例如CPU、GPU、DPU、FPGA等,以及它們之間的協(xié)同和優(yōu)化能力!鴥(nèi)芯片廠商在高速互連和先進(jìn)封裝方面的創(chuàng)新能力和成本控制能力,例如 2.5D和3D堆疊技術(shù),以及對不同工藝Node和架構(gòu)的兼容性和可擴(kuò)展性!鴥(nèi)芯片廠商在統(tǒng)一軟件平臺方面的開發(fā)能力和生態(tài)建設(shè)能力,例如支持多種異構(gòu)設(shè)備的編程框架和管理平臺,對不同場景和應(yīng)用的適配能力。在這三個方面,目前的國內(nèi)企業(yè)雖然有一定的探索和進(jìn)展,但總體而言,仍面臨不小的挑戰(zhàn)。
例如,不同類型的計算單元上的技術(shù)水平上,國內(nèi)仍存在著一定的短板,例如華為的鯤鵬920處理器雖然在性能上有所提升,但是在兼容性和生態(tài)方面還有不足。在高速互連和先進(jìn)封裝方面,對于2.5D和3D堆疊等關(guān)鍵技術(shù),目前國內(nèi)芯片廠商還沒有完全掌握,并且還依賴于國外供應(yīng)商。而目前國內(nèi)廠商目前突破最大,也最具潛力的方向,是軟件平臺的開發(fā)能力上。因為,超異構(gòu)計算的硬件多樣性和復(fù)雜性,給開發(fā)者帶來了很大的挑戰(zhàn)。
如果有一個統(tǒng)一的軟件平臺,可以屏蔽底層的細(xì)節(jié),提供高效的編譯、調(diào)度、優(yōu)化等功能,那么就可以大大降低開發(fā)者的負(fù)擔(dān),提高超異構(gòu)計算的可用性和普及性,F(xiàn)階段,阿里云的異構(gòu)計算產(chǎn)品家族,包括GPU云服務(wù)器、FPGA云服務(wù)器和彈性加速計算實例 EAIS 等,提供了一系列的異構(gòu)計算服務(wù)和解決方案。而華為的Atlas異構(gòu)計算平臺,基于自研的昇騰AI處理器,也提供了從芯片到云服務(wù)的全棧異構(gòu)計算解決方案。綜合以上各種因素,以及英偉達(dá)自身的研發(fā)能力這一“動態(tài)變量”進(jìn)行考慮,未來芯片市場的競爭格局,大致會呈現(xiàn)如下態(tài)勢:
國內(nèi)芯片廠商未來5年在超異構(gòu)計算上的競爭水平,會有一定程度的提升和突破,解決部分算力“卡脖子”問題,但是還無法完全擺脫對英偉達(dá)等國外巨頭的依賴。在一些特定的場景和應(yīng)用上,國內(nèi)芯片廠商可以與英偉達(dá) 等巨頭形成有效的競爭,例如在5G、物聯(lián)網(wǎng)、邊緣計算等領(lǐng)域,國內(nèi)芯片廠商可能會推出更適合本地化需求和環(huán)境的超異構(gòu)計算解決方案。可以說,超異構(gòu)計算,確實為國產(chǎn)芯片的“算力之困”撕開了一道口子,但從長遠(yuǎn)來看,要想完全解決“卡脖子”問題,并與英偉達(dá)等巨頭形成對等競爭,仍是一個任重道遠(yuǎn)的過程。

Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM

亚洲少妇爱| 国产成人精品一区二区三区福利| 成人在线不卡视频播放| 免费一区亚洲性| 日韩黄免费在线观看| 久久东京热无码邻居| 亚洲无码色五月| 国产伦精品一区二区三区高清| 久热这里只有精品99国产| 国产凹凸在线一区二区色老头| 九九欧美视频| 淫妇久久久久久久特黄| 亚洲AV不卡成人无码久久精品| 在线看片免费人成视频国产片| 真人啪日韩无码| 日韩免费小黄片| 亚洲精品一二三区| 国产l精品国产一区二区精品久久 久久久国产精品ⅤA麻豆苹果 | 背德人妻网站入口| 亚洲一区二区厕所视频| 亚洲AV成人不卡播放| 玩弄丰满少妇XXXXX性多毛| 尤物视频在线国产| 老熟女另类xxx精品视频| 无码免费网站在线观看| 人人福利导航| 破了亲妺妺的处免费视频国产| 亚洲av午夜| 人妻系列专区无码在线| 久久无码激情| 久久精品国产99久久香蕉| 国产三级国产精品国产专区50| 国产一二区视频| 人妻久久精品天天中文字幕| 三门县| 免费污网站在线| 中文AV日韩综合Av| 天堂网狠狠干| 人妻丰满熟妇AV无码区| 精品久久久久久久妇女| 亚洲欧美日韩大片|