芯片“電老虎”,“困死”蘋果黑科技
芯片“電老虎”,“困死”蘋果黑科技
“芯事重重”是騰訊科技半導(dǎo)體產(chǎn)業(yè)研究策劃,本期聚焦蘋果Vision Pro的芯片設(shè)計理念、功耗難題以及蘋果對抗功耗的產(chǎn)品理念。
文 / 汪波 《芯片簡史》作者,資深芯片研究專家
首款“混合現(xiàn)實(shí)(MR)頭顯”,可以“透”過它看世界,開啟“空間計算”時代。
6月6日蘋果公司CEO庫克在全球開發(fā)者大會上發(fā)布了“Vision Pro”。庫克以一句“one more thing”,再次吊起無數(shù)熬夜觀看的粉絲的胃口。仿佛蘋果公司展示的不是地球另一端的一臺設(shè)備,而是來自未來的、只有在科幻片里才能呈現(xiàn)的某種幻想科技。
早在16年前,當(dāng)喬布斯發(fā)布第一代iPhone時,當(dāng)時主流手機(jī)上的固定鍵盤被替換為一整塊任意觸摸的屏幕,擴(kuò)展了手機(jī)的“面子”。而這一次,庫克則把這塊“面子”擴(kuò)大到了整個房間。從iPhone到Vision Pro的這一步,蘋果把古希臘先賢的“人是萬物的尺度”發(fā)揮得淋漓盡致,由此人類成為觀察一切事物的中心。
透過這臺Vision Pro,無論是3D電影、正在瀏覽的網(wǎng)頁、還是周圍活生生的人,都清晰地呈現(xiàn)在你面前。而你的眼神也能透過Vision Pro內(nèi)置的攝像頭和表面的屏幕顯示給你的朋友。就這樣,虛擬和現(xiàn)實(shí)在Vision Pro上實(shí)現(xiàn)了完美的結(jié)合。
而能夠支持這種無縫結(jié)合和切換的,是Vision Pro的核心:一款計算芯片M2和一款傳感器處理芯片R1,二者像兩根大柱子共同支撐起蘋果的“空間計算”的大廈。
01 瘋狂“堆料”的R1和M2芯片與無法回避功耗難題
蘋果這顆自研的M2芯片采用臺積電5納米工藝制造,包含了200多億個晶體管。它不是傳統(tǒng)意義上的CPU,而更像是三頭六臂、拿著各種寶物的哪吒太子。在這顆M2芯片里,蘋果集成了8個CPU內(nèi)核、10個GPU(圖形處理單元)內(nèi)核和16個神經(jīng)網(wǎng)絡(luò)加速內(nèi)核,這還不夠,還有容量24GB的存儲器、以及存儲控制器、編解碼模塊等。
簡單提一下5nm,目前市面上采用該工藝的產(chǎn)品不多,2020年10月份上市的蘋果A14芯片和華為的麒麟9000以及高通的車芯8295,均采用該工藝,晶體管的數(shù)量分別為119億和153億(高通8295晶體管數(shù)量公開報道為百億級)。
業(yè)界對5nm工藝最核心的關(guān)注即發(fā)熱和功耗,盡管車芯不存在類似的擔(dān)憂,但是在移動端卻是大規(guī)模應(yīng)用的障礙。
*Apple M2芯片 Die Shot
至于R1芯片,被稱為協(xié)處理器或者傳感器處理芯片,它是M2的左膀右臂,有效地分擔(dān)了M2計算芯片的任務(wù),尤其是來自攝像頭以及各種傳感器的數(shù)據(jù)。R1能在12毫秒內(nèi)將攝像頭的圖像顯示到頭顯內(nèi)置的兩塊4K LED顯示屏上,極大地消除了用戶產(chǎn)生暈眩的可能。此外,R1芯片還接入了17個傳感器,包括陀螺儀、加速度計、6個麥克風(fēng)等,還能協(xié)助處理藍(lán)牙、超寬帶(UWB)以及慣性測量單元的數(shù)據(jù)。
在如此強(qiáng)大功能的加持之下,M2和R1芯片也成為Vision Pro中當(dāng)之無愧的“電老虎”。這導(dǎo)致Vision Pro續(xù)航時間只有2小時,遠(yuǎn)小于蘋果的Macbook Air等電腦,以至于這臺固定在頭部的設(shè)備不得不通過一根電纜連接到一塊手機(jī)大小的鋰電池,后者需要放在用戶的口袋里。
這塊沉甸甸的電池將我們的暢想打回現(xiàn)實(shí),讓我們意識到仍然生活在21世紀(jì)的20年代的地球,而不是未來的科幻片中。
花費(fèi)長達(dá)7年的時間研發(fā),蘋果對這款明年才能上市、價格高達(dá)3499美元(約合人民幣2.5萬元)的Vision Pro下了血本,也下了很大的賭注。
然而,理想豐滿,現(xiàn)實(shí)骨感?!昂碾姼摺?、“發(fā)熱大”,發(fā)布會一結(jié)束,伴隨著粉絲的歡呼聲的,是這些聽起來頗為刺耳的評論。為何會有如此大的反差?一方面是蘋果公司展示給我們?nèi)绱丝犰诺目萍?,以及對未來極大期許;而另一方面則是用戶能感受到的非?,F(xiàn)實(shí)的問題:耗電高、發(fā)熱大。
02 蘋果與功耗的“戰(zhàn)爭”
其實(shí),蘋果公司跟耗電的戰(zhàn)爭由來已久。
早在喬布斯時代,蘋果就對iPhone和iPad內(nèi)的Flash動畫應(yīng)用“說不”,這可是冒著得罪有上億用戶的Adobe公司和全世界上百萬Flash開發(fā)者的風(fēng)險,更不用說Flash動畫背后實(shí)力雄厚的廣告商了。背后的原因就在于Flash應(yīng)用極為耗電,極大縮短了移動設(shè)備的使用時間。
*喬布斯當(dāng)年發(fā)布在蘋果官網(wǎng)的公開信《Thoughts on Flash》,其中第四點(diǎn)強(qiáng)調(diào)(Flash)軟件解碼太耗電,移動設(shè)備必須硬件解碼
此外,早期的蘋果手機(jī)和平板上的Home鍵被賦予了一種功能,只有關(guān)閉一個應(yīng)用并返回桌面,才能打開另外一個應(yīng)用,這也是為了降低功耗。
蘋果公司跟耗電的斗爭已經(jīng)如基因般刻在了骨子里,在Vision Pro上,蘋果公司對功耗的優(yōu)化幾乎做到了極致,它整合了業(yè)界最先進(jìn)的技術(shù)與之一搏,包括最先進(jìn)的晶體管結(jié)構(gòu)、最小的晶體管尺寸、最低功耗的處理器架構(gòu)、最先進(jìn)的芯片封裝技術(shù)以及最優(yōu)的內(nèi)存數(shù)據(jù)調(diào)度技術(shù),所有這些,都是為了正面阻擊芯片的耗電,期望能讓消費(fèi)者獲得盡可能長的待機(jī)時間和最佳的發(fā)熱體驗(yàn)。
首先是5納米的晶體管結(jié)構(gòu),它來自加州大學(xué)伯克利分校的胡正明教授提出的一種鰭式晶體管(FinFET)。這種晶體管從22納米開始成為主流,并會一直延續(xù)到3納米。早在上世紀(jì)90年代,傳統(tǒng)的平面晶體管即便在關(guān)斷時,仍有很大的漏電流,導(dǎo)致芯片發(fā)熱急劇增加。業(yè)界預(yù)測,當(dāng)晶體管尺寸縮小到100納米時,晶體管將變得像火山口一樣滾燙!摩爾定律將不得不止步于此。即便邁過了這個坎,晶體管繼續(xù)縮小后,芯片將變得像火箭噴射口那么燙。到那時,即便是最先進(jìn)的水冷技術(shù)也無法讓熱量散發(fā)出去。在飛往日本的飛機(jī)上,胡正明匆匆畫下了一幅草圖,成了后來的三維立體FinFET。
FinFET晶體管
從2011年起業(yè)界開始轉(zhuǎn)到FinFET。這種晶體管一改之前平面晶體管只能從一個平面上關(guān)斷晶體管,而是從三個平面上關(guān)斷晶體管,大大減少了漏電并降低了芯片的耗電。
另外一個嚴(yán)重影響芯片耗電的重要因素是晶體管的工作頻率。自從1971年英特爾的法金和霍夫發(fā)明的第一顆CPU芯片后,芯片工藝節(jié)點(diǎn)從當(dāng)時的10微米(即10000納米)縮小到現(xiàn)在的5納米。隨著晶體管尺寸縮小,相鄰晶體管之間的距離也縮短,信號延遲變得更小,從而提升了CPU的執(zhí)行速度。
根據(jù)IBM的登納德的推算,摩爾定律每前進(jìn)一代,晶體管尺寸縮小30%,速度和工作頻率提升40%。1971年的CPU 4004的工作頻率只有740 kHz,而到了2005年已經(jīng)升高到了3GHz,提高了4000多倍。但從此以后,這個頻率一直徘徊在3~4GHz。因?yàn)樾酒墓ぷ黝l率越高,消耗的功耗就越大,消耗的電力轉(zhuǎn)換為熱量,即便有了風(fēng)扇也難以散去。
2005年以后,芯片的頻率不再提高,蘋果Vision Pro中使用的M2芯片的頻率也只有3.49 GHz,這是為了降低耗電不得不做出的讓步。
當(dāng)處理器芯片的頻率不能繼續(xù)提高后,提高處理器性能的主要途徑就剩下增加晶體管數(shù)量。但是處理器芯片的功耗會隨著晶體管數(shù)量的增加而成比例增加。更糟糕的是,芯片性能只能隨著晶體管數(shù)量的平方根而增加。例如,晶體管數(shù)量增大為4倍,功耗也會增大為4倍,但性能只能增大為2倍。這樣單純增加一個內(nèi)核中晶體管數(shù)量就變得很不劃算。
由此,提高處理器性能的方式就剩下了增加內(nèi)核數(shù)量,即采用小內(nèi)核保持功耗不變,同時增加內(nèi)核個數(shù)以增加晶體管數(shù)量。從本世紀(jì)初的單個內(nèi)核,逐漸增加到雙內(nèi)核、四內(nèi)核。蘋果的M2芯片也沿用了這種思路,它包含了8個CPU內(nèi)核和10個GPU內(nèi)核等。但是內(nèi)核數(shù)量越多,所需的并行處理就越復(fù)雜,所以內(nèi)核數(shù)也不可能無限增加。
蘋果M2芯片中使用了多核CPU和GPU
此外,蘋果的M2芯片還采用了低功耗的ARM架構(gòu)來降低耗電。說起ARM內(nèi)核,它跟蘋果公司還有一段不淺的淵源,可以追溯到1990年。
那時蘋果準(zhǔn)備開發(fā)一款前所未有的設(shè)備:個人數(shù)字助理(PDA),它選中了英國劍橋一家在谷倉里的小公司安謀(ARM),并聯(lián)合了另外一家公司成立了合資公司,共同開發(fā)ARM處理器。后來PDA產(chǎn)品失敗了,喬布斯也從蘋果出走。但是得益于ARM處理器極低的功耗,ARM處理器在上世紀(jì)90年代在手機(jī)中流行開來。
喬布斯重新回歸蘋果后,在iPhone中大量使用低功耗的ARM處理器,甚至從2010年起,蘋果公司不惜得罪英特爾公司,將每年數(shù)千萬臺新生產(chǎn)的Mac電腦中的處理器也換成了ARM處理器,讓英特爾的股價暴跌。英特爾公司的CPU采用的是復(fù)雜指令集CISC,每條指令很長,導(dǎo)致功耗大。而ARM處理器采用一種精簡的指令集RISC,每條指令更短,指令長度相等,可以反復(fù)使用,從而大大降低了功耗。
即便采用了這些降功耗的措施,蘋果公司還覺得不夠。
在M2芯片中,CPU、GPU、內(nèi)存等都通過SiP技術(shù)封裝在一個基座上,減少芯片之間的互連線長度,從而降低驅(qū)動所需的電流。進(jìn)一步,蘋果的M2芯片中的CPU和GPU采用統(tǒng)一的內(nèi)存架構(gòu),這樣就可以共享內(nèi)存中的數(shù)據(jù),而不需要將數(shù)據(jù)在CPU和GPU之間搬來搬去,進(jìn)一步降低了功耗。
當(dāng)然,R1協(xié)處理器也為降低功耗發(fā)揮了重要作用。當(dāng)Vision Pro處于待機(jī)狀態(tài)或者較閑時,主要是R1協(xié)處理器在處理傳感器等的數(shù)據(jù),這樣就不需要啟動高耗電的M2處理器,而讓它處于休眠狀態(tài)。R1處理器就像一個大內(nèi)總管,把核心計算以外的任務(wù)都包攬了下來,大大降低了M2處理器的耗電。
03 追隨摩爾定律
從蘋果開始研發(fā)Vision Pro到現(xiàn)在已經(jīng)過去了7年。在這么長的時間里,摩爾定律已經(jīng)前進(jìn)了3代,蘋果也有足夠的時間去反復(fù)修改Vision Pro的架構(gòu)、指標(biāo)以及綜合比較各種能降低功耗的技術(shù)。可以說,在這個時間節(jié)點(diǎn)上發(fā)布,蘋果已經(jīng)竭盡全力,它整合了世界上最好的芯片技術(shù):5納米的工藝、M2強(qiáng)大的芯片整合能力、R1優(yōu)秀的低功耗技術(shù)等,可謂使出了全部看家本領(lǐng)。
盡管這款Vision Pro頭顯功能強(qiáng)大,但高達(dá)3499美元的價格,注定了它的玩家只能是小眾群體,更不必提極高的耗電水平又會讓不少人打消購買的念頭。那么為什么蘋果仍執(zhí)意要發(fā)布這款產(chǎn)品呢?
因?yàn)樘O果賭定了一點(diǎn),那就是摩爾定律在未來若干年會繼續(xù)前進(jìn)。盡管現(xiàn)在這款頭顯耗電嚴(yán)重、發(fā)熱大、價格昂貴,但只要摩爾定律仍在前進(jìn),每過一代芯片性能就會翻倍、或者價格減半。而且接下來的3納米或2納米晶體管會采用漏電更少的圍柵結(jié)構(gòu)(GAA or nano-sheet),進(jìn)一步降低耗電。此外,芯粒(Chiplet)技術(shù)也在方興未艾地發(fā)展,會進(jìn)一步提高芯片集成度和性能。在神經(jīng)網(wǎng)絡(luò)計算中,近年來新興的張量處理器(TPU)的運(yùn)行效率會更高。
GAA(Nanosheet) 晶體管
所有這些,都是蘋果敢于賭定未來的依據(jù)。即便在更遠(yuǎn)的將來晶體管尺寸不再繼續(xù)縮小了,芯片還能以三維集成的方式將CPU和存儲器集成在同一個裸片上,繼續(xù)增加晶體管的數(shù)量。而更緊密地集成在一起的CPU和存儲器,它們之間的互連距離也會進(jìn)一步減小,從而降低功耗。所以說蘋果發(fā)布Vision Pro,其實(shí)是在賭摩爾定律會繼續(xù)贏,它寄希望于那些充滿意志堅定且創(chuàng)意的工程師會繼續(xù)發(fā)明出性能更強(qiáng)的芯片,而且價格和功耗會更低。
當(dāng)然,誰也沒有把握說蘋果一定能贏,這注定是一場豪賭。如果蘋果賭贏了,若干年后,當(dāng)蘋果再次發(fā)布新產(chǎn)品時,我們或許早已習(xí)慣了在180度環(huán)繞的立體曲面空間上體驗(yàn)?zāi)欠N逼真而觸手可及的奇妙感覺。
關(guān)于作者
《芯片簡史》 作者:汪波 2023出版
*作者汪波是芯片研究專家,科普作家,在華為公司、法國里昂納米國家實(shí)驗(yàn)室和北京大學(xué)深圳研究生院有二十多年的研究和教學(xué)經(jīng)驗(yàn),著有《芯片簡史》、《時間之問》和《時間之問·少年版》。更多關(guān)于芯片的歷史可參閱《芯片簡史》。





