兩者的區別如下:
架構就是芯片廠商制定的一個規范,目的就是為了區分不同類型芯片的標示。例如:intel系列、AMD系列、ARM系列等等。
指令集就是指示和命令的集合,一系列的指令就形成一個程序。只有指令集和芯片完美配合,才能發揮出強大的性能。從現階段的主流體系結構講,指令集可分為復雜指令集和精簡指令集兩部分。
我們可以用蒸米飯來形象的解釋。
我們要蒸米飯肯定是要按照順序來的,整體來說包括以下幾個:買米、淘米、放水、開火、蒸好后再關火、盛飯、擺桌。
以上這些步驟又可以細分,例如買米,要去超市挑選,然后付款、拿小票、拿米回家。淘米的話,要淘幾次?每次淘米放多少水?等等,又會構成一道道的程序。
無論最終有多少個步驟、米淘的干凈與否、大米選購的好與壞,最終是可以蒸出一鍋米飯的。
這些步驟和每一個細分的步驟,合起來就是指令集。每一個小步驟匯集起來,一步步的完成就會得到想要的結果。
當然,這只是蒸米飯的大體步驟,根據實際情況不同,個人喜好不同,可以微調順序,例如:可以網購大米,電飯煲可以不關火就盛米飯(保溫狀態)。可以說,順序不同,“蒸米飯指令集”就不同。
這也就是為什么今天要講架構的原因了,架構就是為了實現指令集所需要的硬件基礎。說白了,指令集就是順序、規劃,架構就是實現這些順序、規劃的電路。
試想一下我們的房子,房屋的梁、柱、墻等承重結構重要嗎?房屋的設計安全嗎?環保嗎?節能嗎?實用性如何?耐久性如何?經濟性如何?所有的這些都是建立在“房屋基礎架構”之上的。
那么一款芯片性能如何?能耗如何?功能是否強大,等等同樣也是建立在架構之上的。
一款芯片由幾個核心,多少個SIMD處理器,幾個ALU,幾個FPU,它們是怎樣連接的,功能如何實現的,都是依靠架構實現的。
經典的ARM架構
2020年9月14號,美國芯片巨頭英偉達宣布以400億美金的價格收購全球最大的半導體IP提供商ARM公司,這一消息震驚了全球,因為ARM一旦被收購,全球半導體行業將徹底被美國掌控。
ARM并不生產和銷售實際的半導體芯片,而是向合作伙伴授予 IP 許可證,但沒有任何人小看ARM的這一授權,因為,目前全球 95% 以上的手機以及超過四分之一的電子設備都在使用 ARM 技術。
英偉達的收購方案出來后,需要全球多個國家(美國、英國、歐盟、中國)批準,以確保收購不會造成壟斷。全球第一GPU大廠收購全球第一IP授權公司,可想而知它動了多少人的奶酪,最終在多方的壓力下,英偉達放棄收購ARM。
ARM架構究竟有什么神奇之處,可以讓全球95%的手機使用,收購ARM更需要中、美、英、歐等多國審批?
我們知道芯片有兩種架構,即:CISC(復雜指令集)和RISC(精簡指令集)。
這兩種架構都試圖在功耗、運行、編譯、算法等方面做出平衡,以達到高效節能的目的,但是由于設計理念和方法的不同,最終形成了很大的差異。
英特爾x86架構采用CISC(復雜指令集),ARM采用RISC(精簡指令集)。
在PC盛行的時代,英特爾憑借CISC架構擊敗了ARM公司,成為當之無愧的PC芯片霸主。但是ARM公司并沒有因此而頹廢,反而在移動設備中大放異彩,手機、相機、音響、電動機、硬盤、電信基站等都能發現ARM的身影。
英特爾的CISC架構以性能為目的,逐步增加了指令集的復雜度,代價就是功耗越來越大,設計難度也越拉越大,無法適應移動設備。
ARM的RISC架構則不同,采用了簡單的架構,讓整個芯片擁有了更小的體積、更少的指令,因此其功耗也就更低,但同時還保留了必要的高性能。此外,ARM的架構更容易高密度整合,例如我們現在使用的手機芯片就是將CPU、GPU、NPU、基帶整合在了一起。
ARM的除了擁有近乎完美的架構設計外,其并不參與芯片的整體設計、制造、封裝等環節,也因此它很少有競爭對手。于是三星、高通、聯發科、華為、德州儀器等芯片大廠紛紛與其合作,最終將ARM推上了神壇。
ARM架構整體的優點主要在以下幾點:
低功耗,電池耗電量少,這一點是毫無疑問的;
穩定性高,功耗越高的電子元器件要求也就越高,同等品質的元件低功耗的使用時間越長,系統也更穩定;
發熱更低,低功耗產生的熱量自然更加少,在相同的散熱條件下,自然是發熱更低了;
軟件開發成本低,ARM的精簡指令集可以有效降低軟件開發成本,用C或JAVA編寫的軟件只需在ARM平臺的操作系統中編譯一下就可以移植過去;
硬件開發成本低,ARM實際上在CPU芯片中已經整合了幾乎所有功能,幾乎所有線路按原理圖直接拉出就可以了,需要擴展的部分一般不多,所以其開發成本會比較低;
RM實際上在CPU芯片中已經整合了幾乎所有功能,幾乎所有線路按原理圖直接拉出就可以了,需要擴展的部分一般不多,所以其開發成本會比較低
整體來看,ARM的產品在功耗和硬件上具有很大的優勢,性能也足夠使用,并且非常適合應用在移動設備上,這也是ARM能夠風靡全球的重要原因。
華為的達芬奇架構
最開始華為的手機芯片采用的是中科寒武紀的NPU,但華為似乎對寒武紀的NPU并不是太感冒,從華為發布會就可以感受到,華為多次提到HiAI的功效,卻刻意弱化“寒武紀”,甚至在發布會上直接說是華為NPU,就連PPT也是kirin NPU。我想寒武紀也不會滿意華為的做法吧!
之后,寒武紀在NPU的設計理念、架構等方面與華為不合,而華為又是一家以狼性著稱的企業,憂患意識非常的強,不可能把自己的命脈交給別人,于是很快就開始自研NPU了,(或許更早)。
2019年6月,華為發布麒麟810,這款處理器不再使用寒武紀的NPU,首次采用了華為自研的達芬奇架構NPU,實現了世界級領先的AI算力,同時也將搭載麒麟810的華為手機帶進了TOP3。那么,華為自研的達芬奇架構究竟如何呢?
隨著AI時代的來臨,各大巨頭紛紛布局,華為也不例外。根據華為的預測,2025年,全球將有400億臺智能終端,智能助理的普及率將達到90%,企業數據的使用率將達到86%。為了享受這一盛宴,華為集中精力開發了達芬奇架構。
達芬奇架構主要是把計算乘加器(MAC)按照不同類型的計算,組織成不同的計算方式,并搭配對應的數據緩存。
嚴格意義的來講,華為達芬奇更像是GPU架構,而非CPU架構,因為它采用了部分ARM架構,同時以外圍張量運算加速,這種方式都是優化AI智能計算。
但GPU并非專門為AI計算設計的,因此在神經網絡推理上達芬奇架構更具優勢。
達芬奇架構的優勢:
專門針對AI計算開發的,具有高算力、高能效、靈活可裁剪的特性;
采用3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力;
單個AI Core可以在一個時鐘周期內實現4096個MAC操作,比傳統的CPU和GPU實現數量級的提升;
華為達芬奇架構可以說是華為的一個小型的“黑科技”,還是不能夠和ARM架構相提并論的。
首先明確一點,華為的達芬奇架構與ARM架構有著本質的區別。
華為麒麟芯片的核心采用了ARM 76架構,一切CPU、GPU、NPU都要在這個架構的基礎上進行“魔改”,包括達芬奇架構。
達芬奇架構只是NPU架構,而ARM架構包含了CPU、GPU、NPU等等。一款芯片最重要的是CPU、其次是GPU、最后是NPU。你研發出了NPU架構,但是距離GPU、CPU還有很遠。
號稱“魔改”第一人的就是美國高通,高通處理器的架構是自主研發的Kryo架構,但是這也是根據ARM76魔改的,那華為的達芬奇呢?也一樣是建立在ARM架構基礎上的。如果沒有ARM,也就沒有高通驍龍,同樣沒有華為達芬奇。
第一步:在ARM v8架構基礎上進行研發,對該架構獨立完成升級工作。
ARM遍布手機、移動設備,很多AI芯片架構也是ARM結合的,在這種情況下,直接單獨開發一個架構,即便性能不錯,也不會有哪個大廠會使用的,因為生態問題。
其次,公版制造進度更快,更能搭載在新款手機上,更快地搶占手機市場。
最后,使用公版可以減少核心搭配、總線設計等電路布局,也不用擔心“誤操作”影響整個處理器,甚至影響整批手機。
正因如此,華為如果不想一直受制于人,就要開發屬于自己的架構,并且把它做大做強。
第二步:完全丟棄ARM架構,研發出自己的芯片架構。
華為為什么一定要自研芯片架構呢?因為隨著美國對華為持續的打壓,ARM已經宣布同華為中斷合作,預計下一代ARM架構v9將和華為無緣。
盡管現在華為已經購買了ARM v8永久地使用權,影響較小。但當大家都使用了v9架構時,你再拿著v8繼續玩,恐怕消費者都不愿買賬了。
此外,看看研發能力強大的蘋果,自主研發的A系列芯片,真的是所向無敵,4+64G可以吊打安卓8+128G,那么同樣實力非凡的華為呢?會不會也能做到呢?
華為研發達芬奇架構,盡管現在來看沒有太多的黑科技,但是在未來一定會越來越好,越來越強大,甚至有可能和ARM架構平起平坐。
華為的架構需要分兩步走才能實現與ARM平起平坐。