關于六大國產(chǎn)CPU介紹(龍芯中科、天津飛騰、華為鯤鵬、上海兆芯、申威科技及海光信息)
CPU 是計算機系統(tǒng)的核心和大腦,即中央處理器是計算機的運算和控制核心,其功能主要是解釋計算機指令以及處理計算機軟件中的數(shù)據(jù)。CPU 主要由控制器、運算器、存儲器和連接總線構(gòu)成。其中,控制器和運算器組成 CPU 的內(nèi)核,內(nèi)核從存儲器中提取數(shù)據(jù),根據(jù)控制器中的指令集將數(shù)據(jù)解碼,通過運算器中的微架構(gòu)(電路)進行運算得到結(jié)果,以某種格式將執(zhí)行結(jié)果寫入存儲器。因此,內(nèi)核的基礎就是指令集(指令集架構(gòu))和微架構(gòu)。指令集是所有指令的集合,它規(guī)定了 CPU 可執(zhí)行的所有操作,微架構(gòu)是完成這些指令操作的電路設計。相同的指令集可以有不同的微架構(gòu),如 Intel 和 AMD 都是基于 X86指令集但微架構(gòu)不同。
指令集架構(gòu)n(Instruction Set Architecture),又稱指令集或指令集體系,是計算機體系結(jié)構(gòu)中與程序設計有關的部分,包含了基本數(shù)據(jù)類型,指令集,寄存器,尋址模式,存儲體系,中斷,異常處理以及外部 I/O。指令集架構(gòu)包含一系列的 opcode 即操作碼(機器語言),以及由特定處理器執(zhí)行的基本命令。簡單地來說,指令集一般被整合在操作系統(tǒng)內(nèi)核最底層的硬件抽象層中,屬于計算機中硬件與軟件的接口,它向操作系統(tǒng)定義了 CPU 的基本功能。
CPU 按指令集的架構(gòu)區(qū)分n,分為 CISC( Complex Instruction Set Computing,復 雜 指 令集 )型 和 RISC( Reduced Instruction Set Computing,精簡指令集)型兩類。CISC 的設計者希望通過直接在硬件中構(gòu)建復雜的指令從而使編程更方便、程序運行速度更快,其架構(gòu)中每個指令可執(zhí)行若干低端操作,諸如從存儲器讀取、存儲、和計算操作,全部集于單一指令之中;與之相反,RISC 架構(gòu)中只包含使用頻率高的少量簡單指令,并提供一些必要的指令以支持操作系統(tǒng)和高級語言。
1、天津飛騰:創(chuàng)新可信主力芯片廠商,產(chǎn)業(yè)生態(tài)日益豐富,市場空間廣闊,飛騰專注于 ARM 芯片研發(fā),是中國最早獲得 ARMv8 指令集架構(gòu)授權的芯片設計廠商,主要致力于國產(chǎn)高性能、低功耗集成電路芯片的設計與服務,產(chǎn)品廣泛應用于計算機終端與服務器。目前國內(nèi)完全自主設計的芯片廠商僅飛騰、龍芯、海光、兆芯和申威等寥寥數(shù)家,飛騰在 CPU、JS 引擎性能、HTML5 兼容性等方面全面領先其他廠商。
飛騰產(chǎn)品覆蓋高性能服務器 CPUn、高能效桌面 CPU 和高端嵌入式 CPU 等。飛騰通過 20 年技術積累,已經(jīng)形成完整的多樣化算力產(chǎn)品譜系,是國內(nèi)通用 CPU里面譜系最全的 CPU 廠家,包括高性能服務器 CPU、高效能桌面CPU、高端嵌入式 CPU,能為從端到云的各類設備提供核心算力支撐。目前,主推產(chǎn)品是面向服務器的 FT-2000+64、面向桌面終端的 FT-2000 四核和面向嵌入式的 FT-2000A 兩核。
2、華為鯤鵬 :基于 ARM 架構(gòu)授權,卓越性能提供市場最強算力支撐
作為鯤鵬計算產(chǎn)業(yè)底座的 Kunpeng 處理器n,華為持續(xù)重點投入以滿足市場對于新算力的需求。目前鯤鵬系列已經(jīng)實現(xiàn)量產(chǎn)的有 Kunpeng 912、Kunpeng 916、Kunpeng 920、Kunpeng 920s,而 Kunpeng 920Lite、Kunpeng 930 及 Kunpeng 930s 目前仍在研發(fā)中,Kunpeng 930Lite 尚在規(guī)劃中。
最新鯤鵬 920 芯片已實現(xiàn)通用計算最強算力n,性能優(yōu)于其他廠商的同類型芯片。2019 年,華為發(fā)布最新鯤鵬 920 處理器。這款鯤鵬 920 基于ARMv8 指令集,是行業(yè)內(nèi)首款 7nm 數(shù)據(jù)中心 ARM 處理器,由華為自主研發(fā)設計,采用多發(fā)射、亂序執(zhí)行、優(yōu)化分支預測等多種手段提升單核的性能。鯤鵬 920 擁有 64 個內(nèi)核,集成 8 通道 DDR4,可以提供多個接口,主頻可達 2.6GHz,總帶寬 640Gbps,保證了 920 超強算力的高效輸出。此外,在 Memory 子系統(tǒng)上也進行了大量的優(yōu)化,采用當前典型的 3 級Cache 的架構(gòu),對 Cache 大小以及延時進行了優(yōu)化設計。鯤鵬 920 面向數(shù)據(jù)中心,主打低功耗強性能,性能達到業(yè)界領先水平,尤其是整型計算能力,業(yè)界標準 SPECint Benchmark 評分超過 930,超出業(yè)界標桿 25%,同時能效優(yōu)于業(yè)界標桿 30%。并已經(jīng)針對大數(shù)據(jù)、分布式存儲、數(shù)據(jù)庫及云服務等場景進行了歐化,通過軟硬協(xié)同進一步提升處理器的性能。
n鯤鵬 920 已實現(xiàn)性能超越 Intel 系列 X86 芯片。鯤鵬芯片算力維度方面在非 X86 架構(gòu)芯片中明顯領先,且發(fā)展至目前已經(jīng)達到可以與 X86 芯片相匹配的性能。鯤鵬 920 芯片基于 ARM v8 架構(gòu),各方面性能優(yōu)異。目前從整體性能上看,鯤鵬 920 與芯片龍頭 Intel 公司所生產(chǎn)的芯片相比較而言,48核鯤鵬 920 與 Intel 至強 8180 性能相當,但鯤鵬 920 能耗比對方低 20%,而 64 核的鯤鵬 920 測試性能要遠優(yōu)于 Intel 至強 8180。這證明 ARM 架構(gòu)已經(jīng)具備趕超 X86 架構(gòu)性能的能力。
3、龍芯:國內(nèi)最早自主研發(fā)芯片廠商,MIPS 架構(gòu)體系自主化程度高
n“龍芯”是我國最早研制的高性能通用處理器系列,于 2001 年在中科院計算所開始研發(fā),得到了中科院、863、973、核高基等項目大力支持,完成了十年的核心技術積累。n龍芯 CPU 采用 MIPS 體系結(jié)構(gòu),產(chǎn)品現(xiàn)包括龍芯1 號小CPU、龍芯2 號中 CPU 和龍芯 3 號大 CPU 三個系列,此外還包括龍芯7A1000橋片。產(chǎn)品方面,龍芯目前共推出 3 代 CPU產(chǎn)品,2017 年 4 月發(fā)布面向桌面/服務器應用的龍芯 3 號處理器的最新升級產(chǎn)品龍芯 3A3000/3B3000,其中,龍芯 3A3000 基于中芯 28nm FDSOI工藝,自主 GS464E 架構(gòu)(自主指令系統(tǒng) LoongISA),設計為四核 64 位,主頻 1.5GHz,功耗僅 30W,是目前國產(chǎn) CPU 中單核 SPEC 實測性能最高的芯片之一。2019 年 12 月,龍芯推出首款基于 GS464v 微架構(gòu)的四核處理器 3A4000 相比上一代產(chǎn)品實測性能提高一倍。預計 2020 年年底將推出 3A5000/3C5000,其工藝改進提高主頻至 2.5GHz,核數(shù)提升至 16 核。
?相比于龍芯 3A3000 處理器,龍芯 3A4000 性能翻倍。龍芯 3A4000相比 3A3000 的 GS464e 微架構(gòu),進一步優(yōu)化流水線,提升運行頻率,加強對虛擬化、向量支持、加解密、安全機制等方面的支持。其芯片整體實測性能提升一倍左右。在某些測試項目中,龍芯 3A4000 的速度超過了 3A3000 的三倍,比如 hmmer 測試,3A4000 的速度是3A3000 的 3.6 倍,這是因為龍芯 3A4000 的向量指令在發(fā)揮作用。但與 Intel i5-7200U處理器相比,龍芯 3A4000 處理器性能還存在一定差距。從測試結(jié)果可以看到,3A4000 處理器單核整數(shù)性能只有 i5-7200U 的 60%, 浮點性能只有后者的 50%。但考慮到 Intel i5-7200U睿頻頻率高達 3.1GHz,處理器的每 GHz 性能為整數(shù) 10.64 分,浮點12.6 分;3A4000 處理器核的同主頻性能已經(jīng)能夠達到 i5-7200U 處理器的 80%~90%了。
4、海光:性能優(yōu)越的 x86 架構(gòu)芯片,商用市場極具潛力
海光的最大優(yōu)勢是其產(chǎn)品性能和 x86 豐富的應用生態(tài)。由于有 AMD 技術做后盾,AMD 授權給海光的是性能強勁的 Zen 的結(jié)構(gòu)和代碼,海光芯片性能優(yōu)越,在國家級超算項目應用廣泛。2018 年 7 月,AMD 與天津海光合作后首款 X86 處理器 Dhyana(禪定)啟動生產(chǎn),Dhyana(禪定)基于超微(AMD)Zen 核心架構(gòu)開發(fā),性能方面與 AMD EPYC 處理器相似,Linux維護者將 EPYC 支持代碼轉(zhuǎn)移到 Dhyana(禪定)處理器后可以成功運行,說明當時兩款處理器差異相對較小。n 海光產(chǎn)品當下確定性高。受益于性能和生態(tài)兩方面優(yōu)勢,且未受制裁影響,海光產(chǎn)品當下確定性高,可獲得大量行業(yè)端國產(chǎn)訂單。但 X86 架構(gòu)的核心指令集仍然掌握在 Intel 和 AMD 手中,且海光未獲得桌面產(chǎn)品授權,下一步海光將在現(xiàn)有架構(gòu)基礎上,持續(xù)迭代創(chuàng)新,維持國產(chǎn)先進性優(yōu)勢。
5、申威 :自主化程度最高的Alpha 架構(gòu)芯片,主供軍方與超算市場
申威 SW26010 是中國首個采用國產(chǎn)自研架構(gòu)且性能強大的計算機芯片。出于安全自主可控角度不再使用 ALPHA 指令集后,申威推出了自研的申威 64 位指令集,并在此基礎上,成功研發(fā)出中國首個采用自主架構(gòu),同時性能達到世界一流水平的計算機芯片申威 SW26010。SW26010 采用 260核心眾核架構(gòu),亂序執(zhí)行架構(gòu),頻率 1.45GHz,整個處理器包括 4 個 MPE管理單元、4 個 CPE 計算單元及 4 個 MC 內(nèi)存控制器單元組成,總計 260個核心。
6、兆芯 :國內(nèi) x86 主要入圍芯片,業(yè)務主要覆蓋上海地區(qū)
兆芯的技術源自 VIAn,通過技術引進、仿制,再修改原始設計,最后自主創(chuàng)新,致力于通過技術創(chuàng)新與兼容主流的發(fā)展路線,為行業(yè)用戶提供通用處理器和配套芯片等產(chǎn)品。公司成立以來,兆芯已成功研發(fā)并量產(chǎn)多款通用處理器產(chǎn)品,并形成“開先”、“開勝”兩大產(chǎn)品系列。2019 年 6 月,兆芯發(fā)布開先 KX-6000/開勝 KH-30000 系列處理器,是首款主頻達到3.0GHz 的國產(chǎn)通用處理器,也是業(yè)內(nèi)第一款完整集成 CPU、GPU、芯片組的 SoC 單芯片國產(chǎn)通用處理器,其單芯片性能相比上一代產(chǎn)品提升了多達 50%,同頻下的性能功耗比則是上代產(chǎn)品的 3 倍,產(chǎn)品性能與國際主流的 Intel i5 水平相當。
目前,國內(nèi) CPU 企業(yè)大多選擇購買國外的架構(gòu)授權,大體可以分為三類:第一類,龍芯(MIPS 指令集)和申威(Alpha 指令集),創(chuàng)新可信能力最強,但使用群體小,應用生態(tài)缺乏;第二類,飛騰、鯤鵬均基于 ARM 架構(gòu),由于是架構(gòu)層級授權,有機會形成自主指令集,而且應用生態(tài)不斷成熟;第三類,以兆芯、海光為代表的 x86 架構(gòu),由于指令集仍掌握在海外廠商手中,完全創(chuàng)新可信難度大。因此,在創(chuàng)新可信程度上申威、龍芯>海思、飛騰>海光、兆芯,但是未來鯤鵬和飛騰有機會基于 ARM V8 永久指令集授權實現(xiàn)進一步創(chuàng)新可信。