“中国芯”全梳理:不只是华为鲲鹏
前言
CPU作为ICT设备的运算和控制核心,负责指令读取、译码与执行,因研发门槛高、生态构建难,被认为是集成电路产业中的“珠穆朗玛峰”。纵观全球,Intel、AMD两大巨头领跑通用CPU(桌面与服务器CPU)市场;国内,国产CPU正处于奋力追赶的关键时期,以鲲鹏、海光、龙芯、飞腾、兆芯、申威等为代表的厂商正全力打造“中国芯”。
一、国产CPU发展历程回溯
回溯中国的国产CPU发展历程,可分为三个阶段:
起步:上世纪50-70年代。1956年,半导体科技被列为国家新技术四大紧急措施之一。此后,中科院计算所、109厂、半导体所先后成立,锗晶体管、硅平面晶体管、集成电路等半导体器件相继实现突破,为109乙机、109丙机、156机的诞生分别提供了基础。1975年,伴随大规模集成电路技术的兴起,我国第一台集成电路百万次计算机013机研制成功。这一时期独立自主的产业发展为我国CPU事业打下了坚实基础。
转折:上世纪80-90年代。1985年,中科院计算所、半导体所有关研制大规模集成电路的单位和109厂合并,成立中科院微电子中心。但这一时期,由于政策支持力度有所减弱等原因,产业完全市场化但自主性不足。
提速:21世纪初至今。从“十五”开始,国产CPU自主性的问题再度提上议程,产业政策不断加码。泰山计划、863计划等催生了一批国产CPU品牌,2002年,我国首款通用CPU——龙芯1号(代号X1A50)流片成功。2006年,“核高基”重大专项推出,“高”即为高端通用CPU。2014年,我国发布《国家集成电路产业发展推动纲要》,国家集成电路产业投资基金(简称国家大基金)第1期成立,主要投资集成电路制造企业。2019年,国家大基金第2期成立,主要投资应用端。
在经历数十年的艰辛探索后,目前,国产CPU产业已初具规模,涌现出一批领军企业。我们根据CPU指令集体系进行分类:1)复杂指令集(CISC)下,以X86架构为主,国内代表厂商包括海光、兆芯;2)精简指令集(RISC)下,涉及ARM架构、MIPS架构、Alpha架构等,国内代表厂商包括鲲鹏(ARM)、飞腾(ARM)、龙芯(MIPS)、申威(Alpha)等。
二、鲲鹏:快速崛起的领导者
鲲鹏是华为计算产业的主力芯片之一。为满足新算力需求,华为围绕“鲲鹏+昇腾”构筑双算力引擎,打造算、存、传、管、智五个子系统的芯片族,实现了计算芯片的全面自研。鲲鹏系列包括服务器和PC处理器。近年来,华为先后推出Hi1610、Hi1612、Hi1616等服务器CPU产品,不断实现主频与核数的提升,并最终开发出当下的旗舰产品鲲鹏920与鲲鹏920s,分别用于服务器和PC机。
鲲鹏具备“端边云算力同构”的优势。鲲鹏CPU基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。
2019年1月,华为宣布推出鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。鲲鹏920采用7nm制造工艺。规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。
鲲鹏生态蓬勃发展。华为坚持硬件开放、软件开源,使能合作伙伴,推动鲲鹏计算产业发展。目前,已有超过12家整机厂商基于鲲鹏主板推出自有品牌的服务器及PC产品,华为还与产业伙伴联合成立了至少15个鲲鹏生态创新中心。作为鲲鹏计算产业底座的鲲鹏处理器,华为将秉承量产一代、研发一代、规划一代的演进节奏,落实长期投入、全面布局,后向兼容和持续演进的战略,高效满足市场需求。
三、海光:性能领先的实干者
海光芯片性能领先,中科曙光为重要股东。海光信息技术有限公司是国内高性能计算机龙头中科曙光的参股子公司。2014年,在天津注册成立;后历经数次股权变更,2018年10月,中科曙光以5.5元/股受让海光信息1.948亿股股权,受让后合计持有海光信息36.44%股权,为海光信息第一大股东。
2016年,海光信息同AMD达成合作,共同合资成立两家子公司,引入X86架构授权。其中,成都海光微电子技术有限公司拥有授权IP所有权,并负责芯片生产,成都海光集成电路设计有限公司负责芯片设计及销售工作。基于AMD提供的Zen1架构,海光开发出8核心桌面版CPU Dhyana、32核心服务器版CPU Dhyana Plus。
海光信息扭亏为盈,协同效应明显。2018年下半年,海光CPU实现量产,并陆续投入商用,主要客户为国内服务器整机厂商。2019年,海光实现营收3.90亿元,净利润为0.60亿元,首次扭亏为盈,体现出与中科曙光等厂商的协同效应明显。一方面,中科曙光拥有优质客户资源、良好销售渠道;另一方面,海光CPU满足国产化需求,将受益于以“中国芯”为底座的IT产业崛起。
近期,中国电信发布服务器(2020年)集中采购项目货物招标集中资格预审公告,公告显示,H系列服务器共集采11185台,CPU类型为鲲鹏 920系列处理器或海光Dhyana系列处理器,标志着国产CPU已在技术复杂度较高的运营商市场实现了规模化的产业落地。
四、龙芯:完全自主的引领者
龙芯是我国最早研制的高性能通用CPU系列。2001年,龙芯起步于中科院计算所,曾得到863、973、核高基等项目的支持,先后成功流片我国首款通用CPU龙芯1号、首款64位通用CPU龙芯2B、首款主频超过1GHz的通用CPU龙芯2E、首款四核CPU龙芯3A等,完成底层核心技术的积累。2010年,中科院、北京市政府共同牵头出资,龙芯中科技术有限公司正式成立,开始产业化运作。
龙芯坚持走自主创新与生态建设之路。龙芯走市场带动技术的道路,通过体制内市场引导,带动技术进步,再参与体制外市场竞争。基于MIPS架构,龙芯形成了自主指令集LoongISA,处理器核心的微结构和物理设计全部自主研发,并取得了500多项专利。龙芯学习Intel+Google+Apple的商业和技术模式,打造从端到云开放的全产业链生态体系,实现OS的跨平台兼容。
目前,龙芯共有三个产品系列定位。3号大CPU面向桌面/服务器类应用,定位Intel酷睿/至强系列;2号中CPU面向工控和终端类应用,定位Intel阿童木系列;1号小CPU面向特定应用与需求,曾用于北斗卫星、石油勘探、智能设备(门锁、水表、电表)等方面,实现“上天入地,守卫国门,保护家门”。
龙芯通用CPU在迭代中发展:
第一代,基本可用。3A1000、3B1500单核性能较低,SPEC CPU2006测试分值仅2-3分,打开20M文档需要33秒,用户体验一般。
第二代,可用。3A/B3000四核处理器采用28nm工艺,主频1.35-1.5GHz,单核性能达到10-11分,超过凌动系列,打开20M文档仅需6秒。具有安全自主程度高、整机厂商品类多、国产化桥片方案等特点。目前,累计出货超过30万颗,是此前信创工程上份额最大的通用CPU。
第三代,好用。2019年12月发布的3A/B4000四核处理器实现相同工艺下性能提升一倍,主频1.8-2.0GHz,单核性能达到20-30分,达到AMD 28nm工艺最后产品“挖掘机”的水平,可秒开20M文档。
未来,提高主频和核数。3A5000四核桌面CPU将采用12nm工艺,单核性能争取达25-30分,与3A4000兼容,可原位替换,预计2020年二季度流片;3C5000十六核服务器CPU同样采用12nm工艺,支持4-16路服务器,预计2020年三季度流片。
五、飞腾:PK生态的主导者
飞腾CPU由国防科技大学研究团队创造,起步于1999年,曾先后尝试X86、Epic、SPARC、ARM四个指令集,并以SPARC开源代码为基础设计了FT-1000、FT-1000A、FT-1500等CPU。之后出于生态考虑,获得了ARM指令集授权,集成全自主处理器内核,形成了覆盖桌面、服务器和嵌入式等领域的完整产品线。
服务器CPU:FT-2000+/64于2017年发布,集成64个FTC662处理器内核,16nm工艺,主频2.0-2.3GHz,主要应用于高性能服务器领域,性能与Intel Xeon E5-2695V3系列相当。在ARM v8指令集兼容的产品中,FT-2000+/64在单核计算能力、单芯片并行性能、单芯片cache一致性规模等指标上处于先进水平。2019年5月,基于FT-2000+/64的服务器产品群在福州数字中国峰会上发布。
桌面CPU:2019年,飞腾发布FT-2000/4,整体性能与Intel Core I5系列相当。FT-2000/4集成4个FTC663处理器核,16nm制程,主频2.6-3.0GHz。在SPEC 2006测试中,全芯片实测整数计算得分61.1,浮点计算得分62.5,相比上一代的FT-1500A/4提升近1倍,访存带宽提升3倍。目前,FT-2000/4已和国产银河麒麟操作系统完成适配工作,包括联想、长城等整机厂商正在开展终端和板卡研制。
PK体系赋能信息技术应用创新。飞腾CPU积极参与CEC(中国电子集团)主导的PK(即飞腾Phytium CPU和麒麟Kylin操作系统)体系建设,打造安全可靠的中国计算机软硬件基础体系国家队。
六、兆芯:合资CPU的探路者
兆芯系列CPU由上海兆芯集成电路有限公司推出。公司成立于2013年,由上海市国资委下属企业和台湾威盛电子合资成立。公司基于X86架构,成功研发并量产多代通用CPU,形成“开先”、“开胜”两大产品系列,实现了“从双核心到八核心”、“从1.6GHz到3.0GHz”、“从处理器+芯片组方案到SoC单芯片方案”等多方面的发展与创新,具备自主演进发展的能力和条件。
主力产品性能较好。2019年6月,兆芯在上海正式发布新一代16nm X86处理器产品——开先KX-6000和开胜KH-30000。新一代兆芯处理器是首款主频达到3.0GHz的国产通用处理器,支持双通道DDR4-3200内存,采用SoC设计,包含CPU、GPU和芯片组,芯片集成度进一步增强,性能功耗比上一代产品提升3倍。KX-6000适配win7、win10等主流操作系统,SPEC 2006 INT RATE成绩为170分,单芯片性能已经达到7代i5的同等水平,应用体验大幅提升。
积极开展前瞻研究。兆芯计划于2021年推出开胜KH-40000系列CPU,基于16nm工艺,32核心且支持双路互联,专门面向高性能服务器产品市场。此外,兆芯已着手7nm以下工艺产品的定义和研发工作,作为开先KX-7000系列,延续SoC设计方案,在内存、USB、PCIe等规范方面将瞄准国际同期主流水准。
兆芯生态具有优势。兆芯在实现技术创新与产品进步的同时,始终保持开放合作,最大化兼容X86生态的优势。兆芯CPU广泛应用于电脑整机、笔记本、一体机、服务器和嵌入式计算平台等,能够为党政办公、金融、教育、交通、网络安全、能源等行业提供可靠的解决方案。
七、申威:为超算而生的强者
申威CPU由上海高性能集成电路中心研制,基于DEC公司的Alpha架构,并进行了指令集扩展和微结构自主创新,成功应用在国产超级计算机中。
在探索中迭代发展。2006年,申威1单核CPU研制成功,130nm工艺,主频900MHz。2008年,申威2双核CPU推出,同为130nm工艺,主频1.4GHz。2010年,申威1600十六核CPU推出,65nm工艺,运用于神威蓝光超算。2012年,申威1610、410相继推出,均为40nm工艺、1.6GHz主频,分别用于服务器和PC。申威现已形成高性能计算CPU、服务器/桌面CPU、嵌入式CPU三个系列产品线。
申威432、443、3232在研。申威432、443均为4核CPU,分别采用第四代、第五代申威核心,主频将分别达2.2-2.5GHz和2.8-3.0GHz,综合性能将分别达到同期国际主流桌面CPU的60%和80%。申威3232为32核CPU,主要面向云计算、大数据领域,综合性能预计为同期英特尔主流服务器CPU的60%-70%。
申威信息安全产业联盟应运而生。目前已有包括上海高性能集成电路中心、中国仪器进出口(集团)公司、中电科技(北京)有限公司等在内的50多家成员,覆盖芯片设计、基础软件、工业控制、整机及方案、定制服务等多个行业领域。2020年3月,统信UOS也已完成对申威421系列、1621系列机型的适配。
结语:CPU国产化大潮起,群雄正逐鹿中原。CPU作为ICT产业的核心基础元器件,是国家发展的一大“命门”。目前,在国际环境、产业政策、市场需求的联合驱动下,一大批国产CPU厂商奋楫前行,在工艺、性能、生态建设等多个方面不断取得突破,为CPU的自主可控、安全可信做出了贡献,并在“好用”的市场化道路上越走越远。未来,“中国芯”事业天高任鸟飞,海阔凭鱼跃,空间潜力巨大,中国科技企业由追赶者到并行者,再到引领者,值得期待!