12月24日,国产CPU厂商龙芯中科在国家会议中心举办了2019产品发布暨用户大会,这次大会最大的亮点就在于发布了其自主研发的新一代通用处理器3A4000和3B4000。龙芯3系列的A代表桌面级,可达4到8核,B则是面向高性能计算的,可达16到32核。
据介绍,这两款CPU采用28nm FDSOI工艺,从半导体加工工艺来看,不算先进,线宽和上代一样,但是架构经过彻底优化,性能达到了上一代的两倍以上。这是革命性的进步。
那么,龙芯3A4000的性能究竟如何?
在发布会上,龙芯公司介绍说,龙芯3A4000的性能已经与28nm工艺的AMD挖掘机处理器相当,其单核性能已高于用14nm实现的Arm处理器。由于目前使用龙芯3A4000的产品还没有评测报告,我们只能通过它的对标产品来推测它的性能。
AMD公司的挖掘机(Excavator)架构是在2011年10月公布的,使用这个架构的正式产品代号为Carrizo,于2015年上市,典型产品就是Athlon X4 845,工作频率为3.5Ghz,可睿频至3.8Ghz。那么这款CPU的性能如何呢?笔者查找了2015年左右媒体的评测报告,得到了以下性能指标:
我们可以看到,AMD Athlon X4 845的PCMark 8 跑分成绩略好于Intel第四代酷睿i5 4440处理器。笔者家里有台比较老的台式电脑,使用的是英特尔第三代酷睿i5 3550处理器,其性能日常办公已经足够用了,后来笔者加了一块比较好的3D加速卡,运行现在主流的游戏都比较顺畅。
如果龙芯3A4000的性能真能达到Athlon X4 845的水平,那么日常使用是绰绰有余的。
龙芯3A4000的架构意义如何重大?
值得注意的是,龙芯3A4000的性能是在使用比较落后的28纳米加工工艺,完全通过架构优化而达到的。其性能已经达到了AMD和Intel公司28纳米主流处理器的水平,比当前ARM架构使用更先进半导体工艺的处理器的性能都要高很多。这说明龙芯团队的架构设计水平已经成熟了,能够与世界一流团队相媲美。
架构设计有多重要?非常重要,实际上,处理器的性能主要由两方面决定,一个是架构设计,另一个是半导体加工工艺,而这两者是互相促进的,只有架构设计水平高,才能发挥出更先进半导体加工工艺的潜力。
一个现实的例子就是,现在的ARM架构处理器,苹果公司的A13采用了自己研制的先进内核架构,其单核性能吊打使用ARM公版内核的华为麒麟990与高通骁龙865。
而Intel公司坚持了几十年的Tick-Tock开发流程一直促进处理器的性能按照摩尔定律发展。每个Tick-Tock中的“Tick”,代表着工艺的提升、晶体管变小,并在此基础上增强原有的微架构,而Tick-Tock中的“Tock”,则在维持相同工艺的前提下,进行微架构的革新。每个Tick或者Tock,都能比上一代产品的性能提高10%左右。
龙芯3A4000相当于完成了英特尔公司的一个“Tock”流程。而下一步,将进行半导体生产工艺的进步,即一个“Tick”流程。
龙芯的下一步:更高规格的工艺生产
龙芯的产品已经连续好几年都使用28纳米的加工工艺。据笔者了解,其早期的代工厂是欧洲意法半导体。28纳米是性价比最高的半导体工艺(按照单位数量的晶体管成本计算),而更先进的16/14纳米工艺,成本要高很多。龙芯公司的资金长期不是很充裕,使用28纳米工艺也是迫不得已。但是现在情况已经有所改观。随着龙芯产业链的成熟,龙芯公司已经有实力投入更先进工艺的开发。
这次发布会上,龙芯公司宣布未来的龙芯5000和6000处理器就将采用14纳米甚至更先进的工艺制造,其性能将会再上一个台阶。
笔者猜测,未来的龙芯产品将会使用中芯国际的14纳米甚至12纳米工艺代工生产。这样,龙芯无论是设计还是生产都是在中国大陆完成,真正自主化。
中芯国际在2019年初就宣布,其14纳米工艺已经进入小批量生产阶段,而下一个工艺节点,12纳米,进展顺利。
龙芯任重道远,但必须走下去
我们应该看到,当前世界的主流CPU都已经进入到7纳米工艺生产,基本上都是由台积电和三星公司代工;英特尔公司10纳米工艺的酷睿10代低电压处理器也已经量产,其工艺水平从晶体管密度与功耗上来看,与台积电和三星的7纳米工艺差不多。
所以即使龙芯下一代产品使用了14纳米工艺,还是落后于世界大厂。但是,我们必须支持龙芯一步一步走下去。
目前国产CPU的架构和卡脖子现实
目前我国的通用CPU产业主要有这些产品:
中科龙芯基于MIPS架构,实际上它的指令集市MIPS的一个超集,核心完全自己设计,已经与MIPS公版内核没有什么关系了。中科龙芯公司早已买断MIPS的永久授权,并且MIPS在2019年3月份宣布开源。可以说,龙芯在知识产权上完全自主,不受制于外国。
基于ARM架构的移动处理器,包括华为海思的麒麟系列,紫光展瑞的新5G处理器,还有飞腾公司的FT2000plus系列处理器,理论上都受制于美国的出口管制。我们不能忘记ARM公司在2019年5月份曾经宣布暂停与华为的合作的报道。虽然后来ARM公司又恢复了与华为的合作,但是这表明,所有基于ARM架构的处理器都无法做到完全自主。
基于X86授权的国产处理器,包括从AMD取得授权的天津海光公司以及从威盛电子(VIA)取得授权的上海兆芯,也都受制于美国的出口管制。实际上美国商务部已经在2019年6月21日将海光公司纳入了管制实体清单,AMD公司也宣布停止与海光的合作。
基于DEC Alpha处理器架构的总参江南所的申威处理器。经过二十多年的发展,申威处理器与原有Alpha架构已经没有多少联系了。它是我们完全独立自主发展起来的处理器家族。申威处理器目前主要用于神威超级计算机,它在商用服务器领域的开拓并不顺利。
综上所述,我们完全独立自主,不受美国限制的处理器,实际上只有龙芯和申威。在软件和硬件生态圈上,龙芯要远远超过申威。这就是我们必须支持龙芯的理由。
难点就在软件和硬件生态圈的建设上
网上对龙芯的批评,有一点是说MIPS生态圈已经死去,没人再用了。这并不正确。MIPS公司原本与ARM公司一样靠内核设计授权来盈利,但是在商务拓展上不如ARM,以至于在2019年3月宣布开源。在开源之后,由于总体费用骤降,MIPS生态圈有所恢复。在MIPS公司的伙伴列表里,目前有多达125家合作伙伴。所以龙芯并不孤独。
世界上已经失败的CPU架构
ARM架构占领移动端和X86架构占领桌面和服务器是长期市场竞争的结果,并不能说明它们技术最优。历史上比较知名的在竞争中失败的通用CPU有一个长长的列表:从摩托罗拉的68K系列,Zilog公司的Z80 CPU,到DEC公司的Alpha CPU,惠普公司的PA-RISC处理器,IBM的Power处理器,Sun/Oracle公司的SPARC处理器,甚至Intel公司自己的IA64架构处理器,全都在市场竞争中失败了。
龙芯要想在市场上取得成功,除了国家的支持外,还需要吸取过去这些CPU失败的教训,找到自己在市场上的突破口,然后与合作伙伴一起,利益共享,建设生态圈。
值得欣喜的是,我们看到了龙芯在过去这些年中的进步。前途虽然困难,但充满了希望。用毛主席的一句诗词来表述就是:雄关漫道真如铁,而今迈步从头越。
最后,让我们记住新闻稿中提到的这几家企业,是他们正在默默的支撑着龙芯赖以生存和发展的生态圈:“当天发布会上,联想、中科曙光、方正、中国运载火箭技术研究院等也发布了基于龙芯新一代通用处理器的桌面计算机、笔记本、服务器、网络安全设备、工业控制计算机等产品。”
(来源:环球时报 作者:微胖)