华为鲲鹏产业体系研究深度报告:鲲鹏展翅,挥
来源:内容来自公众号「未来智库」,报告来源:民生证券,谢谢。“鲲鹏”+“昇腾”双引擎发布奠定鲲鹏产业算力基础,与伙伴企业合力打造全栈式 IT 布局凸显雄心壮志。华为 2019 年先后发布两款高性能的 7nm 级芯片处理器鲲鹏 920 和昇腾 910,标志自研芯片算力步入 ARM 架构体系前列水平。以此为契机,华为 2019 年 7 月召开“鲲鹏展翅,力算未来,开创计算新时代”为主题的首届鲲鹏计算产业峰会,拉开全栈式鲲鹏计算 产业联盟大幕。
定位:中国乃至全球算力提供者,打通全产业链构建新 IT 生态
算力和数据成为新的生产力和生产资料,摩尔定律放缓和登纳德缩放定律接近终结给予异构计算新机遇。宏观政策和科技发展的双重要素驱动数字经济迅速发展,而随着摩尔定律的逐步放缓和登纳德缩放定律接近终结,芯片算力和性能陷入发展瓶颈期,计算机现有架构发展空间受到抑制,因而对创新架构的探索和需求日益迫切。以 ARM 为代表的 RISC 通用架构 处理器和以具备特定定制化加速功能的ASIC和FPGA芯等在场景多样化的计算新时代更具有优势。随着未来计算产业方向的发展,多种计算架构并存的状态有望随云服务的发展进一步加 速出现。
“后摩尔时代”给予“鲲鹏”亮眼机会,各类新应用需求需新算力支持,计算进入异构并存时代。受 ICT 技术发展的推动,海量数据爆发和以 AR/VR、AI 与大数据、4K 超高清、智能驾驶、智能家居等各类新应用需求出现,带动全球计算空间和计算需求出现指数级增长。根据 OpenAl 的报告显示,自 2012 年以来,算力需求的增长出现每 3.5 月翻一倍,每年增长约 10 倍的惊人事实。而随着处理器进入“后摩尔定律”时代,制程升级带来效能升级边际效应 减弱。而以鲲鹏 920 为代表的 ARM 高性能处理器,利用 ARM 在移动设备领域积累的新工艺、新制程和新材料优势,实现在并发性能、能耗、集成度方面的优势,实现在分布式存储、云端同构等应用场景的突出表现。因而,我们认为计算产业进入异构计算时代,以 ARM 为代表的 处理器有望在非移动端大放异彩,承接更多算力需求。
IT 全栈式布局,以开放和开源为主旋律,实现基于鲲鹏处理器的完整生态建设。早前受制于计算产业高耦合性的限制,缺少生态体系的高性能单品往往以失败告终。华为作为鲲鹏产业联盟发起者,深刻意识到生态的重要性,因而提出 IT 全栈式布局设想。且借鉴 Wintel 联盟 历史,计划利用自身的 ArmV8 架构永久授权和多年芯片研发基础成为生态算力提供者,通过硬件开发、软件开源的合作基调,逐步退出高服务需求、专业性强的领域,让利和赋能合作伙 伴,发挥产业集群效应,实现产业生态建立。
现状:雏形初现,各省市积极合作开展鲲鹏生态合作
首批 150 家生态厂商加入,产业联盟、华为沃土 2.0 计划、开发者社区和行业伙伴认证助 力生态建设,产业链雏形初显。根据下图的鲲鹏计算产业全景图可见,华为以“鲲鹏”+“昇 腾”两大 CPU 为核心,向外扩展生态。利用产业联盟、行业伙伴认证等措施推动产业集群效 应,同时利用沃土计划和开发者社区,挖掘、培养、吸引更多的人才参与进鲲鹏生态建设。
除华为自身“赛道”外,优秀的 ISV 和合作整机厂商一起参与,推动鲲鹏计算产业的发 展。具体的鲲鹏计算产业的伙伴企业包括:
操作系统:诚迈科技、中国软件;
服务器/pc:拓维信息、神州数码、东华软件
集成服务:太极股份、常山北明;
应用服务:用友网络、金山办公、神州信息
信息安全:北信源;
大数据:美亚柏科、东方国信、易华录;
中间件:东方通、宝兰德等
鲲鹏生态建设获各地政府支持,迎来小高潮。自 2019 年 7 月华为和厦门市签订了鲲鹏生 态基地和超算中心协议拉开政府共建生态大幕,近 20 个省市先后与华为签订不同类型的合作 协议,涉及多家合作伙伴企业。获取政府支持和背书后,鲲鹏计算产业获一良好开局。
发展计划&举措:三步走定调产业发展节奏,三类”玩家”共推生态成熟
三步走完成从产业试点到全产业链打通过程,螺旋上升路径实现创新路上的持续正反馈。根据《鲲鹏计算产业白皮书》的规划,鲲鹏产业计划先在包括政务、电信、金融和互联网等重点行业竖立典型场景,打造标杆项目;后逐步扩展行业覆盖范围,利用技术优势推进各行业数字化业务的发展;最后实现全产业链打通,构筑基于鲲鹏服务器的完整生态。因而,在现处的第一阶段,鲲鹏产业需要先根据试点行业用户需求,孵化和完善面向行业的应用,打开产业空间,实现应用与需求的对接,通过商业化推广促进产业链各环节的持续创新,形成螺旋上升式 发展路径,逐步扩大产业影响力和受众覆盖范围。
开发、开源、互利为产业发展主基调,三类角色共同推进鲲鹏产业链发展。在主基调下,三类角色不可或缺。1、独立软件开发商等合作伙伴,他们基于鲲鹏处理器开发或适配解决方 案、应用软件等产品,例如操作系统、中间件、行业应用等;2、基于鲲鹏体系的开发者,即 参与开源社区建立,利用鲲鹏体系下的开源代码进行应用开发的公司或个人;3、客户,需要更强算力或数据资源来支撑现有业务的发展。上述三种角色既受益鲲鹏产业的生态资源,又推动产业生态的发展与成熟。因此,我们认为只有像华为这样国内科技产业巨头,才有能力聚集 三类角色”玩家”,共同推进“新”计算生态的创立与成熟。
建立标准和开发者体系,针对硬件、基础软件和应用推出不同举措,借助产业政策,推动生态建立。现阶段我国的 IT 对美国平台具有诸多依赖,以至于国内硬件厂商净利润率整体偏低。为了改变现有生态格局,推进鲲鹏产业发展,华为在《鲲鹏计算产业发展白皮书》中对硬件、软件、应用等领域现状提出改进方法,包括开发处理器和 PC 主板、建立开源社区、开 放 OS 源码等。同时提出建立产品标准体系、人才培养体系和产业政策,解决缺人才,缺通行 标准、缺联盟效应的问题。
空间:鲲鹏千亿级产业规模,软硬件厂商都将参与
IDC 预测 2023 年中国计算产业投资空间占全球 10%,约 7000 亿人民币,我们预测 2023 年华为鲲鹏产业市场规模近 1900 亿元,是市场重要发展动力。正如前文所言,数据爆炸式增长、处理器进入“后摩尔时代”推动新技术、新计算架构的探索,催化新的计算产业链条和新的生态体系及 ISV 厂商。根据 IDC 预测,全球计算产业投资空间预计到 2023 年实现 1.14 万 亿美元,而中国市场作为全球产业的主要推动力,约占全球 10%,近 1043 亿美元,即 7301 亿人民币。
构成的鲲鹏计算产业市场规模细拆:鲲鹏服务器市场 500 亿+鲲鹏 PC 市场 390 亿+其余 计算产业配套软件和应用市场 1000 亿=1890 亿。
我们预测 2023 年鲲鹏服务器的市场空间约 500 亿,包含鲲鹏主板和处理器的市场空间约 200 亿。1)2019 年 Q1-Q3 的中国 X86 服务器出货量约 224 万台,预测 2019 年全年出货量为 300 万台。根据中国 X86 服务器市场过去 6 年的数据(CAGR 为 10.7%),我们预测 20-23 年 服务器每年出货量增速约为 11%,因此预测 2023 年中国通用服务器的出货量约 400 万台。2) 考虑 IDC 数据,互联网厂商采购服务器占比在 16 年超过 33%,推测 2023 年市占达到 40%,考虑互联网企业服务器采购需求多为高性价比的服务器,暂时不是鲲鹏的主要客户范围。因此我们认为鲲鹏服务器前 3 年的市场是由政府、八大行业为主的剩余 60%服务器市场。预测市 占率可在 23 年达到 40%,则鲲鹏服务器出货量约为 100 万台;3)参考目前华为 X86 服务器 均价约 4-5 万,我们预测鲲鹏服务器定价约为 5 万/台,故 2023 年鲲鹏服务器市场空间为 500 亿,CPU 和主板占销售额的 40%,即 200 亿空间。
我们预测 2023 年鲲鹏计算产业中 PC 的市场规模约为 390 亿,出货量约 780 万台。 1) 考虑过去 5 年 PC 出货量和 PC 终端总量变动关系看,我国 PC 销售进入存量市场,即更新换 代为主要需求。我们预测未来 3 年 PC 销售约为每年 5000 万台,故更新换代率为 5000/28000=17.85%。考虑我国信创战略和公务更换需求,我们预测公务 PC 的更新替换率为 20%。2)目前我国财政供养人员总数为 5000 万人,按人均 0.9 台的公务 PC 比例算,全部公 务 PC 数量为 4500 万台。考虑每年 20%的替换率和鲲鹏 PC80%的市占率,则每年鲲鹏公务 PC 出货量为 720 万台,公务 PC 单价约为 5000 元/台。3)目前华为和荣耀电脑在笔记本端的市占 率为 13.9%(均为消费者市场) ,假设 2023 年笔记本电脑占 PC 市场的 40%(2018 年上半年全 球笔记本电脑出货量是全球 PC 出货量的 34.1%,其中消费者 PC 占比约为 40%),华为旗下笔 记本市占率于 2023 年升至 15%(消费者市场),其中鲲鹏 CPU 出货占比为 50%,则消费者市 场部分的出货量为 60 万台,消费级 PC 单价约为 5000 元/台。4)合计 720*0.5+60*0.5=390 亿 市场。
我们预测 2023 年鲲鹏计算产业中配套软件与应用生态的空间约 1000 亿元。参考 IDC 对 计算产业的投资预测,服务器及部件的投资约占产业总投资额的 30%,因而我们预测鲲鹏计 算产业中配套软件与应用生态的空间是鲲鹏服务器市场空间的 2 倍,即 1000 亿元。
华为:聚焦算力、赋能伙伴、共建计算产业,前期注 重打造生态标杆项目
华为自身定位明晰,聚焦算力、赋能伙伴、共建计算产业。即核心聚焦处理器研发,推广数据库、公有云的覆盖范围,提供服务器端和 IOT 端的操作系统。早期注重生态标杆项目建设和产业链的正反馈,后期逐步实现硬件开放、软件开源,进一步让利于生态内的合作伙伴。根据华为在多场合就鲲鹏产业发言内容看,商用处理器(移动端麒麟、商用端鲲鹏、昇腾)、数据库、华为云、操作系统(鸿蒙和欧拉)、存储是公司重点聚焦的领域,中间件、PC 操作系统、行业应用等软件市场将全面开放给生态伙伴。考虑到鲲鹏生态的初建,公司会利用泰山系列服务器为鲲鹏 CPU 在计算场景的多元化利用树立标杆。即前期会利用自己的硬件能力,对 外提供主板、部件、模组等一系列产品支持合作伙伴生产服务器或 PC,拉住第一批 ISV 厂商,构建全产业链架构,保证发展初期产业链的完备和可持续发展。后期待生态逐步完备成熟,华 为会陆续退出服务要求高、专业性强的领域,进行进一步的产业聚焦。
芯片:“鲲鹏”、“昇腾”提供算力,多年积累打造鲲鹏产业核心
长期投入,基于 ArmV8 架构开发最新“鲲鹏”处理器,自研架构开发“昇腾”AI 处理 器。华为采用长期投入、全面布局的战略围绕鲲鹏处理器打造了 “算、存、传、管、智”五 个子系统的芯片族。经历十几年的研究,推出商用处理器鲲鹏、AI 处理器昇腾、手机 SOC 麒麟芯片、以及一系列专用处理器。公司根据“量产一代、研发一代、规划一代”的研发节奏,围绕生态建设需求和应用场景,对鲲鹏处理器进行指令集和微架构的兼容设计,兼容全球 ARM 生态,实现产业间的相互促进与发展。
鲲鹏 920 实现 ARM 架构业界性能最强,集成四大结构于单一封装。华为 2019 年 1 月对 外发布鲲鹏 920 处理器,鲲鹏 920 采用最先进的 7nm 工艺,集成 64 个核心。通过优化分支预 测算法,增加 OP 单元数量并进一步改进内存子系统架构,整合 8 通道的内存控制器,提升处 理器性能,使得带宽增加幅度达 48%。在 SPECint 基准测试中,鲲鹏服务器测试得分超过 930, 超行业基准 25%,同时电力效率高同业 30%,实现更强性能的同时降低功耗。此外,鲲鹏芯 片中集成了传统计算芯片的四大结构,包括网络、存储、主控芯片和 CPU 于单一封装中。
对标 Intel 服务器级芯片 XEON-8180,48 核数据跑平,功耗低 20%。鲲鹏 920 处理器是 专为大数据处理和分布式存储等应用场景设计,因而应用场景与 INTEL“至强”(XEON)类似。鲲鹏 920(Hi1620)包括 32、48 和 64 核。在 SPEC 测试中,48 核的鲲鹏 920 与 IntelXEON8180 的性能相当,而 64 核的测试性能要优于 XEON8180。且 48 核的鲲鹏功耗为 150W 低于 XEON8180 的 205W。此外,进一步对比内存等指标和集成网卡等特点,鲲鹏 920 在海量存储 的应用场景中更有优势。
昇腾 310 和昇腾 910 两款 AI 芯片拉开华为 AI 处理器产品之路。华为基于自研的达芬 奇框架,推出用于边缘计算和低功耗场景下的昇腾 310 和主打训练和高效计算的昇腾 910。具 体来看,基于典型配置的昇腾 310,在八位整数精度(INT8)下的性能达到 16TOPS,16 位浮 点数(FP16)下的性能达到 8 TFLOPS,而其功耗仅为 8W;昇腾 910 在八位整数精度(INT8) 下的性能达到 512TOPS,16 位浮点数(FP16)下的性能达到 256 TFLOPS,是英伟达 V100 Gpu 的 2 倍。
“昇腾 910”是已发布的单芯片计算密度最大的 AI 芯片,单片执行速度超过同期 AI 芯片。910 除了基于达芬奇架构的 AI 核外,昇腾 910 还集成了多个 CPU、DVPP 和任务调度器 (Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。其制程采用的是 7nm+技术,16 位浮点下的单片计算速度为 256 TFLOPS,高于目前谷歌 TPU3.0 的 90T 和英伟 达 V100 的 120T。
基于“昇腾 910” AI 芯片,推出超强算力的 Atlas 900 AI 训练集群。华为通过数千颗昇 腾 910 互联构成 Atlas 900 AI 训练集群,通过部署大规模分布式 AI 集群环境来提高神经网络 训练系统的浮点计算能力,而每颗昇腾 910 AI 处理器内置 32 个达芬奇 AI Core,使得单芯片 提供比业界高一倍的算力(256TFLOPS@FP16),促使Atlas900训练集群总算力达到256P~1024P FLOPS @FP16,相当于 50 万台 PC 的计算能力。目前,华为已在华为云上部署了一个集聚 1024 颗 910 的 Atlas 900 AI 训练集群,基于当前最典型的“ResNet-50 v1.5 模型”和“ ImageNet-1k 数 据集”,Atlas 900AI 训练集群只需 59.8 秒就可完成训练,排名全球第一。
服务器&PC:前期利用泰山服务器竖立标杆,后续主要提供主板和部件支持整机厂
基于“鲲鹏 920” 芯片,推出三款泰山服务器。华为 2019 年 1 月,基于鲲鹏 920 芯片,推出面向大数据、分布式存储、 ARM 生态和高性能计算等应用需求的三款泰山 2280(均衡型)、 泰山 5280(存储型)、泰山 X6000(高密度)服务器。
开发主板,后续提供主板支持整机厂进行自研服务器和 PC。华为计划在 2019Q4 起逐 步开放基于标准规范的服务器主板和 PC 主板,帮助整机厂商快速开发基于鲲鹏处理器的服务器和 PC 等产品,降低系统设计和开发难度,缩短产品上市时间。此外,华为也在多场合表示, 华为开发 TaiShan 服务器的根本目的是立标杆,使能产业链早期可以顺利推进。条件成熟时, 华为会逐步停止 TaiShan 服务器销售业务,转为以主板和部件等方式全面支持和服务更多整 机厂商共同发展。
不做 PC 整机,和整机厂合作开发自研品牌 PC。在华为与山西百信联合主办的鲲鹏计 算产业发展峰会上,山西百信展示了基于华为鲲鹏构架自研的“太行 220s”台式机样机和“恒 山”服务器。其中“太行 220s”台式机采用基于华为鲲鹏 920S 开发的办公应用型主板,搭载 1 个鲲鹏 920 处理器(4/8 核,2.6Ghz),拥有 6 个 SATA 3.0 硬盘接口,支持 2 个 M.2 SSD 插槽, 拥有 4 个 DDR4-2400 UDIMM 插槽,最大容量 64GB。此外华为集团高级副总裁张顺茂接受采 访时表示,“华为确实为国产台式机提供芯片,型号为鲲鹏 920S;我们只提供台式机芯片,不 做整机。”
多家关于鲲鹏服务器的整机合作已落地,鲲鹏服务器产能预计将在 20 年下半年开始释放。从一系列合作和公司态度看,华为未来将退出服务器整机厂的定位,转型为核心零部件 厂商。由合作的整机厂为市场提供终端产品。
存储:多品类布局,中高端市场发力
2019 年上半年,华为存储位列中国存储市场份额第一,中国全闪存、高端存储、中端 存储市场份额第一。华为自 2012 年起开始推出面向企业的存储产品,已服务于全球 150 多个 国家的超过 8000 家客户,已连续两年成为 Gartner 通用存储阵列魔力四象限领导者。根据 IDC 的报告,在 2019 年上半年,华为存储以 21.1%获中国市占率第一。具体看在我国存储市场占 据 31.9%的软件定义存储控制器存储软件市场的主要引导者是华为。
存储产品分为四大类型,包括全闪存存储、混合闪阵列、云存储、数据管理,存储产品收入持续上升。华为存储产品主攻中高端企业市场,通过自研智能芯片、Flashlink 智能 算法加持、NVMe 框架等支持多控制器等技术实现中高端智能存储需求,满足大型数据库、 数据分析等大型企业客户需求。根据 IDC 数据,华为存储收入持续上升,2019 年上半年华 为存储在中国市场收入同比增长 35.5%,占据中国市场份额第一名,高于第二名两倍。
操作系统:开源欧拉 OS+鸿蒙 OS,打造服务器与 IOT 的生态基础
欧拉 OS 是华为面向企业级通用服务器推出的操作系统软件,鸿蒙 OS 面向多款智能终 端。
欧拉 OS 全面支持鲲鹏服务器,现在是支持泰山服务器的操作系统之一。欧拉 OS 是 基于开源技术的开放的企业级 Linux 操作系统软件,欧拉 OS 基于 cent OS 稳定版本,集成 类先进的 Linux 技术,在系统性能、安全性、可靠性以及容器技术等方面实现技术增强。欧 拉 OS 在鲲鹏服务器应用中具有多重优势:1、支持多核并发能力,首次在鲲鹏处理器架构 内实现内核热补丁;2、通过鲲鹏处理器的关键特性使能,实现了核心业务场景性能突破, 并在 Linux 内核、虚拟化、GCC、OpenJDK 及 Docker 等开源社区持续贡献,催熟产业生态。
开源欧拉 OS,联合伙伴企业成立开源社区,打造开源欧拉生态。2019 年 9 月华为宣布 将欧拉 OS 正式开源,同时宣布与深之度、中标麒麟、普华软件等公司联合推出 OpenEuler 开源社区。OpenEuler 定位为面向全球的操作系统开源社区,华为通过发布社区操作系统版 本实现技术共享,商业发行商可对 OS 进行二次开发,个人、企业等也可直接使用社区版 OS。
鸿蒙 OS 是华为为智能终端打造的核心操作系统,是华为 IOT 生态建设的基础。华为 自 17 年起开发鸿蒙内核,并在 2019 年基于智慧屏产品推出开源框架和核心自研模块的鸿 蒙 OS 1.0。预计 2020 年推出鸿蒙 OS2.0,将采用微内核框架、支持多语言统一编译,并在 手表/手环/车机等产品中使用。后续,将进一步对鸿蒙 OS 进行升级开发,致力于将其广泛 运用在 IOT 中。
鸿蒙 OS 具有全场景、分布式、微内核和跨终端的四点特征。现阶段支持 Linux 内核、 鸿蒙微内核、LiteOS 等多款内核,未来会统一基于鸿蒙微内核。全场景:基于分布式管理 实现调度和虚拟外设,实现跨终端的无缝使用;分布式:基于确定时延引擎和高性能 PIC技术,实现系统高性能;微内核:基于全新设计,实现最基本的应用和核内安全,核外提供系统及其余应用服务;跨终端:基于统一的 IDE 环境实现一次开发,多端受用,实现应 用跨终端共享。
应用数量决定鸿蒙 OS 后续发展前景,HMS 助力鸿蒙 OS 发展。为推动华为 HMS 生态 发展,华为将全面开放 HMS,同时公布 10 亿美金的耀星计划,计划在全球举办超过 100 场活动,鼓励全球开发者加入华为 HMS 生态。截至 2020 年 2 月华为全球注册开发者已经 超过 130 万,全球接入 HMS Core 的应用数量超过 5.5 万款。随着华为手机、PC、可穿戴设 备销售量和市占率的逐年上升,尤其是华为手机全球市占率超 13%,是 HMS 推广的机遇。待鸿蒙 OS 的待适配条件成熟后,可直接将 HMS 生态下的应用直接迁移至以鸿蒙 OS 为操 作系统的手机上,实现华为手机全自有配置,也可提升鸿蒙 OS 的适用性和使用感。
数据库:分布式数据库,支持 X86 和 ARM 双框架
GaussDB 为企业级、具有 AI 性能的分布式数据库。华为 GaussDB 是一个企业级 AI-Native 分布式数据,采用 MPP(Massive Parallel Processing)架构,支持行存储与列存储, 提供 PB(Petabyte,2 的 50 次方字节)级别数据量的处理能力。可以为超大规模数据管理提供 高性价比的通用计算平台,也可用于支撑各类数据仓库系统、BI(Business Intelligence)系统 和决策支持系统,为上层应用的决策分析提供服务。
经历自用、产品、创业化三阶段,华为数据库正式面向全行业。华为从 2001 年底开始 进入数据库领域,历经20年发展,于19年正式对外发布企业级分布式数据库——GaussDB。第一阶段(2001-2011):聚焦电信行业,围绕公司的电信业务展开,研发的分布式内存数据 库,主要为了在电信领域里面满足在线计费业务的需要;第二阶段(2011-2019):成立实验室,进入产品化研发阶段。期间分别通过和工商银行、招商银行联合创新,分别推出了企业级的分布式 OLAP 数据库、分布式 OLTP 数据库产品;第三阶段(2019-未来):正式对外发布企业级分布式数据库,进入产业化阶段。该阶段内华为将携手产业合作伙伴共同打造开放繁荣的数据库产业生态。例如,在金融领域,华为携手神州信息针对银行推出一体化解决方案,覆盖芯片到服务器到操作系统数据库到应用,再到全栈自主研发的解决方案, 满足银行自主可控需求。
高可靠、高性能和高扩展为 GaussDB 核心优势,其中 ARM/X86 通用意在瞄准国内替 换市场。华为 GaussDB 的高可靠性表现在全组件 HA,无单点故障。即数据节点采用 HA +Handoff 技术,协调节点多活。扩容业务不中断。扩容过程中支持数据增、删、改、查, 及 DDL 操作;由于全并行计算,行列混存+向量化执行,因而实现万亿数据关联分析秒级 响应;并行 Bulk Load,数据快速入库体现数据库的高性能;数据库采用 Shared-nothing 架 构,具备超强的 Scale-out 横向扩展能力,可扩展至 2048 节点;可通用 X86/ARM 架构,扩 容成本低。
GaussDB-OLTP (事务性数据库)是基于电信计费领域规模商用的自研内存数据库进 行全面改造。支持 x86 和华为 Kunpeng 硬件架构,基于创新性数据库内核,提供高并发事务实时处理能力和分布式高扩展能力,用于支撑金融、政府、电信等行业核心关键系统。支持单机、主备、分布式等主流部署方式。目前 GaussDB-OLTP 数据库在基于华为 Kunpeng 硬件架构的 16 节点的 TPC-C 标准测试中,性能达到千万级 tpmC。根据测试情况,GaussDB -OLTP 展现四点特性高可用、高性能、高扩展和兼容性。
GaussDB-OLAP(分析型数据库)是 2011 年开始预研,之后基于 PostgreSQL 9.2.4 进 行全面改造,目前已经形成完整自研内核。GaussDB OLAP 是可进行大规模并行处理的分布 式数据库,支持行列混合存储以及线程化,能够支持高达 2048 节点的集群规模(已经通过信 通院的 512 节点认证)。数据库内核三大引擎中,优化器(含 SQL 解析和 SQL 优化)、执行引 擎、存储引擎,除了 SQL 解析部分,其他都已重构。作为企业级分布式数据库产品,GaussDB OLAP 数据库还提供了包括运维管理、开发工具、迁移工具、数据复制工具等五大完整工具 集。由于数据库主要面向 OLAP 场景,支持 MPP(大规模并行处理)分布式部署方式,故而产品特点具有高可用、高性能、高扩展、数据融合、计算融合、数据安全等特性。
数据库的生态体系和迭代进度决定产品后续发展。Oracle 数据库的垄断地位是随着 WINTEL 体系在 PC 时代逐步建立的,而 AWS 数据库则是依托云计算和互联网公司对数据 库的需求逐步推广使用的。华为 Gauss 数据库随着华为鲲鹏产业发展带来的华为 IT 架构发 展,容易形成整体耦合性进而有望逐步被推广使用。对比三款数据库的使用架构看,Oracle 和 AWS 仍主要支持 X86,而 Gauss 可以支持 X86、ARM 等异构场景,可适用于更多的计 算场景。从现阶段的客户看,Oracle 客户多为传统大型企业,AWS 以互联网公司为主,Gauss目前主要在银行、电信等行业存在用户,客户数量存在劣势。随着鲲鹏体系的推广和客户数量的增多,客户反馈的加速,Gauss 的迭代和优化进程有望加速。因此,我们认为鲲鹏体 系和 Gauss 数据库发展为相辅相成的关系,随着产业生态进一步发展,Gauss 的用户也有望 随之增加。
华为云:多元架构,具备多核高并发能力
华为云鲲鹏云服务是具备多核高并发能力、提供多元架构、支持混合云模式的云计算平台。华为云基于鲲鹏处理器的云服务最多可支持 128 个物理核,10 倍提升 ARM 原生应 用的高并发处理性能,可同时兼容 X86 与鲲鹏架构,拥有全栈混合云解决方案。在 AI、大 数据、HPC 等场景下,可以提供多元算力,支持移动端应用无缝平滑上云,也可以通过云 联邦混合云联接华为公有云的全量服务,满足全行业企业的数字化转型的需求。
四大鲲鹏基础云服务、全栈混合云华为云 Stack8.0 助力企业上云。目前华为云已发布 五款鲲鹏云基础服务,包括鲲鹏裸金属服务器(BMS)、鲲鹏弹性云服务器(ECS)、鲲鹏云 容器引擎(CCE、CCI)、鲲鹏云手机服务(CloudPhone),具有多核算力、高性价比、端云 协同、生态丰富等优势。此外,2019 年 9 月华为云还发布了基于鲲鹏处理器的全栈混合云 解决方案华为云 Stack 8.0,具有“X86+鲲鹏”双架构、“云上+本地”双平台, 公有云、私 有云统一架构等特性,实现将应用数据部署在线下的私有云、需求部署在公有云的平台上的 多场景协同、“一个企业一朵云”的混合云交付模式;用户也能够实现 X86 和鲲鹏体系的混 合部署,实现无缝连接。
天时地利人和助推鲲鹏产业链发展
计算产业的发展受益于 IT 技术的革新,受制于软硬件高耦合性带来平台霸权。我们认为鲲鹏计算产业现在正处天时地利人和助推阶段,受益云计算带来的技术变革、享受开源 计划的助力、拥有千亿市场和人才的储备,看好产业后续在八大重点行业的发展与扩张。
天时:云计算发展颠覆 PC 时代对单机性能的追求,开源计划兴起助力打破垄断
云计算带来 IT 时代新变革,削弱软硬件高度耦合影响,开源软件实现定制需求。在传 统 PC 配置中,企业级 IT 服务受制于安迪比尔定律,需先购置一批高价软硬件和配备专业 的 IT 技术人员维护,后方可开展业务。且由于各软件对运行环境的不同,致使容易存在兼 容性问题。而云计算的出现则利于削弱兼容性和高度耦合问题,满足企业 IT 需求的同时削弱投入成本,打破数据与应用孤岛。此外,互联网企业利用开源定制化软件降低成本,推 动开源计划兴起,实现开源基础软件在云计算时代市占率上升。
云计算下分布式计算和存储削弱终端性能,国产 CPU 进入云产业成为可能。服务器作为云计算数据中心最重要的硬件需求,不似之前企业级高性能通用型服务器需求,云厂商的主要采购需求是高性价比定制型服务器。分布式存储与计算的优势使得拥有惊人计算和存储能力的华为云、阿里云等云厂商采购的多数是性能较为低端的 X86 服务器,单个芯片 或单台性能不成为被追求的目标,叠加“后摩尔时代”的到来,国产 CPU 的同期性能虽低 于 Intel 同期产品,但云计算造成单机性能需求降低,国产 CPU 进入 IT 系统成为可能。
云计算数据处理与存储中心化,带动后端硬件集中度上升。硬件厂商捆绑云厂商,稳定在云时代的市占率与出货量。对比传统 IT 架构下由一个个 PC 终端构建的硬软件生态体 系,云计算带来的算力与存储需求集中导致 IT 产业从个体消费级需求往企业级市场转变。具体来看:1.全球 IT 基础设施采购量逐步向云计算厂商集中,云厂商的 CAPEX 很大程度上 影响硬件销售情况和迭代需求;2.硬件类型从高性能商业通用型向高性价比定制型转变,云 厂商采购的 IT 基础设施的集中度高于传统消费型市场。因而与云厂商捆绑将助于硬件厂商 稳定市场份额,鲲鹏产业捆绑华为云,前期稳定硬件厂商出货量,形成产品迭代的正循环。
云应用提高兼容性,削弱对操作系统、硬件环境的依赖,打破 Wintel 联盟限制。云计 算条件下的终端应用,是由软件模式逐步转为通过 WEB 服务方式提供,因而对终端操作系统和处理器性能需求降低。云计算设想的终端条件,是只需要浏览器即可运作应用,类似于现阶段的小程序等轻量级应用。因而随着终端应用轻量化,使得应用开发会一定程度上 摆脱对原有操作系统和硬件生态的限制,使得 Wintel 联盟不攻自破。
Wintel 以外是开源的世界,互联网巨头助力开源计划。目前 Wintel 打造的硬软件生态 是个人PC时代的信息垄断,垄断CPU和基础软件行业,即Intel在CPU市场的份额为90.41% (2018),微软在操作系统市场的份额为 84.89%(2019)。除此以外的市场份额被开源产品占据,例如 ARM 对抗 Intel, Linux 对抗微软,MySQL 等开源数据库对抗 Oracle。云计算带来的是软件和应用的革命,从而进行逆产业链的革新。云厂商掌握者最强算力和技术最新的数据中心,因而需要高集成、模块化、面向应用的硬件设备,这些是传统品牌商无法提供的,因而 Facebook、阿里巴巴、LinkedIn 先后发起了硬件开源计划,通过重新设计硬件 技术,满足云计算带来的计算基础架构更新需求。
华为、阿里的巨头回补 IT 生态,利用自身需求和影响力吸引开源市场参与者。目前中 国 IT 建设是基于美国平台的,造成即使中国 IT 市场的增速成为全球 IT 最主要动力,却因缺少核心价值产品无法出现类海外的软硬件巨头。而在互联网、通信行业领域,我国出现了华为、阿里这样的万亿公司。他们凭借着多年技术积累,逐步优化、迭代开源产品,例如:华为的鲲鹏、昇腾芯片,鸿蒙、欧拉操作系统,GauseDB 系列数据库和阿里云的飞天云 计算底层架构、Oceanbase 数据库等。上述巨头利用庞大的产品体系和自身需求,推动更多 开发者进入他们的开源体系,通过参与巨头 IT 生态的开发与建立,探索应用或集成以外的 商业模式。
地利:庞大的终端替换与升级市场,战略需求下带来的政策支持
庞大人口和经济体量带来市场需求,劳动力价格上升加速信息化化进程。目前中国的GDP 总量和美国差距在缩小,而庞大的人口基数和智能化产品的普及导致中国 PC 市场占比 维持在 20%以上。随着中国劳动力价格的上升,工业发展持续进入智能化与信息化升级阶 段,利用 IT 技术提高效率需求日益凸显。因此,整体看我国市场属全球最大 IT 需求市场之 一,具有庞大的人口和工业基础需求,劳动力成本上升带动 IT 升级需求。
全球信任危机和信息霸权的凸显,IT 核心自主建设成为战略需求。2013 年“棱镜门”事件暴露了美国利用技术优势监控全球互联网,甚至渗透和攻击他国关键领域服务器的事实。2017 年 5 月,英国、意大利、俄罗斯等多个国家爆发勒索病毒攻击,我国大批高校也出现感染 情况,众多师生的电脑文件被病毒加密,只有支付赎金才能恢复。而 2019 年外部环境变动, 中国企业进入名单制裁,遭受芯片停供、IP 授权受限等一系列影响。再到 2020 年 win7 将正式停服等,上述一系列情况都映射出针对我国关键信息基础设施和重要信息系统的信息安全感知能力、防护水平、保障措施和自主可相控能力需要不断提升,IT 核心完成自主建 设一方面是降低信息安全事件发生概率,一方面是削弱信息霸权对企业正常运营的影响。
明确 IT 核心的战略地位后,国家出台一系列文件支持、鼓励建设自有生态。国家自 2001年起先后发布多项重量级政策和文件,自十三五开始多次在重要会议上提及信息创新产业链的产业高度和发展必要性,并于 2018 年首次发布国产化信息产品《适配名录》,常年对处于信息创新链的相关企业提供研发补助、财政补贴和税收优惠。未来基于外部环境变动和战略定位, 信息创新仍将持续受益政策利好,政策助力党政和重点行业对信息创新产品需求上行。
以集成电路基金为代表的国有资金支持自有生态建立,华为计划五年内投资 30 亿扶持鲲 鹏生态。新生态的打造离不开资金支持,2014 年 9 月,由财政部牵头的国家集成电路产业大 基金成立,一期募资 1387.2 亿,投资方向以 IC 制造为主,具体分布为:集成电路制造 67%, 设计 17%,封测 10%,装备材料类 6%。之后,我国集成电路产业取得了良好进展。从产业整 体来看,根据 CSIA 统计数据,2015 年我国集成电路销售额达到了 3610 亿元,完成了原先指 引的 3500 亿元目标。晶圆制造方面,中芯国际、华力二期 28nm 芯片生产线已经开始建设投 产,未来将继续往 14nm 等先进工艺延伸布局;晶圆封装方面,国内中高端先进封装的占比已 经超过 30%。而国家集成电路二期基金已于 2019 年 10 月 22 日正式注册成立,注册资本高达 2041.5 亿,预计将继续支持我国半导体产业的发展,助力 IT 硬件核心生产,或有望促进鲲鹏 计算产业发展。此外,华为自身计划投资 30 亿扶持鲲鹏生态。
3.3 人和:多年技术积累开启产业化进程,沃土计划、人才培养提供新活力
信息创新建设历经 20 多年发展,进入产品全面可用阶段。国家自 1999 年开始进入“核 高基”时代后,先后经历去“IOE”、芯片半导体安全可控时代,到现在的全面信息创新时代。经历 20 多年的筚路蓝缕后,我国自主研发的底层芯片如龙芯 CPU、鲲鹏 CPU、海思 CPU;中标麒麟、天津麒麟、深度、UOS 等操作系统;人大金仓、武汉达梦数据库等相继亮相。可 见现阶段我国 IT 核心产业如基础软件和芯片市场均有自研可用产品。
自研产品的单打独斗无法形成生态,鲲鹏计算产业的建设则是从市场角度出发致力联合多家 ISV 打造生态。正如前文所说 Wintel 体系下的软硬件高度耦合,在提供框架与兼容性标准的同时也绑架了体系下应用与基础软件的开发。鲲鹏计算产业的出现则是建立一套基于ARM 的开源生态,提供硬件开放、软件开源,先通过满足自用需求,再逐步往重点行业推广的策略汇聚全产业链优质企业一起推动生态建立与发展。即在自用需求上完成对产品的初步打 磨,再推入市场加速产品更新与迭代。
中芯国际的技术发展或将承接部分华为芯片流片工作,台积电 7nm 芯片仅包含约 9%的 美国技术受限概率低。华为鲲鹏产业基础是鲲鹏+昇腾两大芯片,因而在外部环境影响下,市 场对流片环节的担忧更甚。我们认为一方面是外部环境缓解,华为再获 90 天延期许可,趁此 机会华为可以提前备货,例如华为在2018年的财报中的存货达到965.45亿元,同比增长33.44%;另一方面美方对“美国最低含量标准”最低限在 10%左右,根据路透社报道称台积电内部评 估,台积电 7nm 及以下制程源自美国技术含量不到 10%,而最新的鲲鹏 920 芯片和昇腾 910 芯片均采用 7nm 工艺制程,因而可继续供货。此外,对于 14nm 制程,台积电评估美国技术 含量在 15%以上或将受限,但中芯国际已宣布可流片 14nm 制程芯片(包含改进 12nm 技术) 实现量产,并将于 2021 年正式出货。因而需 14nm/12nm 技术流片的华为可与中芯国际合作, 缓解外部限制。
华为沃土 2.0 计划和教育部招生政策往国家战略需求倾斜,新鲜优质人才助推鲲鹏产业计 算发展。华为沃土 2.0 计划希望通过产品、赋能、联盟、社区和激励五方面升级和推动鲲鹏生 态发展,预计未来 5 年总投资高达 15 亿美元。根据华为副总裁张顺茂的讲话称,华为从 2015 年发布“沃土计划”至今已吸引超过 130 万开发者和 14000 家 ISV 加入,希望通过“沃土计 划 2.0”将开发者数量在未来 5 年内增加至 500 万。同时他透露未来“沃土计划”还将细分为高校教研扶持计划、开发人员成长计划、初创企业扶持计划和合作伙伴发展计划针对开发者的不同阶段,“沃土计划 2.0”的激励基金分别设有学习成长基金、产品开发基金和市场发展基 金。此外,在 2020 年高考政策提出强基计划,强调选拔志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,重点在在数学、物理、化学、生物及历史、哲学、古文字学等相关基础专业招生;2020 年国家研究生计划增量的前提下,提出将增额重点投向临床医学、集成电路、人工智能等高层次的应用型人才。因此,我们认为新鲜优质人才的招募和集成电路、 人工智能等高尖端专业人才数量的增加,是发展我国 IT 生态的重要推动力。
复盘历史:为何此时看好华为 ARM 服务器发展
回顾过去 10 年,Intel 处理器基本垄断了近 250 亿美元的服务器处理器市场,市占率持续 超过 90%。事实上,AMD 旗下皓龙处理器(2003 年)曾在服务器市场上占据了 26%的份额, ARM 阵营也一直在努力服务器 CPU 产品化,但相对保守和求稳的服务器市场,使得处理器 的更迭上远慢于终端 PC 市场。云计算和互联网产业发展致使互联网巨头对服务器需求快速上涨,商业利益致使其直接自己设计和定制白牌服务器导致服务器整机市场的重构,之后存在下场设计处理器并再次重构服务器芯片市场的可能。而华为受益手机业务和云需求,正处引 领打造 ARM 生态历史的时点上。
复盘:ARM 服务器 CPU 多年折翼史和新阶段
ARM 体系下的服务器 CPU 发展历史可大致分为 3 部分,关键词分别为募资失败、逻辑 与市场的背离、新”玩家”。
第一阶段(2008-2013)募资失败: Arm 参投 Calxeda 公司,计划研发处理器,意图降低数 据中心的耗能,并且提高相同空间的计算力密度,首期募资$48M。2011 年 Calxeda 发布它基 于 A9 的芯片 EnergyCore ECX-1000,该产品管理引擎最强的地方在于功耗管理,可实现 4w 到 1w 动态调整,每个节点的制造成本大约是$28。2013 年因募资失败,无法继续 ArmV8 即 A15 芯片研究的时候,Calexda 宣布破产,两轮融资合计$103M。复盘 Calxeda 的失败,其在 32bitARM 芯片的研发上花费太多,当低成本的服务器芯片配套设计的是昂贵的高密度网络支 持( 3G 时代),只会增加成本。即设计与现状配套环境的不匹配和资金规划问题,导致 Calxeda 的失败。
第二阶段(2011-2018)逻辑与市场的背离:2011 年 Arm 宣布了 64bit 的 Armv8,Applied Micro公布了X-gene的计划,标志着第二轮ArmV8浪潮的开始。在第二阶段中,APM的X-gene, Cavium 的 ThunderX,高通的 Centriq 2400,甚至三星的投入,都是以自研核心、标准设计为 研发基础。但 ARM 框架下多厂商的竞争与发展,导致力量分散,缺少规模效应,使得性价比 优势并不明显。此外,Intel 自身就是利用开放的工业标准的高性价比处理器打败了所有私有 RISC 处理器,而 ARM 想用更开放的生态和更高的性价比在缺少软件生态的支持下,更开放 的硬件生态优势并不明显。因而,半导体业界和系统厂商推动 ARM 处理器发展带来的逻辑与市场的背离,商业化发展需求导致厂商无法长期投资,导致二轮发展浪潮的终结。
第三阶段(2018-至今)新“玩家”:AWS、华为、Ampere 等厂商意图从云厂商的市场需 求出发,打破 Intel 的垄断,借助 ARM 框架开发处理器。之前高通开发 ARM 芯片意图也是 寄予低功耗可以降低数据中心运营成本的优势,但这条逻辑需要云厂商的采购验证。而以 AWS、华为为代表的云厂商,自研芯片可直接用于自身云服务,验证芯片性能的有效性,使得客户从设计之初便被确定。此外,考虑到 ARM 处理器是需要生态支持的,鲲鹏计算产业和 Pelion IoT 平台的成立,即总结了之前的经验,通过生态共同建设,推进 ARM 处理器发展。
ARM 框架优势:低能耗,移动市场的高占比满足异构性
ARM 架构选择具有三点显著优势:低能耗、并发处理优势和云端同源需求。
1) 低能耗。由于超/大型数据中心的建立往往会受到能耗限制,致使市场对高效率、低成本、低能耗的绿色计算需求越来越强烈,也给绿色计算产业带来前所未有的发展机会。“降低数据中心的耗能,并且提高相同空间的计算力密度”是 ARM 架构下处理 器的一致追求,且从现有的 ARM 处理器看,同等测试条件下的低能耗是其核心优势。
2) 更优并发处理效率。以 Arm 为代表的 RISC 通用架构处理器,在分布式数据库、大数 据、Web 前端等高并发应用场景下,因单芯片核数更多相比传统处理器拥有更好的并 发处理效率。
3) 云端同源带来的 ARM 架构需求。移动终端正在快速取代传统 PC 在终端市场中的地 位。根据 IDC 数据显示,移动终端在全球终端(包括个人电脑、平板电脑和智能手机) 出货量的占比由 2010 年的 44.7%上升到了 2018 年的 77.6%,预计到 2023 年将超过 80%。而绝大多数移动终端采用 Arm 架构的处理器,移动应用主要基于 Arm 指令集进行开发、测试和运行。因而为了降低应用开发者在异构环境下进行二次开发所造成的性能损失和潜在漏洞风险,以及随着这些海量移动应用向云上迁移,端云协同将成 为主流,端云的架构相互影响渗透,并将逐步走向趋同,这点上 ARM 具有优势。
基于手机芯片技术+华为云自身需求,双重动因推进 ARM 框架芯片研发
从技术路线、成本、市场需求、利润、现存问题的解决方法五个角度分析,看好当前华 为推出 ARM 服务器。
技术路线:华为完成从手机业务+手机芯片+服务器业务+服务器技术进化到 ARM 服务器 业务+ARM 服务器芯片的技术发展路线。对比之前研发 ARM 服务器失败的公司,华为通过 手机业务分摊 ARM 服务器的研发成本和自身消耗服务器实现客户需求的自我验证,是其研发 ARM 处理器的优势。例如 HP 也研发过 ARM 服务器,但是没有庞大的手机芯片分摊 CPU 的 研发成本;高通也研发过 ARM 服务器芯片,但是除了芯片以外,没有服务器技术,且自身运 营策略出现问题。
成本:庞大的产品体系和诸多 BG 分摊研发成本。考虑到服务器所用 SSD 控制器,网络 背板,PCI-E,SATA 等属于服务器通用技术。理论上不需要单独的 ARM 服务器研发部门支 付,因而上述通用技术的研发成本可由华为的不同 BG 负担,并在华为服务器、交换机等硬件销售利润中进行对冲。此外,研发 ARM 芯片的核心成本是 Ares 内核和外设控制电路的研发成本。考虑到华为自身同时研制手机芯片、路由器芯片、交换机芯片等,以鲲鹏芯片为代表的 ARM 芯片的研发成本或比其他专做 ARM 服务器芯片的厂家的成本要低。
市场空间:1)早期考虑政府和八大行业的替换采购需求,即前文所说的 500 亿市场规模。2)考虑 APP 运用开发商对 ARM 服务器测试 APP 的市场需求,则市场空间有望继续上涨。目前手机 APP 的开发市场非常大,除了华为研发的应用和其生态下的应用,还有其他厂家的 手机 APP 和游戏 APP。考虑开发兼容和减少转化底层开发架构的工作,如果华为后续的 ARM 服务器可将手机芯片和服务器芯片拉通,且若华为出售的 ARM 服务器整体方案不比 X86 服务 器的方案贵,则 APP 开发商将乐于采购 ARM 服务器。
利润:1)鲲鹏 CPU 的毛利润约为 50%-60%,净利率约为 20%-30%。参考近三年英特 尔、英伟达、高通、赛灵思和迈威尔等主流 IC 设计企业毛利率主要落于 50%~60%区间,净利 润率约为 25%-30%左右;2)考虑华为之前需要外采 X86 服务器来测试手机 APP,替换为自 身的 ARM 服务器后,将节约掉虚拟机、模拟器的开销,以及不能进行原生性软件测试所带 来的各种开销;3)政府补贴。
现存问题的解决方法:1)缺少软件生态:建立鲲鹏计算产业,早期对伙伴企业进行补贴, 后期让利市场空间,吸引优秀 ISV 进行软件生态的建设;2)缺少客户:早期华为自产自用, 现成立鲲鹏产业后可通过伙伴企业帮忙建立销售渠道,进行销售。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2263期内容,欢迎关注。
★手机芯片往事
★全球IP厂商TOP 10排名:后来者虎视眈眈
★国产FPGA跨入28nm,意味着什么?
东南亚芯片|传感器|IGBT|SiC|MLCC|中兴|腾讯|半导体股价|芯片测试