来自 科技 2019-11-30 21:22 的文章

国产AI训练集群进入超算领域 相当于50万台PC算力

被称为“国之重器”的超算技术正在开启国产替代的步伐。在新技术架构的窗口期,如何更快构建超算良性生态系统,寻找新一代计算平台的落地方向,正成为重要课题

李娜

被称为“国之重器”的超算技术正在开启国产替代的步伐。在新技术架构的窗口期,如何更快构建超算良性生态系统,寻找新一代计算平台的落地方向,正成为重要课题。

11月29日,鹏城实验室与华为在深圳共同发布鹏城云脑Ⅱ一期项目,正式开启千E级AI集群应用。据悉,鹏城实验室是广东省启动建设的首批4家省实验室之一,主攻方向与人工智能紧密相关,研究重点包括网络通信、先进计算、网络安全等。

中国工程院院士、鹏城实验室主任高文在接受包括第一财经在内的媒体采访时表示,鹏城实验室将着力解决中国AI开源开放平台之短板,而补短板要从开源开放平台开始。鹏城实验室针对开源开放共享创新平台推出鹏城云脑,云脑一期工程100P算力的大型集群系统已出具规模,云脑二期将建成的是E级AI大科学设施,用以支撑构造更好的AI生态。

据悉,当今业内顶尖的AI集群一般还停留在百P级FLOPS的水平,也就是每秒十亿一次的计算能力,但随着算法和需求的不断发展,将来必将扩展到E级FLOPS,(1 EFlops,百亿亿次计算,每秒钟可执行 1018 次双精度浮点计算 )也就是每秒百亿亿次计算能力。

“现在的计算机可以破掉128位的密码,但人工智能起来之后,大量的数据进去,训练一些模型出来,更多的是在做矩阵运算,数据越大的时候需要的算力就越强。”高文对记者说。

随着AI算法和需求的不断发展,算力不足、训练时间长一直是困扰人工智能领域的主要矛盾,而造成这一问题的一个主要原因在于算力的供应垄断在少数厂商手里。

“过去我们接触的数字世界是建立在英特尔、英伟达、微软这些公司上,华为希望提供第二种选择。”华为Cloud AI产品与服务总裁侯金龙对记者表示,Atlas 900是当前全球最快的AI训练集群,能为各行各业提供充足的AI算力,打破算力垄断。该集群基于数千颗华为自研的昇腾910AI处理器,相当于50万台PC的计算能力。

华为智能计算业务部总裁马海旭则补充道,Atlas 900代表了当今全球AI计算的最高水平,它由数千颗昇腾 910 AI处理器构成,打造一套这样的集群系统需要克服芯片设计、组网、散热、软件调度等各方面世界级难题。

“Altas人工智能计算平台产品自今年4月份上市以来,已经与40多家ISV形成联合解决方案,涉及智慧城市、金融、电力等领域。”马海旭说。

对于AI领域的挑战,高文此前曾总结道,中国人工智能的发展面临着“4+4”的局面,有4个优势,也有4个短板。四个优势分别是,强有力战略引领和政策支持,海量的数据资源,丰富的应用场景,大批有潜力的青年人才快速成长。而四个短板则是AI基础理论和原创算法差距较大,高端芯片、关键部件、高精度传感器等基础薄弱,未形成具有国际影响力的人工智能开源开放平台,高水平人才不足。