元宇宙的世界中,虚拟人畅游在数字海洋中追寻着的另一种“生活的”快慰;自动驾驶汽车,不断计算着复杂的路况,优化着新的道路算法;工厂里,中控室的大屏上跳动的数字,呈现着产线上每一处细节的一举一动, AGV小车在既定的路线上往来穿梭 ……
生活与行业的每一个场景,都在被数字化重新定义,而这一切背后,都是算力的支撑,和数据中心不断地演变所带来的成果。
当越来越多的场景需要算力赋予它们变革场景的力量,越来越多的行业,需要算力给予它们走向创新的力量,基于数据中心的技术创新就会倒逼着不断提速。
就如浪潮信息服务器产品规划总监陈彦灵所说,“数实融合正在促进个人生活、企业经营、社会治理、人与自然和谐共生高质量发展。数实融合也面临诸多挑战:场景复杂多元、信息多态交互、决策精准瞬时,同时,也对算力提出了更高的要求。”
而开放计算可以看作是驱动数据中心快速创新的助推器,建立开放社区,通过建标准、建生态,联合产业上下游,围绕开放计算产业共同努力,有助于将数据中心领先的技术普适化,并推动我国数据中心产业的高质量发展。
2011年, Facebook牵头发起了 OCP社区,将 Facebook的一些数据中心设备设计标准公开,希望供应商和其他的 CSP加入进来,构建一个面向 CSP需求的产业生态,从而有效地降低成本,这也是开放计算的起始点。
很明显,开放计算源起于数据中心,并回馈于数据中心,开放计算的崛起和发展,也将有助于解决数据中心当下所面临的一系列挑战。
第一,低碳绿色化趋势。在双碳目标下,数据中心的绿色发展已提上日程, 2021年 7月,工信部印发的《新型数据中心发展三年行动计划( 2021—2023年)》中,明确提出新建大型及以上数据中心 PUE要降低到 1.3以下,而国家枢纽数据中心 PUE要降低到 1.25以下,这意味着中国大部分的数据中心都存在向低碳化改造的过程。
第二,云边端协同部署趋势。 产业的智能化发展,企业的数字化转型,推动了算力部署的多样化。例如,自动驾驶需要数据车载处理,以确保驾驶安全;工业质检需要数据厂端处理,以提升质检效率。这些新应用对算力决策时效提出了更高的要求,也推动了算力靠近数据,算力边缘处理,因此云边端协同也成为未来数据中心部署的新模式。
第三,集中化、规模化发展趋势。 第三方数据显示,超大规模数据中心将从2019年的512个增长到2021年的691个,但数据中心的总数量将从2019年的42.9万个降低到2021年的41.5万个。此消彼长,说明集中和规模化发展的趋势正在形成,同时多、快、好、省将成为超大规模数据中心用户的核心诉求。
在以上三大趋势的要求下,很明显,未来数据中心的发展将会告别过去粗放式的扩张,进入到更为精细化的发展阶段。
数据中心的演进,是一个长期的过程,从粗放到细致,从规模和资源驱动,到技术和能力驱动,在其背后,既是用户需求使然,亦是技术发展到一定程度之后的必然。
陈彦灵说,“数据中心规模的快速增长,正在给全球可持续发展带来新的压力,数据中心的供需双方均有义务实施可降低环境影响的技术,并促进这些技术不断迭代进化。”在此基础之上, 浪潮信息在通过大量用户调研后,凝练出现阶段数据中心需要优化的五大方向。
第一,高效运维。对任何大规模数据中心,人力运维都是不可承受之重。未来数据中心运维效率提升的方向应该是标准化、自动化、可视化以及智能化。建立开放、标准的数据接口和协议,实现平台归一化和安全化;通过自动化运维减少人工操作,提升运维效率;通过数字孪生技术,可以实现运维的可视化;通过智能化手段可以快速定位故障并快速对维修方案进行预判。
浪潮信息构建了标准、开放、智能的运维方案,助力数据中心跨平台高效运维。在硬件管理上,有OpenBMC等开放的管理方案;在监控协议层面,可提供标准的Redfish、IPMI、SNMP等标准协议,管理规模可以达到十万台以上。目前该方案已经在金融、通信、能源以及互联网等多个行业进行了部署。
第二,快速交付。传统单节点交付方式明显无法满足超大规模、大规模数据中心的诉求,如超20万台的数据中心,单节点交付方式根本无法在交付窗口期完成设备交付。而整机柜交付相比传统的交付模式,整体交付效率可以提升5倍。
浪潮信息在整机柜交付方面有多年沉淀和技术积累,从2010年就开始整机柜系统研制和交付工作,目前面向超大规模、大规模数据中心可以提供多种解决方案,通过标准化机柜+标准化服务器可以实现生产即交付,将交付过程中的多个环节前置到生产环节完成,整体交付效率提升5~10倍。
第三,绿色节能。我们知道,PUE受限于数据中心全生命周期的多项指标,每降低0.1都是巨大的挑战。从目前的技术方案来看,通过液冷方式可以把数据中心的PUE降低到1.2以下。
浪潮信息明确提出All in 液冷的公司级战略,并兴建了亚洲最大液冷数据中心研发生产基地,其通用服务器、高密度服务器、整机柜服务器、AI服务器等四大系列产品均支持冷板式液冷。
第四,多元算力。由于计算场景的多元化,计算类型的多样和算力芯片的百花齐放,通用芯片、可定义计算芯片、AI计算芯片并存将是未来产品的主旋律。
在算力多元化趋势下,融合、标准、精准将助力算力设施高效运行。通过硬件重构,构建计算、存储、IO资源池;通过软件定义方式,按照业务感知、按需组合方式可以快速高效的面向图像识别、自然语言处理、大数据、关键计算等场景提供高效算力服务。面向多计算场景,通过标准化+微定制,可以快速满足多计算场景的硬件精准化设计,提供高效、多元、多态的算力设施供给。
第五,云边协同。随着5G、人工智能等技术的发展和与实体经济相融合,云、边、端共存,云、边协同将是未来数据中心的发展方向,面向自动驾驶、智慧城市、工业质检等智慧应用,业务决策也将从传统数据中心走向边、端侧。算力供给方式将走出数据中心,部署到边缘侧,以提供高效、低时延的算力服务。
浪潮信息已形成完整的边缘服务器解决方案,包括边缘盒子、便携式算力、边缘微中心和边缘中心。可以满足近场端AI推理应用、车载算力、质检等AI场景和大数据搬迁场景,以及面向近场的微型数据中心需求。
数据中心的发展,离不开数据中心各技术的创新与迭代。当数据中心的规模越来越大,势必会产生一种向下延伸的效应。换言之,随着数据中心产业的蓬勃发展,由大规模数据中心应用反馈而出的开放计算技术,也会形成各种“组件级”的技术标准,以此来带动众多非互联网客户,助力其他行业的数字化转型。
起源于超大规模数据中心的开放计算技术,在向中小型数据中心和非互联网行业推广过程中面临着较大困难。陈彦灵认为,“这是由于传统行业和互联网行业用户的应用模式和基础设施能力不同导致的。首先可以让行业客户把这些‘组件’先用起来,比如 OCP NIC 3.0的网卡、关联的技术 SAI等等,其次随着开放计算技术的逐渐标准化,我们也会探索出一套适合传统行业的标准框架,比如用标准服务器加标准机柜,来组合成一套可以满足部分整机柜特性的产品,来帮助这些企业提升算力应用的水平。”
开放计算中国社区负责人叶毓睿也表示,在开放计算从超大规模数据中心往下逐渐渗透的过程中,不同规模、领域的用户有不同的适用场景,要看用户采用哪种方式能够降低成本,带来收益,不可一概而论,比如,如果用户体量很小,涉及到制冷、管理、电源等各方面的机房改造会比较困难。而在超大规模数据中心发展开放计算,进行硬件重构技术创新的过程当中,会产生一些设备级或组件级的创新技术,中等或者是小规模的用户可以直接使用,因为这些技术都经过了超大规模数据中心的验证,已成为生态当中的标准组件。
据调研机构 Omdia 预测,非互联网行业在开放计算的市场占比将从 2020 年的 10.5% 增加至 2025 年的 21.9%。电信、金融、游戏、电商、医疗、汽车制造等行业已经或正在尝试部署符合开放计算标准的 IT 基础设施。
很明显,开放计算已经开始由过去互联网用户“独享”的“边缘战场”,升级到千行百业数字化转型的中心战场,开放计算的硬件正在走向标准化和规范化,当开放计算表现出更强的普适属性,开放计算距离传统行业的距离,也可以忽略不计。