“液冷王者”曙光数创赋能数据中心绿色发展

2023-12-11 08:21:48 来源:上海证券报 作者:王子霖

 

记者:王子霖

视频拍摄、制作:史丽 安然

制片:梁敏 杨升

  曙光数创副总经理 张鹏 记者 史丽 摄

  编者按

  它们聚焦主业,用“专精”的劲头创造“特新”的产品;它们勇辟“新赛道”,敢闯“无人区”,突破制约发展的关键核心技术,是产业链供应链不可或缺的重要组成部分。

  在北京证券交易所这块“创新型中小企业主阵地”上,它们通过千万锤成一器的专精专注,“惟进取也,故日新”的求新求变,以及更上一层楼的远见胸怀,践行着中小企业能办大事的殷殷嘱托。

  术业有精,小亦不凡。近期,上海证券报联合北京证券交易所开展了以“搭建沟通桥梁、挖掘成长价值”为主题的调研活动,即日起推出“北交所万里行”全媒体系列访谈,带领投资者走进北交所上市公司,了解中小企业经营发展现状,传递企业创新成长价值,挖掘“小巨人”创造“大能量”的潜力。

  2022年,全国数据中心总耗电量约2700亿千瓦时,占全社会用电量的3.1%,超过两座三峡水电站年发电量。数据中心绿色化转型成为亟待解决的课题。

  然而,在数据中心庞大的能耗之中,仅有一半左右用在了芯片“计算”上,冷却系统、供配电系统等非IT能耗的占比高达40%左右。特别是在如今的大模型时代,“暴力计算”给芯片散热带来了更大挑战。正所谓计算量越大,散热消耗的电量越大,在“降碳”的背景下,如何在算力与散热之间“博弈”,成为数据中心的一个现实问题。

  北交所上市公司曙光数创给出了答案。作为一家致力于解决服务器散热难题的创新型企业,曙光数创深耕行业20余年,在服务器液冷系统、液冷数据中心解决方案的技术水平处于行业领先地位。来自赛迪顾问的统计显示,2021年至2022年及2023年上半年,曙光数创以平均58.8%的市场份额,位列中国液冷数据中心基础设施市场部署规模第一。

  近日,北交所万里行调研团队走进我国液冷赛道领军企业曙光数创,公司副总经理张鹏向上海证券报记者分享了公司的核心优势。

  优势明显

  液冷将成服务器散热“最优解”

  “芯片制程的摩尔定律认为,当前集成电路上可容纳的晶体管数量大约每隔18个至24个月,性能就会翻一番,芯片功率也会随之不断增加。”张鹏表示。

  如今,在算力升级大趋势下,AI服务器渗透率快速提升。特别是在大模型训练等特殊场景下,超频计算的处理器将进一步提升服务器功耗。例如,用于训练ChatGPT的英伟达A100服务器的最大功耗已达6.5kW,而训练单个GPT3.0模型预计需要1000台以上的6.5kW的AI超算服务器,逻辑推理阶段的功耗又是训练阶段的数倍。

  “芯片温度每升高10℃,故障率就会翻倍,寿命也会减半。散热已经是当前智算面临的最大问题之一。”张鹏表示,“在‘东数西算’‘双碳’的大背景下,不断提升的功率密度和PUE(能效指标,越接近1越优)设计要求已成为行业面临的主要问题,液冷技术具有高密低碳等优势,已经成为应对数据中心散热压力和节能挑战的必由之路。”

  在张鹏看来,液冷比起风冷等传统散热方式,在节能性、成本、节地、CPU可靠性、机房环境等维度存在明显优势。液冷从根本上解决了服务器风冷散热不足的安全隐患,为数据中心用户提供精确制冷、高效散热、节能降耗、静音低噪等全方位的解决方案。

  “液冷对于芯片使用者更重要的一点,是它可以挖掘芯片的潜能,我认为这是液冷本身最大的价值,也是用户对液冷青睐的重要原因。”张鹏表示,芯片的运行主频越高,则CPU处理数据的速度越快、算力越大。

  据介绍,当芯片主频变高之后,耗电量提升的同时,会产生大量热量。在供电充足、散热降温足够的前提下,客户的芯片能够在更高的主频下使用,进而充分激发芯片潜能。

  需求旺盛

  市场渗透率有望提升至30%以上

  张鹏认为,数据中心液冷化是未来发展的大趋势,但目前受制于机房适配、行业标准不匹配等外部原因,液冷技术的落地仍面对一些问题。“目前每200台服务器,大概只有5%至8%的比例使用液冷,市场替代空间非常大。此外,叠加数据中心需求量的稳健增长,行业有着极大增长潜力。”张鹏说。

  在张鹏看来,随着下一代CPU、GPU功耗的提升,再加上“双碳”节能减排相关要求,液冷的渗透率未来3至5年内有望达到30%,行业也将迎来爆发性增长。多部门发文,2023年6月起数据中心PUE不高于1.4,2025年起不高于1.3,当前行业平均PUE为1.5。更多的地方政策,对数据中心提出了更加严格的要求。

  “液冷并不是万能的,并不适用于所有工况。”张鹏直言,现阶段,高功率的服务器和高功率的芯片主要适合液冷散热,功率相对较低的工况仍是风冷的主要使用场景。但展望未来,液冷的市场渗透率一定会超过30%。

  北京某平台型IT企业向记者介绍,公司旗下的一个数据中心,为避免GPU服务器温度过高,只能进行疏密,原计划的200余个机柜被迫降至不到100个,而另一个启用了液冷散热的数据中心,空间利用率不仅得到大幅提升,能耗水平也有了显著优化。

  张鹏介绍,曙光数创深耕于制冷行业多年,2011年开始做液冷研发,2016年实现冷板式液冷服务器批量生产,到如今已有多年的液冷大规模商用经验。值得一提的是,公司还率先掌握了浸没相变液冷技术,并成功实现产品化。

  技术引领

  持续推动数据中心绿色化发展

  “我们最早的液冷数据中心在2015年落地,到现在已有8年的运行时间,这是公司的先发优势,也是核心竞争力之一。”张鹏介绍,曙光数创早在2011年就将数据中心和服务器的冷却作为技术攻关的方向并开始研究。2015年,公司的冷板散热解决方案正式推出。

  据介绍,截至今年6月底,曙光数创参与建设的液冷数据中心规模已经有260兆瓦,累计运行时间也居行业前列。曙光数创的另一大核心竞争力,是公司的先进制造优势。10月27日,曙光数创(青岛)产业创新基地启动仪式在青岛举行。

  作为全国最大的液冷数据中心全链条产业创新基地,曙光数创(青岛)产业创新基地由研发中心、生产中心和保障中心三部分组成,拥有国内唯一兆瓦级液冷基础设施实验室等七大研发创新实验室和四条先进生产线。基地实现了从服务器到基础设施、从机房外到机房内、从硬件到软件的全链条、一站式、系统级液冷数据中心解决方案创新研发和生产。

  “为了满足客户对成本的要求、对质量的把控,我们下定决心自建生产线,所有核心产品自己生产。”张鹏表示,公司坚持核心液冷产品实现100%的自产率,这是曙光数创另一个核心优势所在。

  “我们永远在创新,曙光数创的持续创新和研发投入都是希望让数据中心变得更好,为‘数字中国’保驾护航。”张鹏告诉记者,公司去年北交所上市时的全部募资都用于产品研发,公司六成以上的人员都是技术人员,四成以上都是研究生以上学历。目前,在北京、天津和青岛总共有11个实验室,不断促进公司的技术创新和产品开发迭代,推动行业高质量发展。