作者 | 香草
编辑 | 漠影
智东西11月21日报道,11月15日,知名行研机构IDC发布了《液冷数据中心白皮书》,曙光存储为华南理工大学打造的液冷存储系统,作为 业内首个也是唯一一个成功部署的案例入选。
白皮书指出,随着IT基础设施中芯片不断升级迭代、高性能芯片需求不断增加、服务器密集化程度越来越高、存储器容量越来越大,数据中心这个能耗“大户”,在“双碳”背景下实现低碳绿色转型迫在眉睫。
在此背景下,采用比风冷技术更节能、更灵活的液冷技术并全栈布局成为必然的趋势。
然而,液冷技术的落地并不容易,面临着缺乏统一标准、改造成本高、系统难维护等难题。尤其是液冷存储方面,在整个市场的占比几乎只有2%。
曙光存储在此次案例中 成功部署近25PB液冷存储,基本完成全栈液冷数据中心建设,实现 同等规模下性能提升100%、 数据中心PUE(电源使用效率)<1.2、 电费节省60%等显著成效,填补了行业空白。
那么,曙光存储提供的解决方案具体具备哪些优势?曙光存储为什么能成为首个落地液冷存储的厂商?算力需求不断飙升的场景下,行业对数据中心提出了哪些需求?曙光存储的案例能为其他厂商提供哪些参考?智东西与少数媒体对话了IDC高级分析师杨昀煦,试图找到这些问题的答案。
一、PUE降至1.2以下,三大优势实现能耗、成本、性能平衡
杨昀煦告诉智东西,在旧数据中心的液冷化改造上,由于要考虑机柜硬装、建筑物承重等改造成本,一般会比新建数据中心成本要高。
华南理工大学的数据中心于2019年建成,其PUE测算在1.4-2之间,耗电量巨大。数据中心改造规模较大,存储节点超过20个,存储容量扩展接近25PB,对成本的控制也是一个难题。此外,改造后的数据中心性能也要得到保障,需要寻求能耗、成本及性能之间的平衡。
面对这些挑战,曙光存储具备三大优势,能够从三个方面满足用户的需求。
能耗方面:冷板散热,软件调优。
据悉,该解决方案采用曙光ParaStor液冷存储系统,实现冷板散热与存储技术全面结合,散热效率相比原本的散热片提高3000倍。
▲曙光ParaStor液冷存储系统(图源:曙光存储)
在软件方面,积极采用数据重删压缩等技术进一步减少设备数量、降低系统功耗。测试显示,存储节点PUE值可降至1.2以下。
成本方面:存算一栈式,覆盖全生命周期。
由于曙光ParaStor液冷存储系统与曙光液冷服务器同源,二者可形成“存算一栈式”液冷方案,便于数据中心基础设施的统一规划、设计和共用,降低成本。
在提供全栈式液冷数据中心解决方案时,曙光可以覆盖数据中心建设的全生命周期,实现液冷数据中心端到端交付。从冷却塔、管路等基建开始就将液冷系统的安全部署考虑在内,并为未来的扩容做好准备。
性能方面:无风扇设计,超静音无震动。
传统风冷方案由于风扇的存在,面临元器件震动风险,而液冷技术的天然优势就是无风扇设计,可为硬盘提供超静音且无震动的工作环境,从而提高读写性能及稳定性。
此外,针对冷板漏液风险,曙光存储系统在内部设置多个监控点实时监测,通过漏液导流结构、漏液检测装置、温度监控装置,在发生漏液、冷板堵塞、断液、超温等故障问题时自动报警,可有效保障系统不遭受漏液风险。
二、部署经验足、技术积累多,首个液冷存储落地填补行业空白
在全栈式液冷数据中心赛道中,有不少厂商都在积极部署,为什么曙光存储能够打造首个成功落地的案例?
杨昀煦告诉智东西,首先,从传统数据中心角度来看,曙光有比较强的部署经验,包括存力、算力、整体数据中心解决方案方面,其具有液冷技术大规模商业化落地的基础,也具备技术快速迭代和创新的土壤。
其次,曙光有专门的品牌和技术路线进行液冷化部署的自主研发,在IDC的液冷服务器数据中,有很多数据来源都是曙光旗下品牌客户的部署和落地。
最后,生态方面也是其优势之一。曙光拥有从液冷配套基础设施、液冷计算服务器、存储硬件设计到软件系统研制的完善生态体系,因此具备快速定制产品和整体方案的能力。
作为参考案例,在部署液冷数据中心的时候,曙光存储广泛地将所有硬件系统都进行了冷板液冷化部署,从项目前期咨询、整个技术落地,甚至到建筑物的加固,都是曙光存储进行负责。
谈到曙光存储的案例为行业带来的全栈式参考价值,杨昀煦称,不同的场景对数据中心的需求有所区别,在面对电信行业、政企、工业行业等不以IT部门为主的传统行业时,客户在部署过程中有很多疑问,如果能够在前期给他们提供一些建议,从设计之初到最后部署都能有所帮助。
作为业界首个成功落地的液冷存储案例,曙光存储在华南理工大学部署的数据中心规模大、效果好。一方面,在计算之后,占数据中心能耗35%以上的存储也有了产品方案,填补了全栈液冷方案重要一环;另一方面,在成功进行大体量落地后,行业可以放心地进行规模化复制部署。
三、市场需求倒逼液冷全栈式升级,曙光存储补上最后一块拼图
现如今,随着人工智能(AI)、边缘数据中心等计算场景的落地,IT硬件基础设施中的芯片密度越来越高,越来越多的使用者将资金投入由通用算力向AI智能算力转变。以异构计算单机柜功耗为例,需求已上升至15-50KW,而传统风冷机柜功耗一般在3-10KW,无法满足需求。
同时,在“东数西算”等国家重要战略布局的推动下,西部地区大力发展数据中心产业,打造数据底座,存储容量占比超过23%。中部、东北部地区数字发展起步较慢,存储规模仅占全国的不到17%。全栈式液冷数据中心能够无视海拔和地域等环境影响,实现高密度配置,提高数据中心的运算效率。
在这样的行业需求下,数据中心需要全面升级来应对挑战。
作为数据中心的最优解,液冷技术一方面有降低能耗、节省成本、低噪音稳定等优势,另一方面也能完美适配推陈出新的各类先进计算设备、存储设备、网络设备,可以成为一套全栈解决方案。
IDC白皮书提到,预计2022-2027年,中国液冷服务器市场年复合增长率将达到56.6%,2027年市场规模将达到96亿美元。但在2022年,中国液冷服务器数量不到服务器总量的3%,渗透率在10%左右。
自2023年至今,主流IT设备厂商均已公开表明将加大研发力度并加快产品迭代速度,这也将加速液冷在数据中心的规模化落地。曙光存储的ParaStor液冷存储产品将液冷方案与存储技术结合,形成“存算一栈式”液冷方案,在提高运维效率的同时,助力数据中心部署更便捷。
结语:全栈式需求下,液冷存储迎来机遇期
虽然液冷技术已经在降低数据中心的能耗和散热方面展现出了显著的优势,但如何进一步提高其性能,实现性能、能耗、成本的三元平衡仍然是一个巨大的挑战。
曙光存储凭借丰富的部署经验、长期的自主研发积累以及全面的生态建设,打破了“不可能三角”,平衡了三个方面的需求,为行业提供了优秀的可复制案例。
但目前,液冷技术的研发和应用仍然处于初级阶段,需要更多的技术突破和创新。在算力需求、“双碳”“东数西算”政策等推动下,液冷存储将迎来快速发展的机遇期。