您现在的位置: 首页 > 资讯

新一代国产超算系统将完成升级

2024年12月03日 来源:南方日报

[ ]

  随着数字化转型加速,存储、算力和人工智能已成为推动新兴技术发展的核心力量。12月1日,记者在首届CCF中国存储大会上获悉,国家超算广州中心的新一代国产超级计算系统“天河星逸”即将完成升级,在通用CPU计算能力、存储能力等多方面实现倍增,可以满足人工智能大模型训练等多种应用场景的需求。

  人工智能成为存储产业发展新引擎

  存储和计算、网络是信息基础设施运行的三大支柱。当前,我国存力生产总量较大,未来需求会持续增长。中国信通院云大所副主任马鹏玮介绍,2021年至2023年,我国存力规模稳步发展,2023年增速约20%,存力总规模达到1200艾字节。

  存储规模的持续扩大,与人工智能的飞速发展休戚相关。在马鹏玮看来,伴随人工智能进入竞速跑阶段,“数据要素”和“人工智能”已成为存储产业发展的新引擎。

  一方面,数据的爆炸式增长以及应用的迅速发展,对存储系统提出了可扩展、高可靠、高性能的要求。另一方面,中国工程院院士孙凝晖表示,AI计算特别“吃”算力,大模型对存储容量与访存带宽的需求在不断增加,这为存储及算力领域带来了前所未有的挑战,“高性能、高可靠、高安全、高效能的存储底座显得尤为重要。”

  如何应对AI带来的存力挑战?中国科学院院士、北京航空航天大学教授钱德沛提出了“For AI”的解法:算力网要提供更多、更强的面向AI的计算资源,发展GPU、AI加速器、深度学习处理器等高效支持AI应用的硬件,并与计算范式、模型、算法等实现软硬件协同。

  启动超智融合生态合作共建计划

  随着AI大模型参数量的快速增长,存力、算力支持是否足够成为关键。“我们研发了华为存储超节点OceanStor A800,相比之前的存储服务器集群,存储性能提升了10倍,能支撑超10万卡算力集群,助力AI持续发展。”华为北京研究所所长常胜介绍,AI时代,数据存取特征和使用方式发生了本质变化,需要新的存储范式与系统架构。

  粤企正在积极行动。腾讯云混元大模型负责人王迪介绍,腾讯云开发了全栈自研的Angel机器学习算力平台,在通信设备、存储效率与构造等方面均实现了突破。

  存力及算力的提升,仅靠企业探索还不够,区域算力基础实力也尤为重要。近年来,粤港澳大湾区作为我国经济活力最强、开放程度最高的区域之一,积极响应国家“东数西算”战略,加快一体化算力网络粤港澳大湾区国家枢纽节点建设。

  开幕式上,国家超算广州中心与多家科技企业启动“超智融合生态合作共建计划”,将加速超算技术创新和产业落地。国家超算广州中心主任卢宇彤介绍,今年以来,该中心的超智融合算力全面升级,应用支撑环境不断完善,多领域创新应用成果持续涌现。

  记者还从大会上获悉,国家超算广州中心的新一代国产超级计算系统“天河星逸”即将完成升级,在通用CPU计算能力、存储能力等多方面实现倍增,可以满足人工智能大模型训练等多种应用场景的需求,进一步提升广州超算中心的多领域服务能力。

  (记者 曾良科 昌道励)

扫一扫,分享到微信朋友圈