神州鲲泰推出全新智算架构及硅光+液冷整机柜,破解多云异构绿色智算难题

在数字经济时代,算力资源已经成为新的“能源”,为人工智能、云计算等等科技界前沿领域持续供能。5月9日,数云原力大会2024在神州数码国际创新中心(IIC)盛大召开。在开幕式上,神州数码副总裁、神州数码信创控股董事长韩智敏重磅发布新一代神州鲲泰绿色异构智算中心全液冷整机柜新品,在异构智算的时代,通过软硬件协同创新,为客户提供性能强、能效高、节能环保的新选择。

66441fc9e93f6

神州数码副总裁、神州数码信创控股董事长韩智敏

异构智算时代,企业智算落地如何兼顾效率与成本?

我们迎来了一个全新的异构智算时代。在当前的算力环境下,多云异构智算基础设施已成为必然。异构算力资源如何得到充分利用?在混合云部署下,如何应对算力构建选型、部署、运维复杂度和难度的挑战?这个独特的“智算攒机时代”,正在呼唤全新的智算架构。

与此同时,随着大模型和生成式AI加速落地,大量的模型训练和推理任务,在唤醒底层算力海量需求的同时,也对资源利用率提出了巨大挑战。有关资料显示,OpenAI训练GPT-4的MFU(Model Flops Utility)在32%到36%之间。而目前行业MFU利用率的平均水平仅为30%~40%,智算资源利用率尚有很大的提升空间,利用率提升也将为企业节省大量成本。

能耗是另一个大的挑战,算力本身会成为主要的能耗和二氧化碳排放来源。明显可预见的就是,GPU的能耗本身是CPU能耗的2倍以上。根据MIT研究表明,未来人类需要为人工智能相关应用新增10%的能源需求。也就是说,“炼”大模型会比炼钢还费电。对于一个企业来说,每新增一个用于智算的机架,其运行一年约等于增加15w度电,约等于100个家庭的年用电量,约等于1.5吨二氧化碳排放,能耗和碳排放十分巨大。

尽精微,神州鲲泰异“双管齐下”提升算力资源利用率

神州鲲泰推出HISO异构智算调度运营平台、HICA异构智算加速平台,有效解决智算集群间以及集群内面临的复杂异构兼容问题,并显著提升算力资源的利用率。

HISO异构智算调度运营平台基于云原生技术,整合GPU硬分片和虚拟分片技术,能实现GPU资源虚拟化或池化,完成跨集群之间的算力调度。根据用户业务需求,该平台可以在整个异构智算资源池中匹配优选算力组合,提升GPU服务器集群的资源使用率。HISO异构智算调度运营平台拥有将国内外GPU资源混合组网、混搭调度,算力精细隔离等关键能力,可以“像管理一台GPU主机一样,管理和调度多个集群的GPU资源”。通过GPU容器直通、IaaS卸载,该平台加速了模型加载时间,相比传统方式,模型加载速度提升3倍。同时还能实时收集智算中心全栈、全链路指标,发现和定位软硬件故障,实现算力可观测性。

HICA异构智算加速平台则着重解决集群内部的算力调度优化问题,通过屏蔽集群内底层算力生态差异,突破关键计算效率瓶颈,有效提升算力利用率与可用性。HICA异构智算加速平台通过自研的服务层、中间适配层以及调度编排算法,采用数据并行、模型并行等方式,把并行计算任务进行有效分解,匹配相应的软件栈和算力资源来承接。当GPU资源变化,该平台可以实时动态调度计算子任务并调整模型拓扑和架构,以充分聚合各种算力资源。

HICA异构智算加速平台具有一云多芯特性,支持国内外主流AI芯片,可实现训练推理任务在不同品牌、不同型号芯片组成的智算集群中的混合训练推理,预计可降低20%闲置算力。

此外,根据不同模型、不同算子之间集合通信流特点,该平台还可自适应选择最合适的通信参数,达到更高的通信效率。同时,在不同模型运行过程中,充分考虑存算比要求的不同,HICA异构智算加速平台还可从宏观到微观多个尺度选择最合适的存算比资源加载模型,加速吞吐,降低时延,使MFU提升10~20%,MBU提升5%。

硅光+液冷,一体化交付冷却跳动的电表

随着生成式AI落地对算力需求的暴涨、带宽的狂飙提速,智算中心节点的高能耗痛点日益加剧。而以一个万卡智算中心为例,采用200G接口互联,需要约80000个光模块,其互联所需的能耗则占到总体的5%。节点间互联的高能耗问题也日益凸显。

针对节点间互联的能耗问题,神州鲲泰采用硅光技术,通过单光源多调制器,降低调制器电压,同时采用分布式反馈激光器等一系列技术,有效降低25%的互联能耗。

同时,针对节点的能耗问题,神州鲲泰推出液冷服务器,通过一体化冷板,智能流量调节来提升系统的散热效率,采用负压管线系统,漏液近端探测技术,并联动服务管控系统提升冷却系统的可靠性,有效降低30%的节点能耗。

而为了帮助客户规避接口多、接头复杂、现场实施部署难度大、实施周期长等难题,数云原力大会2024开幕式上,神州鲲泰正式发布“KunTai Pod2000全液冷整机柜”方案产品。采用一体化交付方式,有效降低部署和运维的复杂度的同时,整机柜还能实现100%全液冷及高性价比液冷方案,助力数据中心PUE迈向1.15,并且凭借60KW+的最大单柜功率,实现1.5倍于行业平均水平的能效比,在为客户提供强打算力的同时有效控制能耗成本。

66441fca2de34

随着2022年底ChatGPT的问世,AI正成为推动创新的核心引擎。现在的IT基础架构已经到了一个由模型和算力相互促进,螺旋上升的新发展阶段。面对新的发展机遇,神州鲲泰从智算中心系统整体性能提升出发,提出了走新智算架构之路的策略,建立了高通量、高并行、高效率,低能耗的多样化智算架构。新的智算架构能够快部署、低投入地突破算力瓶颈,构建出性能更优、成本更低、能效更高的智算中心。未来每个智算中心,每台计算机都将是这样一种新的智算架构,从而实现算力的普惠。

本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。:https://news.jueqijf.com/6471.html

(0)
上一篇 2024年5月16日 上午7:46
下一篇 2024年5月18日 下午4:39

相关推荐

  • 云畅推播机无人直播常见的几种存在形式

    无人直播通常表现了三个常见内容 一、音乐号 (1)音乐播放:通过播放各种类型的音乐来吸引观众。可以是流行音乐、古典音乐、摇滚音乐等,总之根据自己受众的喜好、需求进行选择。 (2)音…

    6天前
    0
  • 技能培训新篇章,十方影视后期引领行业创新潮流

    随着影视产业的快速发展,对于专业影视后期人才的需求也日益旺盛。在这样的背景下,十方影视后期以其卓越的教学成果和行业影响力,成为了众多想要涉足影视后期领域的学员的首选品牌。 作为十方…

    2023年10月30日
    0
  • 万视巡播机无人直播——现代黑科技的产物

    随着现代科技的不断发展,无人直播项目开始崭露头角,成为人们备受关注的创新技术。 万视巡播机作为一款专注提高直播效率的工具。在功能分化上更是所向披靡——无需真人主播讲解,仅一台电脑加…

    2024年5月15日
    0
  • 达人导播工具-视频互动率如何提升?

    视频互动率是衡量视频受众参与度的重要指标,对于视频创作者和品牌来说,提高视频互动率可以增加受众的黏性和参与度,从而提升视频的传播效果和品牌影响力。以下是一些提高视频互动率的有效策略…

    2024年6月8日
    0
  • 氧化镁量身定做,镁神科技开发新产品300余项,应用行业超百

    随着科技的飞速进步和行业的多元化发展,量身定制已成为企业满足客户需求、提升产品竞争力的关键。河北镁神科技股份有限公司(以下简称“镁神科技”),作为全球镁质新材料应用研发定制领跑者,…

    2024年4月23日
    0
  • 达人导播工具-小红书怎样不被限流

    小红书是一个非常受欢迎的社交媒体平台,让用户可以分享生活经验、购物心得和旅行见闻等内容。然而,最近一些用户反映他们的笔记在发布后不久就被限流了,无法被其他用户看到。为了避免这种情况…

    2024年6月14日
    0
  • 未来新能源 推动“双碳”达标

    ——记中国工程院院士 彭先觉 在传统的高碳能源难以为继,亟须新型清洁能源的当下,Z-箍缩驱动聚变裂变混合堆将会是未来规模能源的主力。这一研究成果正是源自于我国著名的原子核物理学专家…

    2024年1月8日
    0
  • 安心于道苦修冥想,体脑兼勤一意孤行

    ——华中师范大学吴安心教授的教研路 山大林秀养异兽,水深色蓝育巨鳞!美丽而神秘的湘西,不断涌现出无数杰出的儿女,民国首位总理熊希龄,开国元帅贺龙,文学大家沈从文,画坛怪杰黄永玉,两…

    2024年5月10日
    0
  • 万视巡播机你对无人直播了解多少?它是真的好做吗?

    一、直播间的搭建准备工作 因为不用露脸出镜,所以不会涉及专业的真人主播,并且这种无人直播间都是自带互动效果的,所以观众会对这些自带定制属性的商品都抱有强烈的好奇心和喜欢感。即使是新…

    2024年5月30日
    0
  • 清火龙工具-哪个短视频带货更赚钱?

    目前,视频号和小红书正在加速商业化进程,抖音一直不断推广。视频号的月活跃用户已经超过 6 亿,小红书的月活跃用户达到了 2 亿,而抖音则达到了 9 亿。可以看出,它们在用户规模上都…

    2024年4月19日
    0