本栏推荐

相关阅读

快讯信息

您现在的位置是:主页 > 品牌 > 阿里巴巴 >

阿里巴巴推出全球首个超算中心:每秒1200亿亿次运算能力,支持1000卡并行处理

发布时间:2022年08月30日 20:54:56 阿里巴巴 人已围观

简介8月30日,阿里云发布了全栈智能计算解决方案“飞天智算平台”,并启动了两座超大规模智算中心。这些中心旨在为科研机构、公共服务和企业提供强大的智能计算服务,以应对AI时代的...

8月30日,阿里云正式推出了其全新全栈智能计算解决方案“飞天智算平台”,并上线了两座超大规模的智能计算中心,旨在为科研、公共服务和企业提供强大的智能计算支持。

飞天智算平台是基于阿里巴巴内部的实践经验而开发的,新建的超大规模智算中心都基于此平台,提供公共云和私有云两种服务模式。

位于张北的智算中心,其AI算力最高可达12EFLOPS(每秒1200亿亿次浮点运算),云端支持AI预训练大模型、AI Earth以及数字人等前沿AI应用,成为全球最大的智算中心。

乌兰察布智算中心的算力为3EFLOPS(每秒300亿亿次浮点运算),位于“东数西算”内蒙古的关键节点,采用了自然风冷和AI调温等环保技术,致力于实现绿色低碳。

飞天智算平台依托先进的技术架构,将千卡并行计算效率从传统的64%提升至90%,算力资源利用率增长超过三倍,AI训练效率增加11倍,推理效率提高6倍。

在网络技术上,采用高性能RDMA网络,端到端延迟最低可至2微秒。

在通信技术方面,自主研发的无阻塞通信技术使得计算过程中的数据交换速度提升超过5倍。

在存储技术上,自主研发的IO加速器提升了数据存取性能,最高可达10倍。

大数据AI开发平台提供分布式训练框架,并通过API实现分布式策略的自动组合与调优,训练效率提升超过11倍。

一站式AI计算开发服务支持对算法模型进行量化、剪枝、稀疏化和蒸馏等操作,推理效率提升超过6倍。

此外,该平台可运行在多种类型的处理器服务器上,包括x86、GPU、ARM等,实现“One Cloud Multiple Chips”,支持多处理器的混合部署与统一调度,同时可进行应用优化,部分性能提升可达100%以上。

通过技术减排、能源结构优化、区域布局优化、供应链减碳和资源利用优化等五个方面,平台有效降低了单位算力的碳排放,利用液冷、电源技术以及智能运维等手段降低能耗,PUE最低可达到1.09。


阿里云浸没式液冷集群

目前,飞天智算平台已经在阿里旗下得到了广泛应用,为达摩院的前沿AI研究和电商智能技术研发提供支持,同时服务于小鹏汽车、深势科技、上汽集团、中国气象局、南方电网等多家机构与企业,显著提升了自动驾驶、新药研发、气象预测及工业能源等领域的AI训练效率。

Tags: 阿里巴巴  阿里云