您现在的位置是:主页 > 科技圈快讯 > 好文 >
阿里打造全球首个智算中心:每秒处理1200亿亿次数据,1000卡并行运算!
发布时间:2022年08月30日 20:54:56 好文 人已围观
简介8月30日,阿里云发布了全栈智能计算解决方案“飞天智算平台”,并启动了两座超大规模智算中心。这些中心旨在为科研、公共服务和企业提供强大的智能计算服务,推动AI技术的应用与...
在8月30日,阿里云隆重发布了其全栈智能计算方案“飞天智算平台”,并同时启用了两座超大规模智算中心(AI时代的数据中心),为科研机构、公共服务和企业提供强大的智能计算支持。
飞天智算平台基于阿里巴巴的内部应用经验,新的超大规模智算中心依托此平台,提供公共云和专有云两种服务模式。
张北智算中心的AI计算能力达到12EFLOPS(每秒1200亿亿次浮点运算),支持AI预训练大模型、AI Earth及数字人等先进AI应用,是全球最大的智算中心。
乌兰察布智算中心的计算能力为3EFLOPS(每秒300亿亿次浮点运算),位于“东数西算”中的内蒙古枢纽节点,采用自然风冷和AI调温等绿色技术,致力于实现绿色低碳目标。
飞天智算平台运用先进技术架构,将并行计算的效率从传统的64%提升至90%,算力资源的利用率提高超过三倍,AI训练效率提升11倍,推理效率增加6倍。
在网络技术方面,采用高性能的RDMA网络,端到端延迟最低可达2微秒。
通信技术上,自主研发的无阻塞通信技术使数据交换速度提升超过5倍。
存储技术方面,通过自研IO加速器,数据存取性能最大可提升10倍。
在大数据AI开发层,提供分布式训练框架,并利用API自动组合和优化分布式策略,从而将训练效率提升11倍以上。
一体化的AI计算开发服务对算法模型进行量化、剪枝、稀疏处理、蒸馏等多种操作,使推理效率提升超过6倍。
同时,该平台能够在多种类型的服务器上运行,包括x86、GPU和ARM芯片,实现“一云多芯”的灵活性,支持多处理器的混合部署与统一调度,还可以针对应用进行性能优化,部分性能提升超过100%。
通过技术减排、优化能源结构、调整区域布局、减少供应链碳足迹和优化资源利用等五个方面,该平台降低了单位算力的碳排放,并通过液冷、电源技术及智能运维等手段减少能耗,PUE最低可达到1.09。
阿里云浸没式液冷集群
目前,飞天智算平台已经在阿里内部获得广泛应用,支持达摩院在前沿AI和电商智能技术的发展,同时也服务于小鹏汽车、深势科技、上汽集团、中国气象局、南方电网等多个机构和企业,显著提升了包括自动驾驶、新药研发、气象预测及工业能源等行业的AI训练效率。
小鹏汽车:依托飞天智算在乌兰察布建立的智算中心“扶摇”,其算力达到600PFLOPS(每秒60亿亿次浮点运算),成为国内最大的自动驾驶智算中心,实现自动驾驶模型训练提速近170倍。
相关文章
随机图文
-
ARM 推出 Cortex-A78:5nm 工艺,CPU 性能升
ARM 公司推出新一代 CPU 架构 Cortex-A78,适用于 5nm 工艺,性能提升 20%,功耗降低... -
华为 Mate 40 Pro 4G 版官宣降价,5599 元起售
华为 Mate 40 Pro 因芯片等原因缺货已久,去年 6 月推出 4G 版,该版本与 5G 版硬件... -
苹果 iPhone 15 或采用自研基带,信号表现
从 iPhone 7 起苹果部分机型采用 Intel 基带,iPhone XS 到 iPhone 11 基本全系 Intel 独占... -
IP 显示功能让“海外”网红现形,“梅西
近日,各大社交平台上线强制开启且无法关闭的 IP 属地功能,不少网红博主的...