1. 首页 > 科技资讯

全球首台200亿亿次超人,全球首台200亿亿次电影

地方时6月22日,英特尔(Intel)官宣,美国能源部阿拉贡国家级实验室已完成根据英特尔CPU及GPU的新一代超算中心“Aurora”的的安装,在今年的晚点时期正式上线可提供超出2 exaflops(2百亿元亿个测算每秒钟)的FP64浮点数性能,将超过归属于美国能源部橡树岭国家实验室的“Frontier”,跻身全世界第一台基础理论最高值性能超出2 exaflops的超级计算机。

据了解,Aurora 超级计算机由英特尔、惠普企业 (HPE) 和美国能源部 (DOE) 协作,致力于规模性释放出来高性能测算 (HPC) 三大支柱的发展潜力:仿真模拟、数据统计分析和人工智能 (AI)。此系统配备了全部 10624 个刀片服务器,每一个刀头一般由英特尔Xeon Max 系列产品 CPU(酷睿i5Max 9480) 和六个英特尔 Max 系列产品 GPU 构成,促使Aurora 超级计算机一共有着 63744 个英特尔大数据中心 Max 系列产品 GPU 和21248 个英特尔Xeon Max 系列产品CPU。

英特尔Xeon Max CPU里的 56 个核心均是 P 核,可以提供 112 个进程和 350W TDP。其采用根据 EMIB 设计,分为四个集群式。还具有 64 GB 的 HBM2e 运行内存,分成 4 个 16 GB 的集群式,总内存带宽为 1 TB / s,每一个核心的 HBM 均超过 1 GB。在性能层面,英特尔称,Xeon Max配备的带宽测试运行内存完全可以满足比较常见的HPC工作负载,与老旧英特尔酷睿i5 8380 系列产品Cpu或 AMD EPYC 7773X 对比,可以从一些工作负载中给予贴近 5 倍性能。

英特尔Xeon Max CPU中也包含 20 个加快模块,主要是用来 AVX-512、AMX、DSA 和英特尔 DL Boost 工作负载。据悉,英特尔在 MLPerf DeepCAM 练习里的性能比 AMD 7763 提高了 3.6 倍,比 NVIDIA 的 A100 提高了 1.2 倍。

对于英特尔MAX GPU实际上是以前的Ponte Vecchio处理芯片,采用了英特尔迄今为止最先进封装工艺,已经拥有超过1000亿次晶体三极管。其一共有63个控制模块,涵盖了16个Xe-HPG架构的计算芯片、8个Rambo cache处理芯片、2个Xe基本处理芯片、11个EMIB联接处理芯片、2个Xe Link I/O芯片和8个HBM处理芯片、还有16个承担TDP输出控制模块,根据EMIB与Foveros 3D封装形式中整合在一起。在其中最强大的MAX 1550配备了英特尔性能最高OAM控制模块,具有128个Xe关键和128GB的HBM2e运行内存,TDP为600W。

除此之外,Aurora 系统软件还配备了10.9PB的傲腾持久内存。与此同时如同之前所推荐的,每一个Xeon Max CPU内还封装形式了64 GB 的 HBM2e 运行内存,这也就意味着21248 个英特尔Xeon Max 系列产品CPU里的 HBM2e带宽测试内存空间达到1.36PB;每一个 Max GPU内最大还封装形式了128 GB 的 HBM2e 运行内存, 63744个Max GPU里的HBM2e内存空间达到8.16PB。三者总计达20.42PB运行内存。存放层面,Aurora 搭载了超出 1024 个存储节点(应用 DAOS,英特尔的分布式系统多线程阿里云oss技术性),并通过HPE Slingshot高性能构造,以每秒钟31TB的总体网络带宽给予220PB的总体存储量。

之上每一个CPU、GPU、运行内存及储存等部件也将根据英特尔的oneAPI手机软件相互之间连接。依靠 oneAPI,开发人员对整个系统中连接点开展程序编写,不用变更编码,应用软件能有效在 CPU 和 GPU 上运作,为开发者给予无缝拼接信息系统集成。

英特尔表明,Aurora将灵活运用英特尔Max系列产品GPU和CPU产品种类的强大作用。Max系列产品GPU的初期结论致力于达到状态和新起HPC和AI工作负载的需要,在现实世界的科学及工程工作负载上显现出领先的性能,在OpenMC中显示出高达AMD MI250X GPU性能的2倍,及其贴近线形拓展到数以百计连接点。在很多现实世界的HPC工作负载(如地球上系统建模、能源供应生产制造)中,Intel Xeon Max系列产品CPU比竞争者具备40%的性能优点。

现阶段世界第一的超级计算机是归属于美国能源部橡树岭国家实验室的“Frontier”,较大性能每秒钟1.19百亿元亿个浮点数测算,最高值性能可以达到1.68百亿元亿个,其使用的是恰好是AMD EPYC 7A53 64核心处理器,及其Instinct MI250X GPU网络加速器。伴随着“Aurora”的的安装进行,在今年的晚点时期正式上线将可以提供超出2 exaflops的性能,变成了全球最强大的超级计算机。

为了更好充分发挥Aurora的性能,最近,英特尔还发布了一个主要是为于科学领域内的生成式 AI 实体模型——Aurora genAI。

据了解,Aurora genAI实体模型以 Megatron和 DeepSpeed 为载体,其规模超过了 1 万亿个主要参数,比较之下根据GPT-3的ChatGPT规模仅是 1750 亿主要参数,Aurora genAI 在主要参数规模上提高到了5.7倍。该方法将于通用性文字、科学文字、科学数据信息及与这一领域有关代码上进行练习。能够促进绿色能源裂变、金属催化剂、癌病、航天工程、神经系统科学科学研究、天体物理学等领域的研究。

英特尔企业副总裁兼超级计算集团董事长Jeff McVeigh表明:“Aurora是英特尔Max系列产品GPU的第一次布署,这是全球最大的根据Xeon Max CPU的软件,也是全球最大的GPU集群式。大家无比自豪能够成为这个模式的一部分,并且为Aurora可实现的开创性AI,科学及工程感到满意。”

阿贡国家实验室副实验室主任Rick Stevens表明:“在咱们勤奋开展初步验收的前提下,我们将要应用Aurora来练习一些大规模开源系统形成AI实体模型,Aurora 已经拥有超过 60000 个 Intel Max GPU、十分快速地 I/O 系统及全固大容量存储器系统软件,是练习这种模型极致自然环境。”

编写:芯智讯-浪客剑

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.miyuegong.com/kejizixun/71276.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666