solidot新版网站常见问题,请点击这里查看。
超级电脑
Wilson(42865)
发表于2024年03月27日 17时50分 星期三
来自八十天环游地球
英国科学和技术设施委员会(Science and Technology Facilities Council)选择联想公司建造一台 44.7 Petaflops 液冷超算。该超算将安装在该机构位于 Daresbury 的 Hartree Center,距离利物浦半小时车程。新系统比该机构现有的 Scafell Pike 系统强大十倍,因采用联想的直接温水冷却系统,所需要的能源更少。联想称新超算基于 GPU,但没有披露更多细节。联想在 2022 年超算会议上展示的 1U Neptune 由双 AMD Genoa CPU 和四个 Nvidia H100 GPU 组成。

超级电脑
Wilson(42865)
发表于2024年01月01日 22时22分 星期一
来自假如我有完美妈妈
Roy Longbottom 于 1960 年到 1993 年之间在英国政府中央计算机局工作,因工作需要他需要对计算机执行 一系列的基准测试和压力测试程序如 Livermore Loops、Linpack 和 Whetstone,他整理了 1972 年到 2022 年的基准测试结果,制作了一个网页对比了过去五十年计算机技术的进步。1978 年的 Cray 1 超算耗资 700 万美元,重 10,500 磅,电源功率 115 千瓦,它是当时最快的计算机。2012 年面世的单板计算机树莓派一代(Raspberry Pi 1)费用仅为 70 美元,重只有几盎司,电源功率仅 5 瓦,但其速度是 Cray 1 的 4.5 倍。2020 年的 Pi 400 的 Loops、Linpack 和 Whetstone 测试结果显示它比 Cray 1 快 78.8、49.5 和 95.5 倍。第一个达到 Cray 1 Livermore Loops 得分的 PC 处理器是 1994 年 100 MHz 的奔腾。到 2021 年英特尔 11 代 Core i5 CPU 的 Loops、Linpack 和 Whetstone 得分分别比 Cray 1 快 117、131 和 134 倍。

超级电脑
Wilson(42865)
发表于2023年11月14日 16时09分 星期二
来自暗黑童话
Top 500 项目公布了最新的超算榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 超算再次高居榜首。Frontier 由 HPE Cray EX 制造,使用 AMD EPYC 64C 2GHz 处理器,共 8,699,904 个核心,峰值性能 1.194 Exaflop/s。目前还在建造中的阿贡国家实验室 Aurora 超算排名第二,使用英特尔的 Xeon CPU Max 9470 52C 2.4GHz 和英特尔 Data Center GPU,目前的性能 585 PFlop/s,完成建造之后将达到 2 Exaflop/s。微软云计算 Microsoft Azure 超算 Eagle 排名第三,使用英特尔 Xeon Platinum 8480C 48C 2GHz 和英伟达 H100 GPU,性能 561.2 PFlop/s。日本的 ARM 超算富岳从上半年的第二降至第四名,性能 442 PFlop/s。芬兰欧洲超算中心的新超算 LUMI 排在第五,使用第三代 AMD EPYC 处理器,共 2,220,288 个核心,性能 309 PFlop/s。第六是意大利超算 Leonardo,性能 174 PFlop/s,第七 IBM Summit(148.6 PFlop/s),之后是 IBM Sierra,神威太湖之光, Perlmutter,英伟达超算 Selen,天河二号 A。排名前十的超算两台使用了 AMD EPYC 处理器,两台使用 IBM Power 处理器,ARM 处理器一台,五台使用了英特尔的至强处理器。在 Top 500 中,美国从上次的 150 台增加到 161 台,中国从 134 台减少到 104 台,欧洲从 133 台增加到 143 台。

超级电脑
Wilson(42865)
发表于2023年10月07日 19时39分 星期六
来自沙皇的邮件
欧洲第一台 ExaFLOP 超算 Jupiter 将使用 ARM 芯片。Jupiter 耗资约 2.73 亿欧元,将使用 SiPearl 的 Rhea 处理器和英伟达的加速器,其中 Rhea 是基于 ARM 的 Neoverse V1 CPU 架构。Jupiter 将从 2024 年初开始组装,它将安装在德国慕尼黑附近的 Jülich 超算中心。在 Top500 榜单中,前 10 台有 6 台是采用 x86 芯片,只有一台日本超算是采用 ARM 芯片。Jülich 超算中心现有的最快超算是 JUWELS,排在 Top500 榜单的第 13 名。Jupiter 将使用英伟达的 A100 GPU 加速,未来可能升级到 H100 GPU。

超级电脑
Wilson(42865)
发表于2023年05月23日 11时27分 星期二
来自荷鲁斯崛起
Frontier 是第一台突破 Exascale 超算,而更多的 Exascale 超算即将到来。英特尔周一透露了 Aurora 超算的完整规格。Aurora 超算最初目标是 1 Exascale,如今升级到了 2 Exascale,它有 10,624 个节点,21,248 个基于 Sapphire Rapids-SP 家族的至强 CPU 和 63,744 个基于 Ponte Vecchio 的 GPU。英特尔声称 Ponte Vecchio GPU 的性能强于英伟达的 AI 芯片 H100,它正在开发的下一代 GPU Falcon Shores 预计将在 2025 年推出,将有 288GB 的显存,支持 8 位浮点计算。Aurora 超算配备了 10.9 PB 的 DDR5 系统内存,CPU 使用了 1.36 PB 的 HBM 内存,GPU 使用了 8.16 PB 的 HBM 内存。

超级电脑
Wilson(42865)
发表于2023年05月22日 21时54分 星期一
来自终极失控
Top 500 项目公布了最新的超算榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 超算去年初成为第一个真正突破 Exascale 大关的超算,它再次高居榜首。Frontier 由 HPE Cray EX 制造,使用 AMD EPYC 64C 2GHz 处理器,共 8,699,904 个核心,峰值性能 1.194 Exaflop/s。日本的 ARM 超算富岳排在第二位,性能 442 petaflops。芬兰欧洲超算中心的新超算 LUMI 排在第三位,同样使用第三代 AMD EPYC 处理器,共 2,220,288 个核心,性能 309 petaflops。第四是意大利超算 Leonardo,性能 174 petaflops,第五 IBM Summit(148.6 petaflops),之后是 IBM Sierra,神威太湖之光, Perlmutter,英伟达超算 Selen,天河二号 A。排名前十的超算和去年下半年完全相同。有四台使用了 AMD EPYC 处理器,两台使用 IBM Power 处理器,ARM 处理器一台,申威处理器一台,两台使用了英特尔的至强处理器。在 Top 500 中,美国有 150 台,中国 134 台,德国 36 台,日本 33 台,法国 24 台。联想制造的超算数量最多 168 台,其次是 HPE 的 100 台,浪潮的 43 台。

超级电脑
Wilson(42865)
发表于2023年04月06日 16时57分 星期四
来自帽子里的天空
Google 本周二在预印本平台 arXiv 上发表论文,介绍了它的第四代 TPU(Tensor Processing Unit)处理器。TPU 是 Google 专用于训练 AI 的定制处理器,每个 TPUv4 包含两个 TensorCores(TC),每个 TC 包含四个 128x128 矩阵乘法单元(MXU)和一个矢量处理单元(VPU),使用 128 条通道(每通道 16 ALU)和一个 16MB 的 矢量存储器(VMEM)。Google 自己的测试显示,它的 TPUv4 相对于英伟达的 A100 更快更环保(能耗更低)。A100 是英伟达上一代的数据中心 GPU,它最新一代的产品是 H100,Google 研究人员没有对比 TPUv4 和 H100,因为 H100 是在 TPUv4 之后推出的。与英伟达的产品不同的是,Google TPU 不对外销售,公开 TPUv4 的一个目的可能是为了宣传该公司的云端 TPU 服务。

微软
Wilson(42865)
发表于2023年03月14日 18时56分 星期二
来自团圆奇遇
微软斥资数亿美元建造驱动 AI 聊天机器人 ChatGPT 的超算。微软称它在其 Azure 云计算平台使用了数以千计的英伟达 GPU,以为 OpenAI 的项目提供强大的运算能力,帮助 OpenAI 训练愈来愈强大的模型,解锁 ChatGPT 和 Bing 等工具的 AI 能力。微软使用了英伟达的 H100 和 A100 Tensor Core GPU,以及 Quantum-2 InfiniBand 网络。这能为 OpenAI 以及其它公司训练更大更复杂的 AI 模型。

超级电脑
Wilson(42865)
发表于2023年03月02日 20时33分 星期四
来自繁星若尘
日本是一个亚热带岛国,必须应对飓风、台风等各种恶劣天气。它也是一个位于地壳构造俯冲带的火山岛,地震和海啸也是常态。随着天气愈加恶劣,线性雨带变得更常见且强大。线性雨带是一种缓慢移动或几乎静止不动的积雨云,会在同一地区停留数小时,大雨倾泻而出,会有可能导致山体滑坡和洪水。如果能提前 6 到 12 小时预测此类事件,将有助于制定计划减少财产和生命损失。从去年 6 月开始,日本气象厅和日本理化学研究所的研究人员使用 ARM 超算富岳研究线性雨带的形成及其造成的暴雨。日本气象厅还将采购一台新超算专门研究线性雨带。但暂时还不知道是富士通的 ARM 超算入选还是 HPE 的 Cray 超算。

超级电脑
WinterIsComing(31822)
发表于2022年11月17日 15时07分 星期四
来自时间秘史
Top 500 项目公布了最新的超算榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 超算今年初成为第一个真正突破 Exascale 大关的超算,它依旧高居第一。Frontier 由 HPE Cray EX 制造,使用 AMD EPYC 64C 2GHz 处理器,共 8,730,112 个核心,性能 1.102 Exaflop/s。四次登顶的日本 ARM 超算富岳排在第二位,性能 442 petaflops。芬兰欧洲超算中心的新超算 UMI 排在第三位,同样使用第三代 AMD EPYC 处理器,共 2,220,288 个核心,性能 309 petaflops。第四是新晋进入前十的意大利超算 Leonardo,性能 174 petaflops,第五 IBM Summit(148.6 petaflops),之后是 Sierra,神威太湖之光, Perlmutter,英伟达超算 Selen,天河二号 A。排名前十的超算有四台使用了 AMD EPYC 处理器,两台使用 IBM Power 处理器,ARM 处理器一台,申威处理器一台,两台使用了英特尔的至强处理器。在 Top 500 中,中国有 162 台,美国 126 台,欧洲 131 台。

超级电脑
WinterIsComing(31822)
发表于2022年10月09日 22时44分 星期日
来自美丽新世界
国家超级计算长沙中心启用了天河新超算,双精度浮点峰值计算性能达到 200PFlops。暂时不知道新超算的名字。长沙晚报的报道称,新超算“算力水平国际先进、国内领先”。根据 2022 年 6 月 Top500 榜单,国内超算排名最前的是超算无锡中心的神威太湖之光,峰值计算性能 93.01PFlops,广州中心的天河二号A 性能 61.44PFlops。200PFlops 可以排在全球的第三位,次于美国的 Frontier 和日本的富岳。
超级电脑
WinterIsComing(31822)
发表于2022年06月06日 14时29分 星期一
来自王牌飞行员
英特尔和巴塞罗那超算中心宣布将投资 4 亿欧元,探索在 Zettascale 级(即超过 1 zettaflops 或超过一千 exaflops)超算中使用 RISC-V 架构。联合实验室将开发基于 RISC-V 架构的处理器,用于 AI 加速器、自主驾驶汽车和高性能计算。这并不意味着英特尔会在其首批 Zettascale 级超算中使用基于 RISC-V 的 CPU,而只是表示该公司对 RISC-V 架构技术的投资,它此前曾尝试收购设计 RISC-V 处理器的 SiFive 公司,还是标准组织 RISC-V Internationa 的最高级 Premier 会员。英特尔去年宣布到 2027 年建造首台超过 1 zettaflops 的超算。
超级电脑
WinterIsComing(31822)
发表于2022年05月30日 18时59分 星期一
来自卡叠什战役
Top 500 项目公布了最新的超算榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 超算成为第一个真正突破 Exascale 大关的超算。Frontier 由 HPE Cray EX 制造,使用 AMD EPYC 64C 2GHz 处理器,共 8,730,112 个核心,性能 1.102 Exaflop/s。四次登顶的日本 ARM 超算富岳排在第二位,性能 442 petaflops。芬兰欧洲超算中心的新超算 UMI 排在第三位,同样使用第三代 AMD EPYC 处理器,共 1,110,144 个核心,性能 151.9 petaflops。第四 IBM Summit(148.6 petaflops),之后是 Sierra,神威太湖之光, Perlmutter,英伟达超算 Selen,天河二号 A,法国超算 Adastra(第三代 AMD EPYC,性能 46.1 petaflops)。排名前十的超算有五台使用了 AMD EPYC 处理器,两台使用 IBM Power 处理器,ARM 处理器一台,申威处理器一台,只有天河二号 A 使用了英特尔的至强处理器。在 Top 500 中,中国有 173 台,美国 126 台。
犯罪
WinterIsComing(31822)
发表于2022年05月10日 16时49分 星期二
来自血之遗产
特斯拉起诉前热设计工程师窃取其商业机密。Alexander Yatskov 在莫斯科国立大学获得机器设计博士学位,曾在超算制造商 Cray 公司工作十年,在麻省的 Thermal Form and Function 公司工作十年,2016 年在 Juniper Networks 担任热设计工程师,今年 1 月受雇于特斯拉的 Dojo 超算团队,研究不同热设计如何影响热量分布,如何进一步影响车速、功率、安全、成本和环境相关的取舍问题。特斯拉发现他在工作期间将 Dojo 相关的机密信息转移到个人电脑上。4 月他被特斯拉休了行政假。他在被公司询问时承认转移了机密信息,表示会将 PC 拿过来供公司检查。但他拿来的是一台很少使用的电脑。
超级电脑
WinterIsComing(31822)
发表于2022年03月23日 20时13分 星期三
来自第一日
在英伟达宣布其新一代数据中心 GPU 的技术会议(GPU Technology Conference)上,辉瑞首席数字技术官 Lidia Fonseca 介绍了该公司如何用 AI 和超算设计新冠疫苗 Comirnaty 和口服药片 Paxlovid。Fonseca 称,机器学习算法帮助该公司在短短四个月内设计出基于 mRNA 的疫苗并进入临床试验。机器学习算法被用于在生产阶段预测产量,AI 系统被用于分析临床试验的参与者症状中的差异。辉瑞使用了巴塞罗那超级计算中心的 MareNostrum 4 超算分析候选药物,该超算峰值性能为 11.15 Petaflops;包含 3456 个节点,每个节点由两个英特尔 Xeon Platinum 8160 处理器和四个英伟达 V100 GPU 构成。大型药厂正日益转向 AI。
超级电脑
wanwan(42055)
发表于2022年03月14日 14时53分 星期一
来自梦海
如果需要证据证明不需要最先进工艺就能造出 Exascale 级超算,你只需要看看中国国家超级计算无锡中心的神威·“海洋之光”系统。阿里巴巴、清华大学、达摩院、浙江实验室和北京智源人工智能研究院发表的论文透露了关于“海洋之光”的架构细节,它们运行名为“八卦炉(BaGuaLu)”的预训练机器学习模型,有超过 3700 万个内核和 14.5 万亿个参数(大概为FP32 单精度),能扩展到 174 万亿个参数(接近“大脑规模”,即其参数数量接近人脑突触数量)。

“八卦炉”训练模型测试的总计 105 个机柜的系统及其 107,250 个 SW26010-Pro 处理器的峰值理论性能为 1.51 exaflops。我们喜欢基数为 2 的数字,认为“海洋之光”系统可能会扩展到 160 个机柜,即 163,840 个节点,峰值 FP64 和 FP32 性能略低于 2.3 exaflops。如果它只有 120 个机柜,“海洋之光”的峰值将是 1.72 exaflops。如果 160 机柜规模是“海洋之光”的最大值,那么中国可以超越美国橡树岭国家实验室正在调优的“Frontier”超算(性能为 1.5 exaflops),并能超越将于今年晚些时候进入美国劳伦斯利弗莫尔国家实验室的“Aurora”超算(理论峰值性能 2 exaflops)——甚至可能超过将于 2023 年进入劳伦斯利弗莫尔国家实验室的“El Capitan”超算,传言“El Capitan”超级计算机的理论峰值性能预计将达到 2.2 exaflops 到 2.3 exaflops。

我们很想看看“海洋之光”的发热量和成本。可以肯定 SW26010-Pro 芯片会很热,供电和冷却的电费很高,但如果中芯国际 14 纳米工艺产率不错的话,那么该芯片的制造成本可能会比 Nvidia、AMD或者 Intel 的大型 GPU 加速器便宜得多。不管怎样,对于中国的现在和未来来说,拥有本土零部件比能源效率更重要。想象一下,多年后中芯国际能实现 7 纳米工艺时候,中国可以用它做些什么。
超级电脑
WinterIsComing(31822)
发表于2022年02月23日 22时03分 星期三
来自羚羊与秧鸡
微软研究人员在预印本网站 arxiv 上发表论文透露了一个遍布全球的针对 AI 工作负荷的分布式基础设施 Singularity。论文主要介绍的是 Singularity 的调度器,但也透露了 Singularity 的部分细节。Singularity 服务器使用的 CPU 是英特尔的 Xeon Platinum 8168,GPU 是英伟达的 Tesla V100,内存 692GB。每台服务器有 8 个 V100 Model GPU,可能还配有 FPGA 等加速器。Singularity 有数万台服务器,这意味着 GPU 的数量将超过 10 万。微软研究人员称,Singularity 在调度深度学习工作负载上实现了重大突破,扩大或缩小使用的设备规模非常便利。
超级电脑
wanwan(42055)
发表于2022年02月09日 14时57分 星期三
来自神秘博士:阿波罗23号
对传统计算机集群,每秒分析多达 10 亿次质子碰撞或数万次非常复杂的铅碰撞绝非易事。大强子对撞机(LHC)实验最近升级了硬件,将于明年投入使用,显著增加了对数据处理潜力的需求。由于传统的 CPU 可能无法应对新的计算挑战,四个大型实验正在采用 GPU 。GPU 是专门用于图像处理的高效处理器,最初的设计目标是加速 3D 计算机图形渲染。过去几年,LHC实验、全球 LHC 计算网格(WLCG)和 CERN 开放实验室都在研究 GPU 的使用。在高能物理研究中增加GPU的使用不仅可提高计算基础设施的质量和规模,还能提高整体能源效率。CERN IT 部门负责人 Enrica Porcari 表示:“LHC 雄心勃勃的升级计划带来了一系列令人兴奋的计算挑战;GPU 可以发挥重要作用,支持机器学习方法应对其中许多挑战。”“自 2020 年以来,CERN 的 IT 部门就提供了对数据中心 GPU 平台的访问权限,这些平台已被证明在一系列应用中很受欢迎。除此之外,CERN 开放实验室正在通过与工业界的合作研发项目,研究在机器学习中使用 GPU,科学计算协作(Scientific Computing Collaborations)组正在努力帮助移植并优化实验中的关键代码。”
Facebook
WinterIsComing(31822)
发表于2022年01月25日 12时39分 星期二
来自飞向阿尔孔
Facebook 母公司 Meta 宣布它正在建造的世界最快 AI 超算 AI Research SuperCluster (RSC)。Meta 研究人员表示,新超算将能处理有数万亿参数的神经网络,相比下 OpenAI 的自然语言处理神经网络 GPT-3 有 1750 亿个参数。Meta AI 研究人员目前使用的 AI 超算有 22,000 个 Nvidia V100 Tensor Core GPU,新超算使用了 Nvidia 最新的 A100,目前包含 6,080 个 GPU,缓存容量 46 PB,主闪存 175 PB。在计算机视觉任务上新超算的性能比旧系统提高 20 倍,在大型自然语言处理上性能提升 3 倍。新超算在今年年中完成建造时将使用 16,000 个 GPU,储存容量达到 1 EB,能每秒处理 16 Tbps 的数据。
超级电脑
wanwan(42055)
发表于2021年12月24日 18时28分 星期五
来自我们祖先的祖先
2018 年美国田纳西州橡树岭国家实验室(ORNL)安装了名为 Summit 的新超算。它的理论峰值性能接近 200petaflops。根据 TOP 500 排行榜,它是当时世界最强大的超算,以显著优势轻松击败之前的纪录保持者中国的神威.太湖之光。Summit 后来被名为 Fugaku 的日本超算超越,目前排名第二。

短短四年内,ORNL 对超算服务的需求超过了这台巨大机器能提供的能力。负责 ORNL 计算设施的Justin Whitt 表示:“Summit 被超额预订了四至五倍。”“限制了使用它的研究项目的数量。”显而易见的解决之道是获得更快的超级计算机。这正是该实验室在做的事情。正在组装的新超算名为 Frontier。组装完成后,它将有超过 1.5 exaflops 的峰值理论性能

Frontier 的非凡之处并不在于它的性能是 Summit 的七倍以上,这一数字令人惊叹。它的非凡之处在于它的能耗只是后者的两倍。这个能耗仍然很大——Frontier 的能耗预计将是 29 兆瓦。但这是一个好处理的数值,无论是从当地电网的供应能力还是电费方面看都是如此。

Whitt 表示:“效率来自在越来越小的空间里放置更多的计算机硬件。每一个(电脑)机柜都和全尺寸皮卡一样重。”这是因为它们装满了ORNL 规格表描述的“高密度计算刀片,由 HPC 或 AI 优化的 AMD EPYC 处理器和专为满足 Exaflops 计算需求构建的 Radeon Instinct GPU 加速器驱动。”

建造一台具有这种能力的超算已够难了。在疫情期间完成这项工作更具挑战性。Whitt 表示:“供应链的问题很广。”很多不是专门针对构建高性能超级计算机的东西也短缺。“可能只是金属板或者螺丝钉。”供应问题造成了 Frontier 将于 2022 年先于另一台计划中的超算 Aurora 投入运行,后者将安装在伊利诺伊州的阿贡国家实验室。Aurora 本来应该先投入运行,但由于英特尔在建造这台机器需要的处理器和 GPU 供应方面遇到了困难,建造工作被推迟。
上一页12下一页