solidot新版网站常见问题,请点击这里查看。
adv
犯罪
WinterIsComing(31822)
发表于2022年05月10日 16时49分 星期二
来自血之遗产
特斯拉起诉前热设计工程师窃取其商业机密。Alexander Yatskov 在莫斯科国立大学获得机器设计博士学位,曾在超算制造商 Cray 公司工作十年,在麻省的 Thermal Form and Function 公司工作十年,2016 年在 Juniper Networks 担任热设计工程师,今年 1 月受雇于特斯拉的 Dojo 超算团队,研究不同热设计如何影响热量分布,如何进一步影响车速、功率、安全、成本和环境相关的取舍问题。特斯拉发现他在工作期间将 Dojo 相关的机密信息转移到个人电脑上。4 月他被特斯拉休了行政假。他在被公司询问时承认转移了机密信息,表示会将 PC 拿过来供公司检查。但他拿来的是一台很少使用的电脑。
超级电脑
WinterIsComing(31822)
发表于2022年03月23日 20时13分 星期三
来自第一日
在英伟达宣布其新一代数据中心 GPU 的技术会议(GPU Technology Conference)上,辉瑞首席数字技术官 Lidia Fonseca 介绍了该公司如何用 AI 和超算设计新冠疫苗 Comirnaty 和口服药片 Paxlovid。Fonseca 称,机器学习算法帮助该公司在短短四个月内设计出基于 mRNA 的疫苗并进入临床试验。机器学习算法被用于在生产阶段预测产量,AI 系统被用于分析临床试验的参与者症状中的差异。辉瑞使用了巴塞罗那超级计算中心的 MareNostrum 4 超算分析候选药物,该超算峰值性能为 11.15 Petaflops;包含 3456 个节点,每个节点由两个英特尔 Xeon Platinum 8160 处理器和四个英伟达 V100 GPU 构成。大型药厂正日益转向 AI。
超级电脑
wanwan(42055)
发表于2022年03月14日 14时53分 星期一
来自梦海
如果需要证据证明不需要最先进工艺就能造出 Exascale 级超算,你只需要看看中国国家超级计算无锡中心的神威·“海洋之光”系统。阿里巴巴、清华大学、达摩院、浙江实验室和北京智源人工智能研究院发表的论文透露了关于“海洋之光”的架构细节,它们运行名为“八卦炉(BaGuaLu)”的预训练机器学习模型,有超过 3700 万个内核和 14.5 万亿个参数(大概为FP32 单精度),能扩展到 174 万亿个参数(接近“大脑规模”,即其参数数量接近人脑突触数量)。

“八卦炉”训练模型测试的总计 105 个机柜的系统及其 107,250 个 SW26010-Pro 处理器的峰值理论性能为 1.51 exaflops。我们喜欢基数为 2 的数字,认为“海洋之光”系统可能会扩展到 160 个机柜,即 163,840 个节点,峰值 FP64 和 FP32 性能略低于 2.3 exaflops。如果它只有 120 个机柜,“海洋之光”的峰值将是 1.72 exaflops。如果 160 机柜规模是“海洋之光”的最大值,那么中国可以超越美国橡树岭国家实验室正在调优的“Frontier”超算(性能为 1.5 exaflops),并能超越将于今年晚些时候进入美国劳伦斯利弗莫尔国家实验室的“Aurora”超算(理论峰值性能 2 exaflops)——甚至可能超过将于 2023 年进入劳伦斯利弗莫尔国家实验室的“El Capitan”超算,传言“El Capitan”超级计算机的理论峰值性能预计将达到 2.2 exaflops 到 2.3 exaflops。

我们很想看看“海洋之光”的发热量和成本。可以肯定 SW26010-Pro 芯片会很热,供电和冷却的电费很高,但如果中芯国际 14 纳米工艺产率不错的话,那么该芯片的制造成本可能会比 Nvidia、AMD或者 Intel 的大型 GPU 加速器便宜得多。不管怎样,对于中国的现在和未来来说,拥有本土零部件比能源效率更重要。想象一下,多年后中芯国际能实现 7 纳米工艺时候,中国可以用它做些什么。
超级电脑
WinterIsComing(31822)
发表于2022年02月23日 22时03分 星期三
来自羚羊与秧鸡
微软研究人员在预印本网站 arxiv 上发表论文透露了一个遍布全球的针对 AI 工作负荷的分布式基础设施 Singularity。论文主要介绍的是 Singularity 的调度器,但也透露了 Singularity 的部分细节。Singularity 服务器使用的 CPU 是英特尔的 Xeon Platinum 8168,GPU 是英伟达的 Tesla V100,内存 692GB。每台服务器有 8 个 V100 Model GPU,可能还配有 FPGA 等加速器。Singularity 有数万台服务器,这意味着 GPU 的数量将超过 10 万。微软研究人员称,Singularity 在调度深度学习工作负载上实现了重大突破,扩大或缩小使用的设备规模非常便利。
超级电脑
wanwan(42055)
发表于2022年02月09日 14时57分 星期三
来自神秘博士:阿波罗23号
对传统计算机集群,每秒分析多达 10 亿次质子碰撞或数万次非常复杂的铅碰撞绝非易事。大强子对撞机(LHC)实验最近升级了硬件,将于明年投入使用,显著增加了对数据处理潜力的需求。由于传统的 CPU 可能无法应对新的计算挑战,四个大型实验正在采用 GPU 。GPU 是专门用于图像处理的高效处理器,最初的设计目标是加速 3D 计算机图形渲染。过去几年,LHC实验、全球 LHC 计算网格(WLCG)和 CERN 开放实验室都在研究 GPU 的使用。在高能物理研究中增加GPU的使用不仅可提高计算基础设施的质量和规模,还能提高整体能源效率。CERN IT 部门负责人 Enrica Porcari 表示:“LHC 雄心勃勃的升级计划带来了一系列令人兴奋的计算挑战;GPU 可以发挥重要作用,支持机器学习方法应对其中许多挑战。”“自 2020 年以来,CERN 的 IT 部门就提供了对数据中心 GPU 平台的访问权限,这些平台已被证明在一系列应用中很受欢迎。除此之外,CERN 开放实验室正在通过与工业界的合作研发项目,研究在机器学习中使用 GPU,科学计算协作(Scientific Computing Collaborations)组正在努力帮助移植并优化实验中的关键代码。”
Facebook
WinterIsComing(31822)
发表于2022年01月25日 12时39分 星期二
来自飞向阿尔孔
Facebook 母公司 Meta 宣布它正在建造的世界最快 AI 超算 AI Research SuperCluster (RSC)。Meta 研究人员表示,新超算将能处理有数万亿参数的神经网络,相比下 OpenAI 的自然语言处理神经网络 GPT-3 有 1750 亿个参数。Meta AI 研究人员目前使用的 AI 超算有 22,000 个 Nvidia V100 Tensor Core GPU,新超算使用了 Nvidia 最新的 A100,目前包含 6,080 个 GPU,缓存容量 46 PB,主闪存 175 PB。在计算机视觉任务上新超算的性能比旧系统提高 20 倍,在大型自然语言处理上性能提升 3 倍。新超算在今年年中完成建造时将使用 16,000 个 GPU,储存容量达到 1 EB,能每秒处理 16 Tbps 的数据。
超级电脑
wanwan(42055)
发表于2021年12月24日 18时28分 星期五
来自我们祖先的祖先
2018 年美国田纳西州橡树岭国家实验室(ORNL)安装了名为 Summit 的新超算。它的理论峰值性能接近 200petaflops。根据 TOP 500 排行榜,它是当时世界最强大的超算,以显著优势轻松击败之前的纪录保持者中国的神威.太湖之光。Summit 后来被名为 Fugaku 的日本超算超越,目前排名第二。

短短四年内,ORNL 对超算服务的需求超过了这台巨大机器能提供的能力。负责 ORNL 计算设施的Justin Whitt 表示:“Summit 被超额预订了四至五倍。”“限制了使用它的研究项目的数量。”显而易见的解决之道是获得更快的超级计算机。这正是该实验室在做的事情。正在组装的新超算名为 Frontier。组装完成后,它将有超过 1.5 exaflops 的峰值理论性能

Frontier 的非凡之处并不在于它的性能是 Summit 的七倍以上,这一数字令人惊叹。它的非凡之处在于它的能耗只是后者的两倍。这个能耗仍然很大——Frontier 的能耗预计将是 29 兆瓦。但这是一个好处理的数值,无论是从当地电网的供应能力还是电费方面看都是如此。

Whitt 表示:“效率来自在越来越小的空间里放置更多的计算机硬件。每一个(电脑)机柜都和全尺寸皮卡一样重。”这是因为它们装满了ORNL 规格表描述的“高密度计算刀片,由 HPC 或 AI 优化的 AMD EPYC 处理器和专为满足 Exaflops 计算需求构建的 Radeon Instinct GPU 加速器驱动。”

建造一台具有这种能力的超算已够难了。在疫情期间完成这项工作更具挑战性。Whitt 表示:“供应链的问题很广。”很多不是专门针对构建高性能超级计算机的东西也短缺。“可能只是金属板或者螺丝钉。”供应问题造成了 Frontier 将于 2022 年先于另一台计划中的超算 Aurora 投入运行,后者将安装在伊利诺伊州的阿贡国家实验室。Aurora 本来应该先投入运行,但由于英特尔在建造这台机器需要的处理器和 GPU 供应方面遇到了困难,建造工作被推迟。
超级电脑
WinterIsComing(31822)
发表于2021年11月17日 20时49分 星期三
来自弗兰肯斯坦
Top 500 超算项目公布了最新的榜单,Exascale 级超算尚未到来,日本的 ARM 超算富岳第四次登顶。目前筹备中的 Exascale 级超算美国有两台,中国也有两台。Top 10 中唯一的新人是第十的微软 Azure 超算 Voyager-EUS2,配备了 AMD EPYC CPU 和英伟达的 100 GPU,性能 30.05 Pflop/s。 AMD 在榜单中取得了明显进步,Top 10 中有四台采用了 AMD 的 CPU,Top 500 中有 54 台 Epyc Rome 系统,17 台 Epyc Milan 系统,2 台 Epyc Naples 系统,总共 73 台,其份额从上半年的 9.4% 增加到了 14.6%,英特尔的比例从上半年的 86.4% 降至了 81.4%。
超级电脑
WinterIsComing(31822)
发表于2021年10月28日 14时23分 星期四
来自倒数第二个真相
两台中国超算率先突破 Exascale 大关: 第一台是无锡国家超算中心的神威太湖之光,它最初使用申威 SW26010 处理器,由上海高性能集成电路设计中心设计,超算由 40,960 个节点构成,每个处理器为一个节点单元,每个处理器包含 了 260 个核心,总共 10,649,600 个核心,升级后处理器核心数翻了一番,节点数翻了一番,使用了新的互联系统,新的 CPU 制造工艺,峰值性能达到 1.3 ExaFLOPS,持续性能 1.05 ExaFLOPS,功耗 35 兆瓦;第二台是广州国家超算中心的天河三号,使用基于 Armv8 架构的飞腾 2000+ (FTP)处理器,峰值性能达到 1.3 ExaFLOPS,Rmax 性能超过 1 ExaFLOPS。
超级电脑
WinterIsComing(31822)
发表于2021年08月21日 23时08分 星期六
来自穿越时空的少女
特斯拉举办了 AI Day 活动,透露了它的自研超算 Dojo,使用台积电 7 纳米工艺制造,将输入来自特斯拉汽车发回的海量视频训练其神经网络。特斯拉称 Dojo 使用的芯片叫 D1,具有 GPU 级别的计算能力,同时又拥有 CPU 级别的灵活性。Dojo D1 的分布式计算架构类似硅谷创业公司 Cerebras Systems 的超大型 AI 芯片 Wafer Scale Engine(WSE)。每个功能单元具有 1TFlop BF16/CFP8 和 64GFlops FP32 的运算能力,每个方向的带宽 512GB/s。一块完整的芯片有 354 个功能单元,运算能力 362 TFlops BF16/CFP8 和 22.6 TFlops FP32,大小 645mm^2,晶体管数量 500 亿,功率 400W TDP。它的晶体管密度高于几乎所有高性能芯片,只低于移动芯片和 Apple M1。25 个 D1 芯片封装成 1 个 training tile,每个 tile 的运算能力 9 PFlops BF16/CFP8。一个机柜共有 12 个 tile,运算能力 108 PFlops,总共超过 10 万个功能单元。特斯拉计划扩大到 10 个机柜,使得运算能力超过 1.1 Exaflops。
超级电脑
WinterIsComing(31822)
发表于2021年06月29日 23时19分 星期二
来自勇者物语
Top 500 公布了最新的榜单,日本 ARM 超算富岳第三次登顶。富岳安装在神户的日本理化所计算机科学中心,其处理器为富士通公司的 48/52 核 A64FX ARM v8.2-A,采用了可缩放矢量扩展(Scalable Vector Extension)和 512 位实现,为高性能计算进行了优化,由台积电 7 纳米工艺制造,晶体管数量 878.6 亿。A64FX 包含 48 个计算核心和 2 到 4 个辅助核心,没有 GPU 加速器,封装了 HBM2 内存。富岳的处理器核心数从今年上半年的 7,299,072 增加到了 7,630,848,运算性能达到 442 petaflops,是第二名美国橡树岭国家实验室 IBM 超算 Summit 的 3 倍。排名前十的超算只出现一个新人:富岳,Summit(148.6 petaflops),Sierra,神威太湖之光,新超算 Perlmutter(使用 AMD EPYC 处理器和英伟达 A100 GPU,性能 64.6 petaflops),英伟达超算 Selen(性能 63.4 petaflops),天河二号 A(61.4 petaflops),德国超算 JUWELS Booster Module(44.1 petaflops),HPC5(意大利),Frontera。中国依旧保持超算数量第一有 186  台(比去年的 212 台大幅下降,原因未知),美国 123 台,美国超算的总性能高于中国,以 856.8 petaflops 超过中国的 445.3 petaflops。Top 500 超算中使用 AMD CPU 的数量在大幅增加,从去年的 21 台增加到 43 台。
超级电脑
WinterIsComing(31822)
发表于2021年05月29日 21时49分 星期六
来自夏日永别
美国劳伦斯伯克利实验室的国家能源研究科学计算中心宣布了一台采用 AMD CPU 和英伟达 GPU 的新超算 Perlmutter,由 HPE 制造,使用了 6,159 个 Nvidia A100 GPU 和 1,500 个 AMD Milan CPU,双精度峰值性能 60 petaflops,基于英伟达半精度数值格式(FP64 Tensor Cores)的 AI 性能 3.8 exaflops。这台超算以 2011 年诺贝尔物理学奖得主 Saul Perlmutter 的名字命名,将用于支持研究暗能量影响的 Dark Energy Spectroscopic Instrument 设备。
超级电脑
2
WinterIsComing(31822)
发表于2021年04月09日 14时23分 星期五
来自苹果树下的宇宙飞船
美国商务部将七家中国超级计算机实体列入黑名单,理由是它们协助中国军方。新增的七家实体为天津飞腾信息技术有限公司、上海集成电路技术与产业促进中心、Sunway Microelectronics、国家超级计算济南中心、国家超级计算深圳中心、国家超级计算无锡中心、国家超级计算郑州中心。美国商务部表示,这七家实体“参与了建造超级计算机,并用于中国军方行动、其破坏稳定的军事现代化努力、以及/或者大规模杀伤性武器计划”。被列入美国实体清单的公司或其他实体必须向美国商务部申请许可证,在申请从美国供应商获得产品许可时,将面临严格审查。新规定立即生效,但不适用于已经在途中的美国供应商的产品。
超级电脑
1
WinterIsComing(31822)
发表于2020年11月23日 13时45分 星期一
来自假如我有完美妈妈
报道称,中国使用英特尔 CPU 和英伟达 GPU 建造用于监控的超算。英特尔和英伟达均表示,对于其所谓自身技术遭到滥用的情况,并不知情。超算由中科曙光供应,曙光是中国最大的超算供应商之一。英伟达发言人表示,自去年特朗普政府颁布禁令以来,中科曙光就“不再是英伟达的重要客户”了。他还指出,英伟达自那以后没有再向中科曙光提出技术支持。英特尔仍在向中科曙光销售低端芯片,公司发言人表示,如果发现客户使用它们的产品侵犯人权,就会限制或停止与其的业务往来。
超级电脑
1
WinterIsComing(31822)
发表于2020年11月17日 17时51分 星期二
来自穹顶之下
Top 500 公布了最新的榜单,日本 ARM 超算富岳再次登顶。富岳安装在神户的日本理化所计算机科学中心,其处理器为富士通公司的 48/52 核 A64FX ARM v8.2-A,采用了可缩放矢量扩展(Scalable Vector Extension)和 512 位实现,为高性能计算进行了优化,由台积电 7 纳米工艺制造,晶体管数量 878.6 亿。A64FX 包含 48 个计算核心和 2 到 4 个辅助核心,没有 GPU 加速器,封装了 HBM2 内存。富岳的处理器核心数从今年上半年的 7,299,072 增加到了 7,630,848,运算性能达到 442 petaflops,是第二名美国橡树岭国家实验室 IBM 超算 Summit 的 3 倍。排名前十的超算出现了两个新人:富岳,Summit (148.6 petaflops),Sierra,神威太湖之光,英伟达超算 Selen(使用 AMD EPYC 处理器和英伟达 A100 GPU,性能 63.4 petaflops),天河二号 A,新上榜德国超算 JUWELS Booster Module(44.1 petaflops),HPC5(意大利),Frontera,新上榜沙特超算 Dammam-7(22.4 petaflops)。中国依旧保持超算数量第一有 212 台,美国 113 台,日本 34 台,美国超算的总性能高于中国,以 668.7 petaflops 超过中国的 564.0 petaflops。500 台超算中使用英特尔 CPU的超过九成,AMD CPU 的有 21 台,Power 处理器 10 台,ARM 5 台。
医学
WinterIsComing(31822)
发表于2020年09月03日 15时10分 星期四
来自女神觉醒
美国科学家在夏天使用橡树岭国家实验室的 Summit 超算分析了来自 1.7 万个基因样本的 4 万多个基因数据,此举旨在加深对 Covid-19 的理解。Summit 是世界第二快的超算,它花了一周多时间处理了这些数据。研究人员对结果进行了分析,揭示了 Covid-19 如何影响人体的新理论——缓激肽假说(bradykinin hypothesis)。假说提供了一个模型解释 Covid-19 的很多方面,包括最奇特的症状。它还提出了十多种潜在疗法,其中部分已经被 FDA 批准。研究发现发表在《eLife》期刊上。根据这一研究发现,Covid-19 的感染通常是从鼻部的 ACE2 受体进入人体的,然后在人体内进入其它存在大量 ACE2 受体的组织如肠道、肾脏和心脏。这能部分解释新冠的心脏和胃肠道症状。一旦 Covid-19 在人体内取得立足之地,事情开始变得有意思了。Summit 分析的数据显示,Covid-19 不再满足于简单感染已表达大量 ACE2 受体的细胞,它开始主动劫持人体自身系统,欺骗它去上调 ACE2 受体表达较低水平或中等水平的组织,如肺部。肾素血管紧张素系统(RAS)控制着循环系统的众多方面,包括名叫缓激肽的化合物水平。缓激肽有助于调节血压。当 Covid-19 微调 RAS 系统时,会导致调节缓激肽的机制出现混乱。缓激肽受体再次致敏,而人体也停止有效分解缓激肽。研究人员称,最终结果是释放缓激肽风暴——缓激肽在人体内失控积累。根据缓激肽假说,正是它导致了许多致命结果。FDA 已经批准了多种针对 RAS 系统的药物,它们能减少缓激肽的产生,阻止致命的缓激肽风暴。研究人员还指出,维生素 D 可能是一种潜在的治疗药物,有助于阻止缓激肽风暴的形成。
超级电脑
ai(3896)
发表于2020年07月06日 14时19分 星期一
来自泰山和蚁人
日本京都大学的科学家利用理化所全球最快超算“富岳”,找到了数十种可作为新冠传染病候选治疗药物的物质。这些物质有望阻碍病毒在细胞内增殖。科学家计划今后使用细胞进行实验,以确认其效果。模拟实验锁定了有望对治疗新冠产生效果的数十种药物。其中包括 12 种全球正在为治疗新冠展开临床试验的药物。这些药物包括驱虫药“氯硝柳胺”(Niclosamide)和“硝唑尼特 ”(Nitazoxanide)等,硝唑尼特正在美国和墨西哥进行临床试验。富岳原计划 2021 年投入使用,但为了研究新冠而于今年 4 月提前开始试用。
超级电脑
WinterIsComing(31822)
发表于2020年06月23日 09时56分 星期二
来自向世界倾诉爱
Top 500 公布了最新的榜单,日本基于 ARM 架构的超算富岳登顶,其 Linpack 运算性能达到 415.5 petaflops,是排在第二位的美国橡树岭国家实验室 IBM 超算 Summit 的 2.8 倍。富岳(PDF)安装在神户的日本理化所计算机科学中心,其处理器为富士通公司的 48/52 核 A64FX ARM v8.2-A,采用了可缩放矢量扩展(Scalable Vector Extension)和 512 位实现,为高性能计算进行了优化,由台积电 7 纳米工艺制造,晶体管数量 878.6 亿。A64FX 包含 48 个计算核心和 2 到 4 个辅助核心,没有 GPU 加速器,封装了 HBM2 内存。富岳总共有 158,97 个节点,峰值功率 28.33MW,使用水冷冷却系统,运行的操作系统为 Red Hat Enterprise Linux 8 和 McKernel(轻量级多内核操作系统)。Top 10 超算还有 Summit (148.6 petaflops),Sierra,神威太湖之光,天河二号 A,HPC5(意大利),Selene,Frontera,Marconi-100 和 Piz Daint。中国依旧保持超算数量第一有 226 台,美国 114 台,日本 30 台,法国 18 台,德国 16 ,美国超算的总性能高于中国。联想制造的超算数量再次保持第一,共有 180 台,之后是曙光 (68),浪潮 (64),HPE (37),克雷/HPE (35),富士通 13。500 台超算中 469 台使用英特尔 CPU,AMD CPU 的有 11 台。
超级电脑
WinterIsComing(31822)
发表于2020年04月16日 12时36分 星期四
来自布兰尼肯夫人
蛋白质折叠分布式计算项目 Folding@home 最近发起了 COVID-19 项目,以帮助科学家更好的理解新冠病毒,了解其与 ACE2 受体是如何相互作用的,帮助开发治疗方法。这一行动受到了许多人的响应,短时间内用户数增长了 12 倍,从 3 万增加到了 40 万。上月底,Folding@home 项目的算力突破了 exaFLOP 大关,领先英特尔、AMD 和克雷等公司一到两年。相比另一个最近终止的著名分布式计算项目 SETI@Home,Folding@home 可谓硕果累累,产生了 233 篇论文,其主要研究包括了激酶的动态性,G蛋白偶联受体,耐药菌和埃博拉病毒蛋白质。Folding@home 的峰值性能达到了 1.5 exaFLOPs,是世界最快超算 Summit 的 7 倍多。
超级电脑
wenfeixiang(25847)
发表于2019年11月19日 11时57分 星期二
来自火星之剑
Top 500 周一公布了最新一期的榜单,前 10 的超算没有变化,但入榜门槛从上半年的 1.022 petaflops 提高到 1.14 petaflops。排在前十的超算为:橡树岭国家实验室的 IBM 超算 Summit 运算速度 148.6 petaflops;劳伦斯利物莫国家实验室的 IBM 超算 Sierra 运算速度 94.6 petaflops,中国的神威太湖之光第三运算速度 93 petaflops;天河二号 A 以 61.4 petaflops 排名第四;得州大学的超算 Frontera 以 23.5 petaflops 排名第五;之后是瑞士的 Piz Daint(21.2 petaflops),美国的 Trinity(20.2 petaflops),日本富士通公司制造的 AI Bridging Cloud Infrastructure (ABCI,19.9 petaflops),德国的联想超算 SuperMUC-NG(19.5 petaflops),劳伦斯的 Lassen(18.2 petaflops)。在 Top 500,中国有 227 台,数量继续保持第一,美国 118 台,日本 29 台,法国 18 台,德国 16 ,荷兰 15,爱尔兰 14,英国 11 。联想制造的超算数量再次保持第一,共有 174 台,之后是浪潮 (71),曙光 (65),克雷 (36)和HPE (35),克雷已被 HPE 收购,两家的超算总数和浪潮相同。500 台超算中 470 台使用英特尔 CPU,IBM 有 14 台,AMD 有 3 台。
上一页123下一页