您现在的位置:大石桥市义悔建材网 > 工程案例 >

NVIDIA最强GPU推PCIe版!30款内置A100服务器今夏齐发

作者:admin    文章来源:未知    点击数:    更新时间:2020-06-25 01:47

原标题:NVIDIA最强GPU推PCIe版!30款内置A100服务器今夏齐发

智东西(公多号:zhidxcom)

文 | 心缘

智东西6月22日报道,在今天的国际高性能计算大会(ISC 2020)上,NVIDIA推出PCIe版本的A100 GPU,并同多家全球领先的服务器制造商推出多款内置NVIDIA A100且具有分别设计和配置的服务器。

崭新NVIDIA Mellanox UFM Cyber-AI平台和UFM系列第三款产品UFM Telemetry平台也于现场发布。

此表,NVIDIA宣布其RAPIDS数据科学柔件在DGX A100之上以19.5倍TPCx-BB性能打破纪录。

一、 NVIDIA 科学计算平台在抗疫中发挥关键作用

NVIDIA最先分享了其科学计算平台在抗击疫情期间,如何为全球分别周围晓畅COVID-19和追求抗击疫情的测试与治疗方案挑供添速。

睁开全文

例如,在基因组学周围,Oxford Nanopore Technologies行使NVIDIA GPU在短短7个幼时内完善了病毒基因组测序。

在感染分析和展望周围,NVIDIA RAPIDS团队行使GPU添速的数据可视化工具Plotly Dash为实时感染率分析挑供更清亮的洞见。

在组织生物学周围,美国国立卫生钻研院(U.S. National Institutes of Health)和德克萨斯大学奥斯汀分校(University of Texas, Austin)正在行使GPU添速柔件CryoSPARC和矮温电子显微镜重修首个病毒蛋白3D组织。

在治疗周围,NVIDIA与美国国立卫生钻研院配相符构建了一个AI模型,该AI可按照肺部扫描对COVID-19感染进走准备分类,从而制定有效的治疗方案。

在新药钻研周围,橡树岭国家实验室在GPU添速的Summit超级计算机上运走了Scripps钻研所的AutoDock,只用了短短12幼时对十亿栽湮没药物组相符进走了筛选。

在边缘检测周围,Whiteboard Coordinator Inc.竖立了一个能够自动测量和筛查人员体温提高的AI编制,每幼时可筛查2000多名医护人员。

而之以是在这么多做事发挥作用,源自NVIDIA为科学计算社区挑供端对端的做事流程。

在数据分析周围,NVIDIA经由过程行行使于数据分析的特定周围CUDA-X库以及来自Magnum IO的IO添速技术,为Spark3.0、RAPIDS和Dask等关键框架挑速。

同样,NVIDIA为700多栽HPC行使以及一切AI框架挑速。凭借在视觉计算周围的浓重知识,NVIDIA还能挑供添速可视化解决方案,因此能够实现TB级数据的可视化。

例如美国国家航空航天局(NASA)在全球最大的立体可视化项现在中行使吾们的添速堆栈实现了首次载人火星义务着陆过程的交互实时可视化。

二、推出 PCIe 版本的 NVIDIA A100 及多款内置 A100 的服务器

NVIDIA A100 Tensor Core GPU是NVIDIA今年推出的首款基于NVIDIA Ampere架构的GPU,也是NVIDIA迄今为止性能升迁幅度最大的GPU。

其AI训练及推理性能较上一代挑高多达20倍,高性能计算性能升迁2.5倍,且采用多实例GPU技术,可将单个A100分割成最多7个自力GPU来处理各栽计算义务。

为了增添完善上月发布的四卡和八卡NVIDIA HGX A100配置,NVIDIA今天推出PCIe版本的A100,使服务器制造商能挑供从内置单个A100 GPU的编制到内置10个或10个以上GPU的服务器的雄厚产品组相符。

这些编制能够为各栽计算浓密型义务添速,包括用于新药研发的分子动力学模拟、竖立更好的按揭贷款审批财务模型等。

继上月NVIDIA Ampere架议和NVIDIA A100 GPU发布后,全球头部供答商展望将发布超过50款内置A100的服务器。其中30款编制展望将在今年炎天上市,余下20余款将于岁暮上市。

今天,NVIDIA与多家全球领先服务器制造商推出多款编制,具有多栽分别的设计和配置。以下服务器制造商将挑供内置NVIDIA A100的编制:

(1)华硕ESC4000A-E10服务器,每台可配置4个A100 PCIe GPU;

(2)Atos的BullSequana X2415编制,配置有4个NVIDIA A100 Tensor Core GPU。

(3)思科的Cisco Unified Computing System服务器和超融相符架构编制Cisco HyperFlex,将声援NVIDIA A100 Tensor Core GPU。

(4)戴尔科技的PowerEdge服务器息争决方案将声援NVIDIA A100 Tensor Core GPU。

(5)富士通将在其PRIMERGY服务器系列中引入A100 GPU。

(6)技嘉科技G481-HA0、G492-Z50和G492-Z51服务器声援多达10个A100 PCIe GPU,G292-Z40服务器声援多达8个A100 PCIe GPU。

(7)HPE ProLiant DL380 Gen10服务器将声援A100 PCIe GPU,HPE Apollo 6500 Gen10编制也将仰仗A100 PCIe GPU添速HPC和AI做事负载。

(8)浪潮发布了八款内置NVIDIA A100的编制,包括行使A100 PCIe GPU的NF5468M5、NF5468M6和NF5468A5,行使八路NVLink的NF5488M5-D、NF5488A5、NF5488M6和NF5688M6,以及行使十六路NVLink的NF5888M6。

(9)联想ThinkSystem SR670 AI-ready服务器等片面编制将声援A100 PCIe GPU。联想将在今年秋天扩大整个ThinkSystem和ThinkAgile产品系列的供答。

(10)One Stop Systems将为其OSS 4UV Gen 4 PCIe扩展编制挑供多达8个NVIDIA A100 PCIe GPU,使AI和HPC客户能够横向扩展他们的Gen 4服务器。

(11)Quanta/QCT将挑供D52BV-2U、D43KQ-2U和D52G-4U等多款QuantaGrid服务器编制,声援多达8个NVIDIA A100 PCIe GPU。

(12)Supermicro的4U A GPU编制将声援多达8个NVIDIA A100 PCIe GPU和2个附添高性能PCI-E 4.0扩展插槽。此表,该编制还声援其他1U、2U和4U GPU服务器。

NVIDIA正在扩展NGC-Ready认证编制产品组相符。编制供答商可直接与NVIDIA配相符,为内置A100的服务器取得NGC-Ready认证,从而可向客户保证,经过认证的编制具有运走AI做事负载所需的性能。

NGC-Ready编制行使来自NVIDIA NGC注册中央的GPU优化AI柔件进走测试,该柔件可用于数据中央、云端和边缘内置NVIDIA GPU的编制。

声援NVIDIA A100的NVIDIA Ampere优化柔件现已上市,包括CUDA11、50多个CUDA-X库的新版本、多模式对话式AI服务框架NVIDIA Jarvis、深度保举行使框架NVIDIA Merlin、RAPIDS开源数据科学柔件库套件、NVIDIA HPC SDK等。

凭借这些功能重大的柔件工具,开发者们能够构建并添速HPC、基因组学、5G、数据科学、机器人学等周围的行使。

三、新款 UFM 新平台:用 AI 检测网络性能

今天NVIDIA还推出了NVIDIA Mellanox UFM Cyber-AI平台和UFM系列第三款产品UFM Telemetry平台。

UFM平台产品系列已管理InfiniBand编制近十年,UFM Cyber-AI平台对UFM Enterprise平台进走了增添,挑供网络监视、管理、性能优化、配置检查和坦然电缆管理功能,可检测坦然要挟和运走题目,工程案例展望网络故障,并能大幅缩短InfiniBand数据中央的停机时间。

UFM Telemetry平台具能够捕获实时网络遥测数据,该数据将被传输到本地或云端数据库,用于监视网络性能和验证网络配置。

UFM Cyber-AI平台行使AI分析技术,经由过程实时和历史遥测及做事负载数据来学习数据中央的运走节奏和网络做事负载模式,按照这一基准追踪编制的运走状况和网络修改并检测性能降低、行使情况和配置文件更改。

该崭新平台可发出警报,挑示编制和行使变态走为、湮没编制故障以及要挟,并实走纠正措施。它还能在编制遭受暗客抨击,装配凶意行使(例如添密币挖币柔件)时发出坦然警报。

这缩短了数据中央的停机时间,而按照ITIC的钻研,停机1幼时所造成的成本清淡在30万美元以上。

NVIDIA Mellanox网络事业部高级营销副总裁Gilad Shainer称,基于UFM Cyber-AI平台,编制管理员能够快速检测和反答湮没的坦然要挟并解决即将发生的故障,从而撙节成本,确保客户营业的不息性。

四、柔硬件双管齐下,打破大数据分析基准记录

NVIDIA所展现的标准大数据分析基准(TPCx-BB)性能是此前纪录的近20倍。

TPCx-BB是用于实际ETL(挑取、转换、添载)和机器学习做事流程的企业大数据基准测试,该基准测试的30个查询项现在包含多栽大数据分析用例。其特点是将SQL与组织化数据的机器学习、自然说话处理和非组织化数据相结相符的查询,逆映了当代数据分析做事流中的多样性。

以前该基准测试只在CPU编制上运走,但当运走周围专门大的数据做事负载时,CPU往往遇到瓶颈。

而NVIDIA在16台DGX A100编制构成的集群上行使RAPIDS开源数据科学柔件库套件,仅用14.5分钟就完善了TPCx-BB基准测试,而现在在CPU编制上的运走记录是4.7幼时。

为运走该基准测试,NVIDIA采用RAPIDS用于数据处理和机器学习,Dask用于程度扩展,行使UCX开源库进走超快速通信,一切这些柔件工具都在DGX A100上得到了添强。

DGX A100编制将基于NVIDIA Ampere架构的NVIDIA A100 Tensor Core GPU和NVIDIA Mellanox网络功能整相符到一套易于扩展的完善编制中,能高效地声援单一柔件定义平台上的分析、AI训练和推理。

▲30个TPCx BB基准测试查询效果。RAPIDS在16台DGX A100编制上运走,为每个10TB测试查询挑供上述相对性能升迁。

在SF10000 TPCx-BB级别,NVIDIA测试可得出10 TB以上数据做事负载的效果。

这一周围下,查询的复杂策划高难度会敏捷添添实走时间,从而添添数据中央的支付。而具有弹性的DGX A100架构能够解决这些题目。

借助来自NVIDIA硬件配相符友人的崭新NVIDIA A100 Tensor Core GPU编制,数据科学家们将甚至能够选择经由过程A100的突破性性能添速做事负载。

RAPIDS TPCx-BB基准是一个由多多配相符友人和开源社区共同参与的项现在。

TPCx-BB查询经由过程一系列Python脚本实现,这些脚本行使RAPIDS数据帧库、cuDF、RAPIDS机器学习库、cuML、cuPy、BlazingSQL和Dask行为主库。Numba被用于在用户定义的函数中实现自定义逻辑,spaCy被用于命名实体识别。

能够说,RAPIDS和整个PyData生态编制,是打破大数据分析TPCx-BB基准记录所不能获缺的基础。

五、先辈互连技术为全球顶尖天气预报机构的超算挑供声援

超级计算正在转折天气预报与模拟。气象亲善候模型都是计算和数据浓密型模型,展望质量取决于模型的复杂性和高分辨率。

其平分辨率取决于超级计算机的性能,而超级计算机的性能又取决于互连技术是否能够在各计算资源之间快速、有效并且以可扩展的手段移动数据。

相较其他互连技术,NVIDIA Mellanox InfiniBand网络具有更高的性能、可扩展性和弹性,是现在市面上唯一的200Gb/s高速互连产品,经由过程先辈的端对端自体面路由、拥塞限制和服务质量实现最高网络效果。

凭借技术上风,NVIDIA Mellanox InfiniBand网络已成为气候钻研和天气预报行使的实际标准。

西班牙气象局、中国气象局、芬兰气象局、NASA和荷兰皇家气象局等很多全球领先的气象服务机构都选择NVIDIA Mellanox InfiniBand网络添速其超级计算平台。

例如,北京市气象台选择200 Gigabit HDR InfiniBand互连技术添速其崭新超级计算平台。该平台将被用于添强天气预报、改进气候和环境钻研,并将被用于2022年北京冬季奥运会的天气预报。

法国国家气象局(Meteo France)选择HDR InfiniBand添速其两台崭新的大型超级计算机。该机构为交通运输、农业、能源和很多其他走业的公司以及多多音信媒体与全球体育和文化运动挑供天气预报服务。

欧洲中程天气预报中央(ECMWF)的崭新超级计算机将在今年安放,为欧洲30多个国家的天气预报和展望钻研人员挑供声援,而在HDR InfiniBand技术的声援下,该超级计算机有看使该中央的气象亲善候钻研计算能力挑高5倍。

据悉,更多全球领先的气象亲善候机构将于今年宣布安放行使HDR InfiniBand的新超级计算平台。

结语:引领新的计算革命

不论是AI、云计算等新兴产业的不息发展,照样越来越多传统企业走向数字化和智能化转型,数据和添速计算日好成为决定企业洞察力、效果以及创新速度的关键要素。

今年GTC大会上推出的A100 GPU已如一颗惊雷响彻AI和数据科学周围,而随着更多内置A100的多款服务器的问世,NVIDIA正与服务器制造商等配相符友人一首, 解决AI、数据科学和科学计算周围最复杂的挑衅,引领新的计算革命。



友情链接

Powered by 大石桥市义悔建材网 @2018 RSS地图 html地图

Copyright 365站群 © 2013-2018 360 版权所有