英伟达的技术重心

在2019英伟达GTC大会上,新品和新技术如井喷一般层出不穷,为此我们探讨了英伟达的技术边界。而到了2021年GTC,与其他ICT领导厂商的发展历程一样,大量创新成果开始围饶几个核心发展出一个个体系。换句话说,我们在2021年的GTC上,已经有条件去探讨英伟达的技术重心了。

算力如何成为王道

技术的进步让我们体验到了越来越多科技的便利,无论是AI还是物联网,都逐渐成为生活的一部分。但时代变化、技术更迭,背后不变的是雪崩般增长的数据和与之伴生的算力黑洞。物联网推动数据几何级增长,人工智能和大数据技术则榨干了芯片企业每一丝算力,将这些数据转化为价值。而且在算法红利逐渐消失的现在,算力的增长就变成了货真价实的真金白银。算力的提升也就成为了真正的王道。

  一个有意思的现象是,2020年的TOP500超算系统排名中,在TOP10的超级计算机中有8台采用了英伟达GPU、InfiniBand网络技术,或同时采用了两种技术。TOP500榜单的系统中,有333套(三分之二)采用了英伟达的技术。显然,英伟达一直在争夺算力的至高点,并且已经占据了大量类似的至高点。

这样,算力显然已经成为英伟达技术边界的一个核心。当我们就超级计算中心的支持问题求教于NVIDIA专业人员时,NVIDIA网络高级副总裁Gilad Shainer的一番话引起了我们的关注:“如今,超级计算中心和公有云的诉求正在走向融合——它们需要为新一代高性能计算(HPC)、AI和数据分析的应用提供尽可能高的性能,同时还应安全隔离应用,并响应用户对流量的不同需求。凭借NVIDIA Quantum InfiniBand平台,现代数据中心已经可以将这一远景变为现实。”

算力的支撑之道

英伟达一直在抢占算力王道的致高点绝不是什么新闻,但通过技术变革,让现代数据中心发生翻天覆地的变化,也许才是我们要研究的重点。

在2020年,英伟达与VMware合作的VMware Monterey项目开始浮出水面。当时业界专家对此的解读,是很多人认为数据中心中所能实现的变革范围已经很小,但其实却是数据处理器的一小步变化,却可能引发现代数据中心的巨变。NVIDIA在数据中心的新产品——DPU来临时,这个预言得以实现。DPU把ARM处理器核、VLIW矢量计算引擎和智能网卡的功能集成在了一起,主要应用在分布式存储、网络计算和网络安全领域。BlueField-3 DPU的出现让人们眼前一亮,在数据中心内,一个CPU+GPU+DPU的新时代来临了。

从算力王道的角度去观察2021GTC,我们会发现BlueField-3只是英伟达算力王道的冰山一角,英伟达显然已经做了更多。于是,关于英伟达的算力支撑之道,开始更多展现在我们眼前。

英伟达在GTC大会上发布了NVIDIA Quantum-2,这是新一代的InfiniBand网络平台,它为云计算提供商和超级计算中心提供了极致的性能、广泛的接入能力及强大的安全性。

NVIDIA Quantum-2平台可以看做是400Gbps的InfiniBand网络平台,包括NVIDIA Quantum-2交换机、ConnextX-7网卡、BlueField-3数据处理器DPU和所有支持这种新架构的软件。综合各项性能来看,它是迄今为止最先进的端到端高性能网络平台。

在全球云服务提供商为客户提供更多超级计算服务和超级计算中心向广大用户开放之际,需要更多算力的它们,显然会非常欢迎NVIDIA Quantum-2平台的到来。而针对上述两种需求,NVIDIA Quantum-2平台也不负所望,凭借其云原生技术,每端口可以提供每秒400Gb/s的高吞吐量和先进的多租户支持功能。

这是个软件定义一切硬件的时代,所以我们千万不能忽略DOCA的变革。在DOCA 1.1之中,DOCA成为了释放DPU潜力的关键。DOCA的三个主要组成部分:驱动程序、库和各种服务都在DPU上运行。而在GTC2021上,DOCA 1.2来了。

DOCA 1.2可以支持云原生架构,开发者可以借助它加速将安全作为一项服务进行部署。换句话说,DOCA 1.2是一款零信任安全框架,这个框架可以帮助开发者实现网络安全即服务,将数据中心安全保护扩展到用户涉及的应用、数据、设备、存储、基础架构等几乎每个关键点。

能力越大,相应的责任也就越大。在算力支撑系统掌控了更多领域之后,与之相伴随的数据价值就会越高。而DOCA 1.2如同一个保护神,给算力支撑系统加了一把锁。借助DOCA 1.2的零信任安全框架,开发者可以建立量化的云服务来控制资源访问、验证每个应用和用户、隔离可能受到影响的机器并帮助保护数据免遭破坏和盗窃。

谈到此处,我们还要介绍一下NIVIDIA Morpheus,这是一个基于NIVIDIA RAPIDS的零信任AI应用框架,用来分析来自网络流量日志、应用日志和云日志的流式遥测数据,为网络上的每个应用和用户建立独立的行为档案。一旦出现异常,它将提醒安全运营团队注意潜在的安全漏洞。在多数情况之下,NIVIDIA Morpheus将与DOCA 1.2一起担负起安全守卫的职责。

当然,如同NIVIDIA CUDA能够构建基于NIVIDIA GPU的应用一样,DOCA 1.2更为主要的使命,还是使开发者能够基于BlueField DPU构建软件定义、硬件加速的网络、安全、存储和管理应用。

在GTC2021上,英伟达新发布的大量新品,为算力提供了更为强健的支撑。Juiper Networks就首批使用了BlueField与新DOCA组合,Juiper Networks CTO Raj Yavatkar做了这样的评价:“零信任安全应成为全面安全战略的一个基础支柱。通过引入新的方法实现零信认安全的操作化,我们可以使这项技术在整个行业中快速普及。Juiper Networks长期以来一直倡导开放架构以确保客户的选择权,而DOCA能够很好地满足行业客户的数字化转型需求,这种方法的应用将帮助客户更好地保护其云应用并采用零信任原则。”

透过更多用户的反馈,我们才能了解英伟达算力体系的成功与否。而从Juiper Networks等用户的反馈中,我们不难看出,英伟达打造了潜力极大的整套算力支撑架构,我们不知道的是,这套算力支撑架构将通向哪里:HPC、基因组学、5G、数据科学、机器人学,还是更多还没有展现出来的领域?而这些问题的答案将通向一个新的英伟达技术边界。

via 比特财经
分享到QQ 分享到微信 分享到微博

0 条评论

友情链接