DPU 推动前所未有的数据中心转型

2022-04-18 16:36:34 昌辉 50

借助 NVIDIA BLUEFIELD 推动前所未有的数据中心转型


Sinoinfo_Pic


数据中心是新的计算单元

云计算和人工智能正在推动现代数据中心架构的根本变革。基础架构虚拟化是云计算的基础,已成为几乎每个数据中心的主流。软件定义的数据中心尽管提供了极大的灵活性和可管理性,但将高达 30% 的 CPU 内核用于基础架构,消耗原本可以使用的内核运行业务应用程序。随着摩尔定律的终结,以 CPU 为中心的基础设施已经达到了极限,无法满足新兴技术的严格性能要求,包括数据科学、物联网 (IoT) 和 5G 无线网络。


容器化应用程序的出现和云的多租户特性正在推动东西方通信的指数级增长。随着应用程序处理和数据速度超出单个计算平台的处理能力,数据中心已成为新的计算单元。最后,广泛且不断变化的网络威胁形势迫使具有云意识的组织在实施零信任防御计划的同时不断评估和调整其安全态势。



NVIDIA BLUEFIELD

推动前所未有的数据中心转型

数据处理单元 (DPU) 是一种新型处理器,可加速数据中心基础设施的处理。 NVIDIA®BlueField® DPU 是一种芯片上的数据中心基础架构,将高速网络接口与强大的软件可编程 Arm® 内核相结合,可实现突破性的网络、存储和安全性能。许多世界顶级服务器制造商提供或正在构建由 BlueField DPU 提供支持的系统。 BlueField 卸载、加速和隔离以前在主机 CPU 上运行的各种软件定义的基础设施服务,克服了性能和可扩展性瓶颈,并消除了现代数据中心的安全威胁。 BlueField DPU 将传统计算环境转变为安全且加速的数据中心,使组织能够有效地运行数据驱动的云原生应用程序以及遗留应用程序。通过将数据中心基础设施与业务应用程序分离,BlueField DPU 可增强数据中心的安全性、简化运营并降低总体拥有成本。

NVIDIA DOCA™ 软件框架使开发人员能够为 BlueField DPU 快速创建应用程序和服务。 DOCA 以面向未来的、API 驱动的思维方式构建,可轻松利用 DPU 硬件加速器,提供无与伦比的数据中心性能、效率和安全性。 DOCA 在网络、存储、网络安全、可管理性等领域创建由 DPU 驱动的应用程序的广泛生态系统方面发挥着关键作用。本文阐述了一些最突出的 DPU 应用程序,展示了 BlueField 如何实现数据中心的未来。

Sinoinfo_Pic

云计算

十多年来,全球云计算市场经历了快速增长。根据 Gartner1 的数据,全球基础设施即服务 (IaaS) 市场在大流行期间扩大,从 2019 年的 457 亿美元增长到 2020 年的 40.7%,达到 643 亿美元。提供按需计算能力、数据存储和对于各种规模和行业的组织的网络连接,云计算在很大程度上依赖于资源共享来实现一致性和规模经济。这一核心原则引导全球最大的云服务提供商 (CSP) 率先采用 DPU 技术,优化数据中心基础架构堆栈以实现令人难以置信的效率和可扩展性。


推动软件定义数据中心的趋势

随着越来越多的企业将工作负载转移到云,他们的目标是为新的本地数据中心带来相同的云运营模式和经济性。 NVIDIA BlueField DPU 的理想定位是为各种云 IaaS 交付模型提供一流的性能、效率和安全性。在虚拟化云环境中,DPU 卸载、加速和隔离虚拟机管理程序软件和基础设施处理与租户的应用程序。这提供了线速网络性能、存储弹性和增强的安全性,同时释放 CPU 内核来运行业务应用程序。弥合裸机和云之间的差距 裸机云传统上难以配置、保护和管理。 BlueField DPU 为云运营团队提供了一个可信的环境,可以独立于租户来控制他们的裸机服务器。部署 BlueField 已将裸机云转变为性能优化、安全且敏捷的计算基础架构。许多企业正在部署由 Kubernetes 提供支持的裸机服务器基础架构来运行现代应用程序。 BlueField DPU 支持安全且加速的云基础架构,用于大规模运行云原生应用程序。


软件定义的网络

现代数据中心网络越来越多地被虚拟化并作为服务提供。这些软件定义网络 (SDN) 提供了更大的灵活性和控制力,使企业能够轻松地从一个数据中心的场所扩展到多云和混合云环境。实施 SDN 技术和硬件加速网络(即单根输入/输出虚拟化 (SR-IOV))之间长期存在的冲突主要是由于两者之间的根本差异:SDN 抽象了底层网络接口卡 (NIC) 硬件和为虚拟机/容器 pod 提供虚拟化网络设备。但是,SDN 还利用了相当多的 CPU 处理能力,这些能力原本可以用于运行业务应用程序。 SR-IOV 正好相反,在虚拟机/容器 pod 和 NIC 硬件之间提供直接接口。它绕过主机的 CPU 和操作系统,从 IO 任务中释放昂贵的 CPU 资源。话虽如此,数据中心建设者倾向于避免使用 SR-IOV,因为它消除了实时迁移功能,并且可能需要在客户操作系统上安装网络驱动程序。 SDN 和 SR-IOV 加速网络之间的这种不和谐迫使数据中心架构师和网络工程师优先考虑其中一个,通常以应用程序性能不佳或系统设计不灵活以及更高的总拥有成本 (TCO) 为代价。


两全其美:软件定义、硬件加速

NVIDIA Accelerated Switch and Packet Processing® (ASAP2) 技术直接内置于 BlueField DPU 中,可完全卸载和隔离 SDN 层并加速网络数据路径。 BlueField 的 ASAP2 技术提供了两全其美:裸机服务器的性能和效率以及 SDN 的灵活性和敏捷性。 ASAP2 技术堆栈提供一系列网络加速功能,使客户能够在最大性能 (SR-IOV) 或支持旧环境 (VirtIO) 之间进行选择,同时保持 SDN 层。ASAP2 技术在上游集成到Linux 内核和一系列领先的 SDN 框架。利用 ASAP2,组织可以构建分布式防火墙功能,执行通过 SDN 层编排的网络安全策略。



可组合存储基础设施

随着数据量的不断增加,企业正在优先考虑软件定义存储 (SDS) 技术,以满足其对灵活性、敏捷性、易于管理和降低成本的要求。 SDS 通过使存储资源可编程,使用户和组织能够将存储资源与底层硬件平台分离或抽象化,从而提高效率和更快的可扩展性。虽然 SDS 技术与传统存储基础设施相比具有明显优势,但它们提供的性能通常受到限制在读/写速度或每秒输入/输出操作 (IOPS) 和延迟方面的应用。性能下降通常是由于存储硬件的软件抽象。现代应用程序,包括专业可视化、深度学习和内容交付网络 (CDN),具有 SDS 解决方案无法满足的严格性能要求。这就是最适合应用程序与最易于组合、可维护和经济高效之间的冲突。


弹性块存储变得简单

借助 NVIDIA BlueField 软件定义网络加速处理 (BlueField SNAP™) 技术,企业可以使用硬件虚拟化实现软件定义存储的所有运营优势和经济性,以及高端直连存储的性能。部署 DPU 允许将网络块存储弹性配置到 BlueField SNAP,存储变得虚拟化、精简配置和受保护,并且可以根据需要在服务器之间迁移,从而节省资本支出和运营支出。


网络安全

随着企业采用云计算和边缘计算技术,网络安全仍然是 IT 和业务领导者最关心的问题。现代数据中心架构——鉴于其基础设施无处不在的虚拟化——具有更大的攻击面,使企业面临网络威胁。过去足够的外围网络安全解决方案不再能够为现代云原生数据中心提供全面保护。具有分布式容器化应用程序的多租户环境使网络隔离技术对东西方网络威胁无效。这些类型的攻击越来越普遍;一旦网络受到威胁,攻击者将尝试在网络上横向移动,从一台服务器跳到另一台服务器。将安全性提升到一个全新的水平 NVIDIA BlueField DPU 通过提供创新的硬件引擎来改变数据中心的安全性,这些引擎可以卸载、加速和隔离每台主机的整个堆栈的安全性。

这些引擎保护数据中心基础设施并面向以下功能:

    > 增强平台安全

    > 加速加密和解密在线速度

    > 执行状态包过滤和执行分布式安全策略

    > 在硬件中存储和管理密钥并加速公钥基础设施 (PKI)交换

    >检测恶意代码和缓解攻击

BlueField DPU 使安全功能能够完全独立于主机的 CPU 和操作系统运行。这种隔离是使 BlueField 最适合零信任安全解决方案的关键,因为它提供了安全功能与主机所需的分离,同时提供了无与伦比的性能。如果主机受到攻击,安全功能与受感染主机之间的分离有助于阻止攻击进一步蔓延。BlueField DPU 还充当 NVIDIA Morpheus(一种开放式 AI 网络安全框架)的传感器。 Morpheus 可以从数据中心的每台 DPU 加速服务器接收丰富的实时网络遥测数据,而不会影响性能。将 DPU 的实时遥测技术集成到 Morpheus 中,带来了世界上最好的人工智能计算,以应对复杂的网络安全挑战。


数据科学与人工智能

用于数据科学和 AI 工作负载的 GPU 加速计算日益普及,越来越依赖于强大而强大的网络基础设施。随着应用程序处理远远超出单台计算机扩展到整个数据中心,高吞吐量、低延迟的网络连接是利用 GPU 强大功能的关键。


推动当今的计算架构超越其限制

NVIDIA BlueField DPU 支持一系列硬件加速引擎,用于GPU 到 GPU 或 GPU 到存储通信。GPUDirect® 远程直接内存访问 (RDMA) 技术是一项重要的 BlueField 功能,可解锁高性能网络连接以向 GPU 提供数据。 GPUDirect RDMA (GDR) 允许在 GPU 之间进行高效的零拷贝数据传输,同时促进 BlueField 专用集成电路 (ASIC) 中的硬件引擎。 GPUDirect Storage (GDS) 是一项新技术,可提供通往本地/远程存储(如非易失性内存快速 (NVMe) 或 NVMe over Fabrics (NVMe-oF))和 GPU 内存的直接路径。当 GPU 和存储介质不在同一个机箱中时,BlueField 可以在分布式环境中实现这种直接通信。 BlueField 的 GDS 增加了带宽、降低了延迟并增加了存储和 GPU 之间的容量。这很重要,因为数据集大小不再适合系统内存,GPU 的数据 IO 成为运行时瓶颈。启用直接路径可以缓解横向扩展数据科学和 AI 工作负载的瓶颈,并提供令人难以置信的应用程序性能。


视频流

随着全球对视频内容的需求不断增长,媒体和娱乐市场预计 4K 和 8K 超高清 (UHD) 视频将出现巨大增长。视频制作的众多新兴趋势包括高动态范围和更高的帧速率,它们正在重塑视频质量。为满足预期需求做准备的视频制作工作室正在逐渐将其专有的基于串行数字接口 (SDI) 的视频制作解决方案转移到基于下一代互联网协议 (IP) 的基础设施上。这些制作公司中的大多数都采用商用现货 (COTS) 服务器硬件,这在合规性、规模和性能方面提出了各种挑战,同时缺乏虚拟化基础架构和基于云的解决方案的经济和运营优势。


启用云规模化视频解决方案

NVIDIA BlueField DPU 在云、数据中心和边缘转换视频流,使高性能网络基础设施能够大规模提供高清和超高清视频流。 BlueField 由专门构建的、符合电影和电视工程师协会 (SMPTE) 标准的 NVIDIA Rivermax SDK 提供支持,提供零拷贝、帧级视频传输,通过将视频流卸载和加速到 DPU 并绕过系统内核。更重要的是,BlueField DPU 提供基于硬件的内置视频加速,可在 GPU 环境中提供卓越的性能。对于制作工作室,部署 BlueField DPU 可以让他们重新利用相同的硬件基础设施来处理不同的工作负载,从而成功、经济高效地交付下一代 -具有前所未有的灵活性和敏捷性的新一代超高清视频流



边缘的智能服务

5G 网络正在引领无线通信的新时代,它以 4G 的 1/10 延迟提供 1,000 倍的带宽和 100 倍的速度。 5G 允许每平方公里连接数百万台设备,正在工厂和零售店等边缘位置部署作为 WiFi 的替代方案。这些应用程序需要全新的网络架构,该架构完全由软件定义、可动态重新配置、易于部署且易于管理,以保证特定的服务质量。


融合 AI 和 5G 功能

NVIDIA AI-on-5G 是一个利用 NVIDIA BlueField DPU 的创新计算平台借助 NVIDIA 广泛的 AI 软件库和面向 5G 的 NVIDIA Aerial™ SDK。AI-on-5G 平台可加快部署时间,并为一系列超低延迟企业 AI 项目提供支持,包括精密机器人、自动导引车和数字双胞胎用于产品开发和制造。BlueField 的作用是帮助每个企业交付具有行业领先性能和数据中心安全性的 AI 应用程序。它针对 5G 连接和多租户、云原生环境进行了优化,在边缘提供软件定义、硬件加速的网络、存储、安全和管理服务。


云原生超级计算

当今最具挑战性的高性能计算 (HPC) 和 AI 工作负载依赖于超级计算机的力量,通过有利于科学、工业和社会的研究和成果来改变世界。英伟达云原生超算将超算提升到一个全新的高度。英伟达云原生超算结合了HPC云的强大能力和TOP500级的超级计算机,以及云计算服务的安全性和易用性,实现了最苛刻的 HPC 和 AI 工作负载。


具有多租户隔离的裸机性能

NVIDIA 云原生超级计算平台利用具有高速、低延迟 NVIDIA InfiniBand 网络的 NVIDIA BlueField DPU 架构来提供最佳的裸机性能,同时本机支持多-节点租户隔离。 DPU 可处理存储、系统管理和多租户安全等任务,支持原生云服务,让多个用户安全地共享资源,而不会损失应用程序性能。通过卸载 CPU 以专注于处理任务,系统能够保持运行 HPC 和 AI 工作负载的最高效率,最大限度地提高整体系统性能。HPC 和 AI 通信框架和库在确定应用程序性能方面发挥着关键作用。由于它们的延迟和带宽敏感特性,将库从主机 CPU 或 GPU 卸载到 BlueField DPU 为通信和计算的并行进程创建了最高程度的重叠。它还可以减少操作系统抖动的负面影响,同时显着提高应用程序性能——这是启用下一代超级计算架构的关键。


转变您的数据中心

NVIDIA BlueField DPU 是一类新的数据中心处理器,针对基础设施处理和将传统计算环境转变为安全和加速的数据中心进行了优化。 通过卸载、加速和隔离数据中心基础设施,BlueField 可提高应用程序性能、增强数据中心安全性并简化 IT 运营。










微信公众号