前言,接触英伟H100 SXM服务器的朋友经常会看到产品配置单里包括了2块BFD-3,不少朋友就有疑问了,既然整机已经有了8张CX-7的400G网卡为啥还配置BFD-3?到底BFD-3和CX-7有何本质区别和作用?我们都知道服务器主板自带BMC网口,为何BFD也有BMC的网口?
一、网卡、智能网卡、DPU之间的逻辑关系
通过以下几个点的对比让大家了解他们的区别(个人观点仅供参考)
几个问题 |
NIC |
Smart-NIC |
DPU |
是网卡吗? |
√ |
√ |
√ |
是智能网卡吗? |
x |
√ |
√ |
是DPU吗? |
x |
x |
√ |
是计算机吗? |
x |
x |
√ |
二、智能网卡和DPU出现的原因
1、传统网卡时代
传统数据中心,CPU是绝对核心,但是随着摩尔定律失效,CPU算力增长速度已经不能满足数据爆发带来的处理要求(成为了瓶颈)。怎样给CPU减负就落在了网卡(网络适配器)上,这也推动了智能网卡的高速发展。
2、智能网卡时代(第一代)
第一代智能网卡以数据平面的卸载为主,比较典型的有 OVS Fastpath硬件卸载,基于RoCEv1和2的RDMA网络硬件卸载,融合网络中无损网络能力(PFC,ECN,ETS等)的硬件卸载,存储领域NVMe-oF的硬件卸载,以及安全传输的数据面卸载等。
3、DPU智能网卡时代(第二代)
- DPU的出现是为了解决数据中心中存在三个方面的问题:
- 节点间:服务器数据交换效率低、数据传输可靠性低,
- 节点内:数据中心模型执行效率低,I/O切换效率低、服务器架构不灵活,
- 网络系统:不安全。
三、通俗的讲DPU比Smart-NIC强在哪里
NVIDIA对DPU智能网卡有这样的定义:一种基于 DPU 的网络接口卡(网络适配器),用于卸载系统 CPU 通常会处理的任务。使用自己的板载处理器,基于 DPU 的 SmartNIC 可以执行加密/解密、防火墙、 TCP / IP 和HTTP 处理的任意组合。总结就是可以帮CPU“干活”,而且自己也有CPU能完成各种和“网络安全”相关的“任务”。
四、英伟达BlueField-3 DPU的产品情况
针对超大规模云技术推动数据中心走向了新的架构,利用一种专门针对数据中心基础架构软件而设计的新型处理器,来卸载和加速由虚拟化、网络、存储、安全和其它云原生AI服务产生的巨大计算负荷,这种产品即BlueField DPU系列。
五、英伟达BlueField-3 DPU-片上系统布局
BlueField-3是串联在服务器PCIE路径上的“独立节点”
1、ARM+OS可以分担各类原来主机OS上的负载。
2、集成各种加速器提高效率(数据处理、安全、存储)
3、PCIE sw芯片可以用于NVME SSD扩展柜的场景。
4、BMC芯片可实现在云环境下原有主机资源独立管理。
六、BlueField-3的典型应用场景推荐
NVIDIA? BlueField?-3 DPU (数据处理器)是第三代基础设施计算平台,使企业能够构建从云到核心数据中心再到边缘的软件定义、硬件加速的 IT 基础设施。借助400Gb/s 以太网或 NDR 400Gb/s InfiniBand 网络连接,BlueField-3 DPU 可以卸载、加速和隔离软件定义的网络、存储、安全和管理功能,从而显著提高数据中心的性能、效率和安全性。
七、BlueField-3在Vmware私有云的应用举例
八、英伟达的DPU路线图