跳到主要内容
博客计算针对媒体工作负载的 VPU 和 GPU 基准测试

针对媒体工作负载的 VPU 和 GPU 基准测试

MP-56512_博客标题和社交图片 媒体工作负载的 VPU 和 GPU 基准测试_带文本标题 (1)

Akamai云最近推出了对NETINT的T1U Quadra视频处理单元(VPU)的支持,使这些功能强大的显卡在部署云虚拟机时可以按小时收费。这些产品加入了Akamai云产品组合中已经提供的NVIDIA RTX™ 4000 Ada Generation GPU的行列。 

为了评估真实世界的性能和能效,我们与Cires21 合作,该公司自 2008 年以来一直是流媒体行业的先驱。通过使用针对 NETINT 和NVIDIA 架构进行优化的C21 Live Encoder,我们在要求苛刻的媒体工作负载中对 VPU 和 GPU 进行了基准测试,并将一些最具挑战性的视频作为测试对象进行处理。 

我们发现,在要求最苛刻的情况下,VPU 的能效比 GPU 高出 4.7 倍,在某些情况下甚至超过了 NVIDIA )NVIDIA 。GPU 在某些测试中确实表现出色,但其耗电量始终高于 VPU。 

如果您所在的公司正在计划来年的范围 3 排放,或者正在为当今人工智能环境下的能源需求而苦恼,那么 VPU 应该是您的首选测试工具。您可以在这里了解有关利用 VPU 的更多信息。 

基准设置

我们在同一个Akamai云区域(法兰克福)使用以下配置运行了每个测试: 

  • 一个 GPU实例的NVIDIA RTX4000 Ada x1 小型计划
  • 使用 NETINT Quadra T1U x1 小型计划的单个VPU
  • 两个实例都运行了 C21 Live Encoder 的优化 Docker 容器:一个使用 CUDAGPU),另一个使用 Libxcoder(VPU)

对这些卡进行了测试,以测量使用 H.264/AVC 编解码器的典型媒体工作流程的编码和解码部分。 

在下表中,您可以看到一个自适应比特率(ABR)梯形图以每秒 60 帧的速度从输入以 1:N的方式同时输出 1080p、720p、576p、432p 和 360p。表中的 "最大工作 "标签表示每个编码器实现可实时运行的最大同步转码工作。测试使用 1080p 分辨率的 6 分钟原始视频。然后,编码工作负载处理该视频,并将其重新编码为与目标输出相同的 H.264/AVC 格式。

汇总表:按分辨率划分的转码任务容量

决议NETINT Max 工作岗位NVIDIA Max 工作岗位NETINT 瓦特NVIDIA ™瓦特
1080p19161259
720p22241169
576p2025861
432p2128855
360p2030751
ABR681382

从上面的数据中可以看出,即使GPU 在较低分辨率下提供了更高的工作能力,它的能耗也明显更高。VPU 几乎在所有分辨率下都能提供更好的能耗表现,尤其是在高吞吐量和高分辨率工作负载中。 

在下表中,我们估算了 1,000 个同时流连续运行一年(一年 8,760 小时)的能耗。

表:1 000 个溪流 1 年的能源使用量

NETINT @ 1080p5,532,631.58KW 小时
GPU @ 1080p32,302,500.00KW 小时
NETINT @ ABR18,980,000.00KW 小时
GPU @ ABR89,790,000.00KW 小时

对于任何希望减少供应链排放,甚至在某些工作负载情况下提高吞吐量的企业来说,NETINT VPU都是一个很好的解决方案,Akamai可根据需要按小时提供。 

视频多方法评估融合(VMAF)得分

当然,如果牺牲质量,再低的功耗和再高的吞吐量也无济于事。下面的 VMAF 分数显示,VPU 在这方面也表现出色。

为了验证输出的准确性,我们对所有输出进行了 VMAP 测试。 

在上图中,我们的测试结果显示了由 NETINT Libxcoder 和NVIDIA Encoder 生成的高效视频编码 (HEVC) 的 VMAF 分数。每个分数都是在特定输出分辨率下报告的,括号中列出了相应的比特率。这些分数提供了视频质量的客观衡量标准,使我们能够比较每种编码器在不同编码设置下的视觉保真度。

在下一张图表(上图)中,我们的测试结果显示了 NETINT Libxcoder 和NVIDIA Encoder 在每种输出分辨率下的 AV1 VMAF 分数,括号中显示了相应的比特率。这些分数显示了每种编码器在使用 AV1 编解码器压缩视频时保持视觉质量的效果,突出了不同分辨率下效率和质量权衡的差异。

现在可在 Akamai 云中使用

通过优化 NETINT 的处理流水线,VPU 能够以更少的资源做更多的事情。NETINT Quadra T1U VPU 的峰值功耗仅为 13 瓦,它表明可以在不影响性能和质量的情况下高效地扩展媒体工作负载。 

从GPU视频编码迁移到基于 VPU 的视频编码,1000 个全年 1080p 数据流的年能耗可从 32 兆瓦时减少到 5.5 兆瓦时--节省 26.5 兆瓦时。这意味着每年可节省约 80% 的能源,同时每年还可减少约 12.6 吨的 CO₂ 排放量(假定采用全球平均排放系数)。 

如果您想试用这些 NETINT VPU 卡,现在就可以在 Akamai Cloud 上按小时付费使用。 

使用我们的加速计算计划按需部署 NETINT VPU 或NVIDIA GPU,或使用Cires21 的 C21 Live Encoder简化设置并最大限度地提高GPU 和 VPU 基础设施的效率。

注释

留下回复

您的电子邮件地址将不会被公布。 必须填写的字段被标记为*