H.267:一种可能的未来编解码器

H.267:一种可能的未来编解码器

H.267 预计在 2028 年 7 月至 10 月间完成。如果历史经验属实,这就意味着 H.267 要到 2034-2036 年才能得到实际应用。

本文内容来自 streamingmedia 特约编辑 Jan Ozer 的分享。以下是对 H.267 标准设计目的的简要描述,以及作者对将制定该标准的委员会和技术开发人员的建议,全文如下:

主要性能目标

在深入探讨我的建议之前,先介绍一下 H.267 的设计目标。根据 JVET 于 2024 年 7 月 14 日发布的文件《下一代视频编码标准的拟议时间表和要求》,H.267 的目标是在 4K 及更高分辨率下,比VVC(Main 10)至少降低 40% 的比特率,同时保持相似的主观质量。

增强压缩模型 (ECM) v13 已证明在随机存取配置中可节省超过 25% 的比特率,屏幕内容的比特率可提高 40%。主观评估证实了这些增益,在专家和普通观众的评估中都显示出强劲的性能。

H.267:一种可能的未来编解码器
图 1. 在 RA 配置下,H.267 压缩性能与 VVC 在 luma PSNR 方面的比较

以下是有关 H.267 的其他一些要点:

  • 该编解码器专为各种应用而设计,包括移动流媒体、直播、沉浸式 VR/AR、云游戏和人工智能生成的内容。
  • 它以高效的实时解码和可扩展的编码器复杂性为目标,支持高达 8Kx4K 的分辨率和高达 240 fps 的帧速率。
  • 它强调对立体 3D、多视图内容、广色域和高动态范围的灵活支持。

下一步是什么?降低比特率并不等于提高相关性

如果 H.267 在 2028 年最终定稿,那么历史告诉我们,它至少要到 2034 年才会有意义。仅这一时间表就提出了一个关键问题: 到那时它还会有意义吗?该编解码器预计比 VVC 降低 40% 的比特率,这在纸面上听起来令人印象深刻,但仅有效率并不能保证其被采用。我们已经从 VVC 身上看到了这一点,由于硬件集成缓慢、许可问题和解码耗电,VVC 在很大程度上仍处于边缘地位,除非 H.267 从根本上重新考虑其设计重点,否则它还会重蹈覆辙。

H.267 的真正风险:尚未到来就已过时

虽然 H.267 旨在显著降低比特率并提高效率,但没有人愿意大声说出风险:在它被广泛采用之前,它可能会被完全不同的编解码器类别完全取代。危险不仅在于 H.267 部署缓慢,还在于当它准备好硬件时,世界可能已经发生了变化。

Deep Render等公司已经在开发的 AI 原生编解码器,已完全抛弃了基于块的传统架构。这些解决方案在纸面上可能无法提供比 H.267 更好的压缩比,但它们可以通过已嵌入数十亿台设备的 NPU 立即部署。无需专用硬件解码器,也无需等待芯片组刷新周期。随着 NPU 变得无处不在,AI 驱动编解码器的无摩擦部署可以超越 H.267 的理论收益,具有实际效率、可扩展性和上市时间优势。

因此,真正的风险不是 H.267 在技术上会失败。而是它在技术上会成功,但在实践上却变得无关紧要。当它通过标准化、许可和硬件集成的考验时,我们可能生活在一个编解码器不再是“标准”的世界,而是动态的、人工智能优化的算法,可以像软件补丁一样轻松更新。问题不在于 H.267 是否会奏效,而是我们是否仍然需要它。

将环境影响明确定义为优先事项

Philippe WETZEL 的优秀论文《新视频压缩标准(H.267)的挑战和目标》强调了在视频压缩中实现环境可持续性所面临的日益严峻的挑战。目前,视频占互联网能耗的 80% 以上,在智能手机、社交媒体、物联网和机器对机器 (M2M) 应用的推动下,编码器迅速激增,这使得业界的关注点从以解码器为中心的效率转向了平衡编码器和解码器的能源需求。连续标准的复杂性导致收益递减,压缩效率的边际提升需要成倍增加的处理能力,这对于视频会议、云游戏和自主系统等实时、低延迟应用来说尤其棘手。

潜在的解决方案在于为 NPU 优化算法,并利用基于软件实现的能效而不是专用硬件。JVET 文件强调了这些问题,强调编解码器的复杂性需要既能进行可行的实时解码,又能最大限度地降低功耗,但并未设定明确的环境目标。这些文件共同表明,如果没有深思熟虑的设计选择,未来的编解码器尽管有技术进步,但仍有可能加剧能源需求。

隐藏的知识产权风险:传统架构为何带有法律包袱

除了技术停滞不前之外,H.267 如果固守传统的基于块的架构,还会面临另一个风险:知识产权(IP)纠葛。每一代视频编解码器——从 MPEG-1 到 VVC,都在旧专利的基础上增加了新专利,形成了一个由重叠的权利要求、分散的许可池和使用费义务组成的纠缠不清的网络。从 HEVC 开始,不幸的是,一直延续到 VVC,这种遗留下来的法律复杂性一直是采用的重大障碍。

现在想象一下另一种选择:从头开始设计的 AI 原生编解码器,摆脱传统编解码器的架构 DNA。通过超越运动矢量、块分区和熵编码(MPEG IP 生态系统的支柱),AI 驱动的编解码器可以从 IP 角度提供全新的视角。

这不仅仅是为了简化法律。具有更清晰的 IP 环境的编解码器更容易获得许可,更快地被采用,并且不易受到诉讼。对于厌倦了传统编解码器法律雷区的大型科技公司来说,它也更具吸引力。

如果 H.267 仍局限于传统架构,它不仅会继承技术限制,还会承担法律和商业责任。与此同时,AI 原生编解码器可以实现跨越式发展——不仅具有更好的压缩率或更快的部署速度,而且具有与传统编解码器困境相比无摩擦的 IP 模型。在这种情况下,抛弃过去不仅仅是一种技术选择,更是一种战略要务。

是时候完全放弃基于块的架构了吗?

鉴于以上所有情况,H.267 的架构师应该问一个令人不安的问题:我们是在创新,还是只是在优化一个 40 年前的想法?从 MPEG-1 到 VVC 的每种编解码器都是基于块的压缩的演变。当然,我们添加了花哨的工具——变换跳过、仿射运动补偿、高级帧内预测等,但基本方法并没有改变。结果呢?复杂性壁垒,压缩效率每增加 1%,功率、硅片空间和开发时间就会大幅增加。

那么,为什么不打破常规呢?与其迭代基于块的编码,如果我们完全倚重 AI 驱动的架构呢?基于神经网络的编解码器 (NNVC) 已经在实验环境中显示出有希望的早期结果,为运动预测、变换编码甚至熵建模提供了完全不同的方法。想象一下,一个编解码器,视频的压缩不是通过猜测像素冗余,而是通过针对 NPU 优化的机器学习模型来理解内容结构。

是的,这项技术目前还未准备好投入生产。但是,如果基于块的 H.267 无论如何要到 2034-2036 年才会发挥作用,那我们为什么要把自己锁定在一个已经过了黄金时代的架构中呢?如果基于 AI 的 H.267 可以开箱即用地在 NPU 上运行,那么它就可以避免导致 VVC 部署陷入瘫痪的解码器部署延迟,并在发布时在数十亿台设备上运行。

给委员会的建议

当 H.267 成为现实的时候,我早已退休,所以我的建议是:不要为我们十年前解决的问题设计编解码器。为下一个十年的平台、处理器和环境现实设计编解码器,否则当它被更简单、适应性更强的替代品淘汰时,不要感到惊讶。

以下是需要关注的重点:

  • 强制要求 NPU 和通用硬件兼容。如果 H.267 依赖专用硬件解码器,那么它就会失败。设计时要考虑 NPU 和灵活的加速器 — 将它们作为主要目标,而不是事后考虑。
  • 将环境可持续性作为一项明确要求。视频占互联网能源消耗的 80% 以上。不要再将能源效率视为次要利益。将其纳入标准对编码器和解码器的核心要求中。
  • 复杂性并不是荣誉的象征。如果实时编码器无法在没有企业级芯片的情况下实现 H.267 的理论收益,那么您建立的是一个科学项目,而不是一个标准。可行性与性能同样重要。
  • 在许可问题出现之前就解决它。不要重复 HEVC 的错误。如果 H.267 的许可分散、昂贵或不透明,行业将默认使用现有的编解码器或基于 AI 的替代方案——不是因为它们更好,而是因为它们更容易采用。
  • 问一个难题:我们真的需要这个吗?如果 AI 驱动的编解码器可以提供类似的效率提升,并可以通过 NPU 立即部署,那么 H.267 的复杂性、许可和硬件要求又有什么意义呢?如果你不能清楚地回答这个问题,那么是时候重新考虑整个方法了。

H.267 面临的最大威胁不是技术故障,而是无关紧要。不要把未来十年的时间都花在完善一个已经向前发展的未来标准上。

原文链接:https://www.streamingmedia.com/Articles/News/Online-Video-News/H.267-A-Codec-for-(One-Possible)-Future-167889.aspx

原创文章,作者:ZEGO即构科技,如若转载,请注明出处:https://market-blogs.zego.im/reports-info/2062/

(0)
上一篇 1月 22, 2025 8:35 上午
下一篇 2月 11, 2025 8:03 上午

相关推荐

发表回复

登录后才能评论