加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 视频的一些基本概念
    • 视频的深度压缩
    • 深度压缩的不足
    • 为什么需要浅压缩
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

什么是超高清浅压缩?

02/23 12:50
2014
阅读需 9 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

元宵节将近,意味着“年”就要过完了。趁春晚的余温未过,我们再来回味下支撑这场“文化年夜饭”现场直播的技术:超高清浅压缩。这技术一看就是处理视频的,那么它到底有何神奇之处呢?“超高清”好理解,无非就是说视频画面的清晰度高,分辨率达到4K乃至8K。

那这里的“浅压缩”又是什么意思呢?我们先从视频的一些基础概念说起。

视频的一些基本概念

视频在本质上将一幅一幅独立的画面快速地连续播放,利用眼睛的视觉暂留效应让人产生“动”的感觉。视频中每一幅画面称作一“帧(frame)”,每秒钟播放的画面数量被称作“帧率”,单位为FPS,即Frame Per Second。一般来说,如果眼睛所看到的画面帧率高于每秒约10至12张的时候,就会认为是连贯的。为得到更为细腻的效果,电影制作常用24FPS、25FPS、30FPS等帧率。

更高的帧率,比如60FPS 和 120FPS 用于录制视频以慢动作播放。每一秒都要连续播放这么多画面,视频的大小一般来说都远大于图片,在线流畅播放占用的带宽也要大得多。如果不做任何处理,理论上要在线播放分辨率为4K,帧率为30FPS的视频,需要占用的带宽接近6Gbps。这简直就是流量饕餮。采用有线还能近距离传输还能扛住,用无线的方式就可太难了,即使强如5G也捉襟见肘。因此,我们需要对视频进行压缩。

视频的深度压缩

为什么视频可以被压缩呢?是因为每一帧的内部,以及多个帧间存在着大量的冗余信息。首先,在每一帧画面内,一幅图像之内相邻像素的颜色相关性很强,纹理大概率是连续变化的,背景还可能有大量重复的颜色。如果采用适当的算法,就可以去除冗余,使数据量得以压缩。然后,在多帧的画面之间,如果没有场景切换,相邻帧之间绝大部分画面是一样的:比如一只蝴蝶在花丛中飞行,多帧画面之间除了蝴蝶的姿态变化,其余都是不变的,数据自然就可以被压缩。

因此,视频的压缩有“帧内预测压缩”和“帧间预测压缩”两种方式,将视频分解为多个像素块,再结合当前帧和前后帧的内容进行压缩。

帧内预测的主要思想是:画面纹理是连续的,存在大量的“空间冗余”,因此可以使用相邻的已解码的像素预测未知像素。实际编码时只需对原始块减去预测块之后剩下的残差块进行操作,这样数据量可以有效减少。

帧间预测的主要思想是:既然相邻帧之间存在极强的相关性,存在大量的“时间冗余”,那么就只要找到当前块在参考帧中的位置,计算对应的位移并得出两帧之间的残差,然后只发送这个数据量很小的残差帧就可以了。

这样一来,压缩算法就把视频内容编码为I帧以及P帧。其中I帧作为关键帧,必须能够完全独立解码,因此只能使用帧内预测;P帧作为预测帧,仅反映上一个I帧变化的部分,既可以使用帧内预测,也可以使用帧间预测,但离开了I帧就无法解码。除了I帧和P帧之外,还有一种B帧(双向帧)。B帧的编解码可同时参考左右的帧,需要传输的数据量更小。

由于视频内容是连续的,往往时域的相关性更大,所以一般而言帧间预测的压缩效率更高,因此P/B帧一般都远小于I帧。这种帧内预测压缩和帧间预测压缩双管齐下的效果非常好,可以在画质基本没有损耗的前提下将原视频压缩得非常小,因此也叫做“深度压缩”。

以目前主流的压缩编码标准H.264 举例,1080P分辨率,60FPS的视频,经过压缩编码,仅需4Mbps的网络带宽,在手机上就有不错体验。

深度压缩的不足

然而,万事万物都有两面性。深度压缩的代价是什么呢?

最容易想到的就是:直播的播放延时。

前面已经说过,P帧和B帧的解码需要依赖其他帧,当终端观看直播时,极有可能接入的时间点是不能独立解码的预测帧,那么播放程序必须要等到关键帧后,才能正常解码播放,这就不可避免地导致了时延。

想象一下,如果两个I帧之间的间隔被设置为2秒,那么如果运气不好,接入直播后就有可能要等2秒后才能看到画面。

上述播放的接入时延其实还算小问题,深度压缩对视频制播的影响才是不可接受的。众所周知,在视频制播时,导播台的作用十分关键。导播台主要作用是将多机位的视频信号整合到一起,根据现场需求,由导播人员进行实时切换。

让我们把视线聚焦到上图的左侧。假设在春晚舞台上,艺术家正引亢高歌,多个机位拍摄不同角度的画面传回导播台进行制播处理,进行切换、分屏、叠加元素等。但由于这些视频流采用了深度压缩,极有可能导播员在将直播画面由机位1切换到机位2时,刚好赶上了不可解码的非关键帧,这下可好,所有观众的屏幕都卡住了。

因此,在这种场景下,使用深度压缩是不合适的。再说了,从机位到导播台的距离一般都不远,用超大带宽的有线传输就行,也不需要节省带宽,自然也没必要那么极致的压缩,采用“浅压缩”技术就够了。

为什么需要浅压缩

所谓浅压缩,其实就是舍弃掉会产生P帧或者B帧的帧间预测编码,全部采用帧内预测编码,这样生成的视频就全部都是I帧,每一帧都可以完全独立解码,虽然视频的数据量大幅增加,但也消除了深度压缩的不足之处。

既然浅压缩技术如此顺理成章,为什么还是在春晚直播时产生了轰动呢?

这是因为5G的引入。

传统的拍摄,要么使用固定拍摄机位,要么使用拖着线缆的可移动拍摄机位。这是因为传输浅压缩视频需要的带宽大,如果压缩率为1/8,每路4K视频也需要1Gbps的带宽,同时时延还要低,普通的无线方式难以满足。但5G可以。5G-A搭建的视频制播专网可实现10Gbps以上的带宽,自然可以实现“5G超高清浅压缩制播”了。由于时延低,无线机位和有线机位所拍摄的画面还可以实现丝滑混切。最后我们来总结一下。

浅压缩的主要用于场景是显示接口和专业的视频制播,信道的带宽非常充裕,要求的是无损的画质和低时延,压缩率一般就是1/8。普通用户一般情况下接触不到浅压缩,因此叫做ToB压缩。深度压缩主要是面向用户的,因此也叫做ToC压缩。视频从导播台制播完成之后,即采用深度压缩之后进行分发,压缩率能达到1/200甚至1/500。这样一来,不但可以最大化节省传输带宽,观众看起来也流畅。

非常感谢能看到最后。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
LM386N-1 1 National Semiconductor Corporation IC 0.325 W, 1 CHANNEL, AUDIO AMPLIFIER, PDIP8, DIP-8, Audio/Video Amplifier
$1.44 查看
PAM8904EJPR 1 Diodes Incorporated Consumer Circuit,

ECAD模型

下载ECAD模型
$7.1 查看
TPA3220DDW 1 Texas Instruments 60-W stereo, 110-W mono, 7- to 32-V, analog input Class-D audio amplifier w/ low idle, pad-down 44-HTSSOP -40 to 85

ECAD模型

下载ECAD模型
$1.94 查看

相关推荐

电子产业图谱

公众号:无线深海,移动通信交流,无线通信发展趋势,最新动态,原创科普文章发表。