数字化音视频技术:视频的数字化过程

发表时间: 2021-11-21 12:45

前面我们已经聊了音频的数字化【音视频数字化(音频数字化)】,并且介绍了音乐CD的那些事儿【音视频数字化(音乐CD)】。从原理上讲,视频的数字化与音频大致相仿,只是相对复杂。

在【音视频数字化(数字与模拟-电视)】一文中,我们了解到,模拟视频是由帧组成,帧是由场组成,场是由行(扫描线)组成,而且还得解决彩色问题、伴音问题。

模数转化

模拟视频时代,视频的来源就是电影摄像机、电视摄像机。模拟电影剪辑、存储、传播均需要使用胶片作为截止,随着时间推移自然就会老化甚至出现尘土、划痕,导致视频质量严重下降,因此现在电影院都是数字化设备了。电视摄像机也是如此,它采用的介质是磁带,除了自然老化,磁带能记录的视频清晰度也有限制。因此只有数字化才能提高画质,减少中间环境导致的画质降低。

摄像机

摄像机将视频保存在磁带上,电影也需要翻拍,将录像机与电脑采集卡相连接,使用电脑软件开始视频采集,最终保存到电脑内形成文件,就完成了视频的数字化,后期的编辑、存储、复制、传播就全部实现了数字化。

录像带

采集卡

以PAL制式信号为例,视频信号由每秒25帧组成,每帧分为奇偶两场,每场312.5行组成。采集卡接收到的视频信号,就是这个结构,但与音频不一样的地方是,音频是连续,没有帧、场、线这样的机构,只需按照采样频率采集即可,最多是多处理一下额外的声道。

电视机

视频处理除了要对伴音信号采样外,还需要对亮度信号、色度信号分开采样。因为只有这样,才能兼容以前的黑白信号(黑白信号就是亮度变化的信号),并且提高图像的清晰度。

色度信号采取色差方式,也就是R(Red红)G(Green绿)B(Blue蓝)颜色与亮度的差,表示为Y(亮度)U(红色差)V(蓝色差)颜色编码。

三原色RGB

对YUV的采样频率分别为:13.5MHz、6.75MHz、6.75MHz,这就是符合信号采样标准的4:2:2,这是CCIR601(模拟电视广播级标准)的高档标准,低档标准是2:1:1。当然还有别的标准,这个地方请大家记住,将来我们谈到别的视频编码,比如视频监控系统时还会提到。

YUV

量化位采用8bit,行有效采样点数为720(水平取样),有效采样行数为576(PAL制)和480(N制),这样组中分辨率就是720×576(PAL)、720×480(N)。

按照这个原理,我们可以计算一下传输的码率:

码率R=13.5MHz×8bit+(6.75MHz×8bit)×2=216Mbit/s

按照字节计算就是13.5MHz+6.75MHz×2=27MB/s

大家可以看到,如果用100Mbps的网络是无法传递这么大信号的,如果非要传递,得到的结果也是高延迟的卡顿;如果用CD盘(650MB)存储,只能存储24秒;用DVD最高格式D9(双层单面,容量8.4GB)才能存储5分钟。因此我们得出结论,视频数字化后必须压缩!

传输拥堵

因为视频是静态的单帧画面组成,因此谈到压缩,我们先看一下静态画面的压缩,这里必须提到的就是JPEG格式。

JPEG是国际标准化主持(ISO)在1986年提出的图片标准(Joint Photographic Experts Group)。这个标准实现了图像清晰度与存储容量的平衡,它采取的有损压缩算法,可以在视觉允许的清晰度下,大幅度降低图片容量,而且清晰度可调,非常适合存储于传输,因此目前仍旧是互联网使用的主要图片格式,文件扩展名通常为“.jpg”。

单帧的压缩可以参考JPEG,连续图像的视频怎么压缩呢?1998年,ISO成立活动图像专家组(Moving Picture Expert Group),这就是MPEG标准。1991年推出了第一视频压缩标准MPEG-1;1994年又推出了MPEG-2;目前最新的是MPEG-4(后文详述)。

MPEG组织

MPEG-1采用广播级视频质量折半的标准,将720×576(PAL)、720×480(N)减少为352×288(PAL)、352×240(N)。这样我们可以看出,这个标准低于广播级标准,图像清晰度也就家用录像机VHS水平。这样的清晰度保存在CD上,可以保存72分钟,与音乐CD相近。将视频安装MPG-1标准压缩,保存到CD上,这就是VCD,因此一部电影(90分钟左右)必须两张VCD盘片。

VCD

其实VCD在国外没有流行起来,但在国内发展得如火如荼,主要原因就是造价低廉,盘片与CD一样,不过随着大家对视频质量要求的提高,很快就没落了。

MPGE-2质量等同于广播级标准,720×576(PAL)、720×480(N),因此视频质量有了本质的提高,刻录到专用大容量光盘上,就是DVD了。

DVD机

此外,1998年国内还出现过一个SVCD(Super VCD),它实际上在CD盘片上存储MPEG-2压缩的,图像质量高于VCD,相当于DVD的2/3,优点是使用CD机架构,成本低廉。虽然支持多语言、AC-3、可变码率等先进技术,但仍旧是过渡技术,很快就被DVD淘汰。

视频的压缩除了采用分辨率调整外,还使用可变码率(静态内容低码率,动态内容高码率)、动态内容(只记录与上一帧不同内容)等算法进行了有损压缩,这样就使得数字化后的视频,可以适应当时的IT水平,可以存储、编辑、传播了。

说到MPEG的音频部分,不得不说MP3格式的音频,它是MPEG Audio Layer III的标准,这是音频压缩层次,前两层音质一般,码率较高。MP3压缩算法最复杂,音质最佳,码率较低,因此成为了目前最常用的数字音乐格式。另外MPEG-2的Dolby Digital AC-3,实现了多声道家庭影院效果,后来改名为“杜比数码环绕声”(Dolby Surround Digital)。这些我们另文再聊。

至此,我们终于完成了音视频由模拟到数字的转换,迈进了数字化的门槛,可以领略数字化音视频的无限魅力了!