“4K”时代将来临!标准/技术一网打尽

转载自:硬派网
第1页:4K 分辨率与 DCI 数字电影院

在今年的 CES(电子消费大展)上,除了让人眼花缭乱新手机等移动设备外,还有一个领域让人感到相当瞩目,这就是所谓的 4K 电视产品。

4K 电视的卖点当然是高分辨率,不过从技术上来说,“4K”这一概念涉及的不仅仅是画面空间分辨率,还有很多诸如帧率、色彩深度、色彩空间、编解码技术、电视机技术发展趋势等细节,如果你对这些细节也感兴趣的话,不妨来一起探讨一下吧。


已经有过4K体验的朋友可能都知道这是来自哪段著名4K视频的截图

DCI 数字影院的崛起

首先,4K 传统上是特指一种数字电影分辨率格式,例如 4096*2160 或者相近的画面分辨率,因为这个领域一般都是使用水平分辨率(以 1024 线的倍率)来作为格式名称,因此 K 就成了这个级别分辨率的代名词。

屏幕越大、观看距离越近,对画面的精细度要求就越高,相信已经是所有人的常识。

早期(80 年前)的电影院大都是设计成一个长方形的大厅,最近的观众座位和最远的观众作为和屏幕高度(Picture High)比例一般是 2.7H 到 8H,也就是离屏幕最远的座位距离是屏幕高度的 8 倍,采用的是礼堂式或者体育场式的座位设计,因此影院的中、后座中央位置往往成为“皇帝位”。

但是到了上世纪 80 年代后,由于要和家庭影院竞争,电影院的大厅逐渐变成小厅设计,观众和屏幕的距离越来越近。到了 21 世纪后,大量的数字式放映机得以应用,同时放映厅的屏幕和最远观众席位的距离也越来越近,例如只有 3H 了,最近的座位甚至只有 1H,到了这样的距离后,即使是水平分辨率是 2K 的画面也会被察觉出画面数字光栅化瑕疵(2K 的最佳观赏距离被认为是 3.16H)。

在 2002 年,一个名为 Digital Cinema Initiatives(数字电影倡导联盟)的组织成立了,这个组织由迪斯尼、福克斯、美高梅、派拉蒙、索尼电影、环球电影以及华纳电影等公司一起成立,目的是为数字电影开发一套系统规范。

两年(即 2004 年)后,DCI 和美国电影摄影师协会(简称 CEA,该协会目前建立了一个 4K 工作小组,专门从事 4K 相关的市场与技术结合以及增强消费者观赏体验的工作)合作建立了标准化评估素材(ASC/DCI StEM),用来测试 2K 或者 4K 播放和压缩技术,其中 4K 的分辨率格式就是定义为 4096*2160,这个分辨率模式也被称作 DCI 4K Native(画面比例 1.90:1)。

在此基础上,数字电影业界还衍生出了 DCI 4K CinemaScope cropped(4096*1714,2.39:1)、DCI 4K flat cropped(3996*2160,1.85:1),因为这些都是电影画面格式中常见的画幅比例所对应的分辨率模式。

同年,DCI 决定选择 JPEG2000 作为 DCI 数字电影系统的压缩标准,这是颇为特别的选择,要知道 JPEG2000 在互联网上到目前为止也是不怎么受欢迎,所以 DCI 采用 JPEG2000 也许是因为 motion JPEG2000 是只采用帧内压缩(这意味着比帧内+帧间参考压缩的 MPEG 系具备更高的容错能力,但是效率会低不少)、免授权金、可延伸性、低成本硬件实现。

“4K”时代将来临!标准/技术一网打尽
在推动 4K 方面特别积极的索尼在其网站上提供的 4K DCP 电影列表(2012 年)
其中 Batman: The Dark Knight 是中国大陆首部 4K 放映电影
索尼将在今年年中在美国市场开始提供 4K 电影下载服务,
第一批有 10 部电影

2009 年,全球第二大院线 AMC (在 2012 年被大连万达收购)宣布和索尼签署了到 2012 年将旗下所有放映机(超过 4500 块)更换为 4K 数字放映机的合同,到此时,4K 电影放映的基础可以说是基本上都达成了。

第2页:UHDTV 及其前身 Super Hi-Vision

4K 分辨率的电视规范当然并非 DCI 4K。

4K 电视虽然名为 4K,但是此 4K 并非完全上面所说的数字电影 4K,首先因为电视机的 4K 分辨率是指 3840×2160,采用的是 16:9 画面比例,和 DCI 4K Native 是有些微不同的。由于 3840×2160 水平、垂直分辨率都刚好相当于 1920×1080 的两倍,后者的逐行模式被人们称作 1080p,所以 3840×2160 也被称作 2160p(没有 2160i 吗?下面我们会告诉大家为何)。

在电视业务上,最初的 4K 是由 NHK(Nippon Housou Kyoukai,日本放送协会)科学技术研究所(SRTL)提议的 Super High-Vision 电视标准中的一种分辨率模式,这个标准被国际电联(ITU)所采纳并定义,在2012 年 10 月份被美国消费者电子协会(Consumer Electronics Association)正式取名为 Ultra High-Definition 或者 Ultra HD(超高清),特指本机最低分辨率为 3840×2160、画面比例 16:9、具备至少一路数字输入的显示设备。

电视机的产品标识名称要由美国消费者电子协会来制定是有原因的,例如在 1931 年的时候,就有人把扫描线为 60 或者 120 的电视机称之为“HD”了,因此统一的产品标识对消费者来说是非常重要的选购参考。

NHK 2004 年 8K 摄像机拍摄中
2004 年,NHK 采用自行研发的 R:G2:B 排列像素矩阵摄像系统进行 8K 分辨率演示片拍摄

从 NHK 的资料,该协会在 10 年前(2002 年)就完成了第一台 UHDTV 原型机系统,这台系统包含了一个摄像机、磁盘录像机、投影显示器。

2005 世博会 8K 视频演示厅
2005 年日本爱知县世博会的 450 英寸 8K 超高清视频系统展示厅现场
该厅可一次可容纳 350 人

在 2005 年的日本爱知县世博会上进行了为期半年的展示,约有 156 万人观看过并被日本九州国立博物馆收藏(不过这个版本和世博会版本略有不同,世博会版本的音频系统是 22.2 声道,而九州国立博物馆收藏的版本缩水成 5.1 声道)了。

这套系统后来在美国的 NBA 2006-2007 赛季期间以及欧洲的国际广播电视设备展(是欧洲规模最大的广电行业设备展)做过演示,在此期间,像无压缩视频光纤传输、Mpeg-2 压缩设备等相关的配套技术也被陆续开发,进行了基于 IP 协议技术的 21GHz 波段实时电视节目直播内部测试。

NHK 计划在 2014 年世界杯期间展开 4K 电视直播(有可能是基于 H.264 编码),2016 年实现 8K 电视试验性广播。

第3页:分辨率与观赏距离和屏幕尺寸的关系

和电影院逐渐变小,观众座位距离与画面高度(H)比例变小的趋势类似,电视机屏幕在技术更新的情况下不断地变大、越来越薄,买台大平板然后壁挂起来已经成为一种可能性极高的选择。

电视机屏幕尺寸调查结果中值
上图是由 Flowingdata 依据 CENT 数据而得出的 2003-2009 年电视屏幕尺寸调查结果中值
可以看到 46 英寸在三年前已经成为主流

例如,15 年前买一台 32 英寸 CRT 电视对许多平民百姓来说是挺厉害的事情,而同样的价钱现在完全可以买到 50 寸以上电视,不过一般大众的客厅即使再大也是有限的,典型的客厅沙发到电视屏幕距离一般都是 2.x 米左右(这个距离数字在黑白到彩电、标清到高清等时代都没有大的变化)。

“4K”时代将来临!标准/技术一网打尽
英国广播公司(BBC)在 2004 年进行的观看距离调查结果
可以看到大部分的调查对象的观看距离都落在了 3 米附近
英国的人均住房面积在 35.4 平方米左右 
中国城镇的数据号称是 32.7 平方米

换句话说,目前家庭影院的座位距离与画面高度比例值也在变小,即使是目前流行的全高清电视,在达到一定屏幕尺寸后,像素化痕迹也会被放大。

采用 UHDTV 技术后,画面空间分辨率比现有的 1080P 至少增加一倍或者说像素达到四倍,用户可以在更近的距离上观赏几乎无暇的画面,视场(FOV,field of view)角度可以更广(见下表)。

画面分辨率 参考标准 画面比例 像素幅形 最佳水平视场角度 最佳观赏距离
720*483 Rec.ITU-R BT.601 4:3 0.88 11° 7H
640*480 VGA 4:3 1 11° 7H
720*576 Rec.ITU-R BT.601 4:3 1.07 13° 6H
1024*768 XGA 4:3 1 17° 4.4H
1280*720 Rec.ITU-R BT.1543 16:9 1 21° 4.8H
1400*1050 SXGA+ 4:3 1 23° 3.1H
1920*1080 Rec.ITU-R BT.709 16:9 1 32° 3.1H
3840*2160 Rec.ITU-R BT.1769 16:9 1 58° 1.5H
7680*4320 Rec.ITU-R BT.1769 16:9 1 96° 0.75H

“4K”时代将来临!标准/技术一网打尽
依据 NHK 人类视觉系统测试结果制作的最佳观看距离与屏幕尺寸及分辨率关系图
竖坐标为观看距离(英尺,一英尺约等于 0.3 米。家庭用户观看距离基本在 10 英尺内)
横坐标为屏幕对角线尺寸(英寸)

例如,按照 ITU-R BT.2246-1 文档,如果采用 7680*4320(UHDTV 8K)分辨率的话,欣赏距离的公制单位将和画面对角线的英制单位呈正比关系,例如 1 米距离的极限最佳观赏画面对角线可以达到 100 寸(2./54 米),这对目前的 1080p 电视来说是不可企及的事情。

加上 UHDTV 的其他特性(色深、帧率等),人们的电视体验将会有全面的飞跃。

更重要的是,电视机产业也需要一个更新换代的由头才能维持自身的生存,从前些年的 1080p、加密模块卡一体化、LED 背光到现在的智能电视、立体呈像,电视机行业每年都必须拿出点新东西来作为卖点推销给消费者,而超高清电视带来的产业链变革可以让几乎整个电视(电视机、机顶盒、编解码芯片等)、IT 产业(例如 4K 相关的软件、存储产品、互联网商等)都能获益。

第4页:UHDTV 的帧频(时间取样)规格

但是需要注意的是,在厂商狂轰滥炸 4K 概念的时候,要注意他们是否做到足本。

这是什么意思呢?例如,有一些厂商可能会在 1080p 电视上的信号输入端弄一个画面缩放器,把输入的 4K 降格为 1080p 显示,就好象四五年前一大票 CRT 电视机都吹嘘“支持” 1080p 一样,实质上只是标清电视配上能吃 1080p 信号的芯片罢了,像这样配个缩放器的鬼把戏电视按照 CEA 的 UHDTV 标准是根本不能被称冠以 UHDTV 的,大家务必小心,因为有前车之鉴。

此外,正如我们前面说过,4K 或者说 UHDTV 和目前的 HDTV(2K、1080p)相比并不仅仅是分辨率上达到两倍(或者说像素达到四倍),在帧频(或者说时间取样)、每像素色深、色域等方面都有极大的不同,如果不能只是炒作 4K 而没有在这三方面做好的话,那也只是缩水版的 4K。


欣赏制作精良的4K视频实在是一种视觉上的享受

首先,不管是针对数字电影的 DCI 1.2 还是针对电视广播的 UHDTV,都是没有隔行视频格式。

隔行模式当年提出主要是因为电影出来后,人们发现在光线昏暗的房间里需要每秒显示 40 张画面才能消除闪烁问题,如果是明亮的显示设备上则需要每秒 80 张画面,因此早期的电影是用每秒 16 帧(16P)格式拍摄,然后以每张画面照射三次就能达到接近每秒 48 帧画面,到了有声电影的时候,为了实现音画同步(16p 的时间取样没法对上嘴形),拍摄的帧率提升到每秒 24 帧或者说 24P,放映的时候放映机的快门以两倍速度开关,就能做到接近每秒 48 帧的效果。

对电视机来说这样的方案并不可行,因为存储一张完整的视频帧和扫描两次是需要帧缓存的,这样的方案在上世纪 80 年代之前都是不存在的。除此以外,还得避免由于摄影棚光照与 CRT 电视采用的真空管必须以交流电频率扫描这个限制而产生的画面干涉现象。

在 1936 年英国设定模拟电视标准的时候 CRT 电视是电子机械式扫描的,只能做到在 1/50 秒里刷 200 行扫描线,而采用隔行模式后,由于视觉残留现象,每秒扫两个 202.5 线的扫描场就能做到每帧 405 线分辨率,垂直扫描频率依然是 50Hz(欧洲交流电工频标准),闪烁问题并不是算严重,但是可视细节能显著增加,这在当时是一个非常了不起的主意。

从 40 年代到现在,虽然技术已经有巨大的进步,电视系统具备更高的带宽,但是隔行扫描技术依然是这些电视系统的核心。主要的变化是让扫描线数有所增加,让每帧画面具备更高的分辨率。像目前中国采用的 HDTV 1080i50 广播就是将两个 540 线的奇偶场画面经过平板电视的反交错电路处理为两个(也可以是一个)1080 线画面,当然,实际参与反交错处理的视频场可能要多于两个。

不过 1080i 将成为最后一个隔行视频格式,在 EBU(欧洲广播联盟)新近的电视广播制式研究中,已经开始倡导像 1080p50(每秒 50 帧完整画面,可用 H.264 13.xMbit/s 的码率实现传播)这样的逐行显示格式。

在 UHDTV 中,由于现有技术(编解码、显示设备等)已经可以满足足本分辨率的情况下实现较高的帧频,加上隔行视频在业务应用中的缺点也比较突出(例如再先进的反交错技术也无法实现真正的完整画面,运动画面会偏模糊),因此要求全部采用逐行帧频格式。

在帧频(或者说时间取样)格式上,主要针对数字电影放映系统的 DCI 2K 格式允许 24 fps、48 fps,4K 允许 24 fps;而 UHDTV 则不限分辨率允许 23.976 fps、24 fps、25 fps、29.97 fps、30 fps、50 fps、59.94 fps(关于非整数帧率的缘由大家可以到这个网址了解)、60 fps 以及 2012 年新加入的 120 fps。

120p 就是每秒一百二十帧画面,在这个时间取样速度下,是可以很大程度上改善低帧频模式时候常出现的运动镜头画面跳停(英文称之为 jerkiness)现象以及运动镜头时候的模糊现象,完全消除高亮度+宽视角情况下的临界闪烁率象,其中运动镜头的画面抽搐现象和模糊现象主要取决于摄影机这一端。

高帧率的意义不仅在此,例如这两年非常流行的立体呈像电视,其中的主动式快门立体呈像技术是牺牲 1/2 帧频达成的,因此电视此时的有效刷新率其实只是相当于每秒 25 帧或者每秒 30 帧。在采用完全的 120Hz(节目源和电视机均为 120 fps)后,立体呈像的刷新率就能达到等效 60Hz 的水平,画面闪烁感会显著降低,画面流畅度也会大为改善。

部分 UHDTV 应用可能会要求和 HDTV 一样的最高 60Hz 帧频,从纯技术角度来看,最好是使用现有电视机帧频的最小公倍数来进行帧率转换,但是 300Hz 或者 600Hz 从技术实现难度和带宽需求在可见的将来都是难以取得实现的,如果采用 120Hz 来和与 50/59.94Hz 的转换则已经有颇为成熟的数字技术来实现。

ITU 在设定 120Hz 这个帧频的时候,已经考虑了摄影机、显示装置、传输技术的可行性,按照目前的进展,120Hz 将会在不久的将来成为现实。

运动画面顿挫测试场景
镜头平移画面顿挫感测试的四个场景

“4K”时代将来临!标准/技术一网打尽
ITU 使用上面四个场景进行镜头平移画面顿挫感与帧率关系性测试的主观评价得分
Y 坐标是主观评价得分,X 坐标是帧率(测试选择了 60、80、100、120 fps)

按照 ITU 在 HDTV(100 英寸,距离 3.7 米)上进行的 69 人 + 12 片段主观测试结果,60Hz 到 120 Hz 的平均得分改进是 0.46 分(60Hz 的得分是 3.x 分),而 120Hz 到 240Hz 的平均改进是 0.23 分,从统计学来说这样的改进是相当显著的,因此可以预期在 UHDTV 上采用 120Hz 帧频将会有非常显著的改善,这也是 UHDTV 在 2012 年追加 120Hz 的重要原因。

第5页:UHDTV 的色域与取样精度及格式

除了空间分辨率、时间分辨率外,UHDTV 作为可能是人类最后一个电视标准,对色彩能否正确呈现也受到了前所未有的关注,同时我们之所以这么说就是因为之前的彩电标准在色彩学上都不够完美。

传统而言,色彩的可视范围取决于系统本身的基色(primaries,或者说原色)特性,但是色彩的准确度(accuracy)却取决于编码系统。到目前为止,人们都是把某一型号或者某种类型的显示设备基色定义为系统基色。

NTSC 1953 色彩空间的参考机 RCA-100
RCA-100

例如当年的 NTSC 1953 色彩空间就是依据 RCA 公司一台名为 CT-100 的全电子式真空管(显像管型号为 15GP22,三枪式)电视机来制定的。这台电视由 CBS 提供给 FCC,FCC 被 CBS 成功说服采用这台实验性质的奇芭级电视的规格作为 NTSC 1953 标准,要知道 RCA CT-100 的色域范围要比目前绝大多数的电视机更广(但是它匹配的荧光粉发光效率很低)白场更是采用 C 系标准光,以至于到现在都没有多少台电视能完全遵循 NTSC 1953。

到了 70 年代(1970 年开始彩电销售数量超过了黑白电视)由于视频磁带录像机的出现,美国不得不制定了一个小很多但是更现实(适合当时技术限制,例如绿色荧光粉)的色彩空间作为彩电标准,这就是 SMPTE-C(也被称作 P-22,后来成为 ITU Rec.601),采用 D65 白作为基准白,采用的荧光粉发光效率要高两倍,原来的 NTSC 1953 从此被废除掉,不过当年的亮度方程就依然被 Rec.601 沿用下来,直到 Rec.709(HDTV)才被修正过来。

虽然 RCA CT-100 的销量很低,但是这不妨碍它击败了 AK-47、苹果电脑、任天堂 NES 等东西成为 Wire 杂志举办的最伟大 Gadget 发明胜出者。

对于 UHDTV 来说并不需要这样做,因为 40 年前完全不可能做到的复杂信号处理对现在的技术水平来说就是小菜一碟。

想象一下,如果 UHDTV 的系统级基色不是由显示设备基色定义的话,那么系统级基色就能被设计成足够宽大乃至可以包含所有可见色彩,而显示设备基色则可以随时依据不同的情况和设备类型定义出达到的范围,这些处理都可以在显示设备内透过一个 LUT(look-up table,查询表)对传递过来的信号进行转换而达成。

如此一来,所有的显示设备都能在本机色域里实现精确的色彩匹配,让我们看到一致的色彩,彻底抛弃受制于上世纪 70 年代制造技术的色彩标准。

那就上浮点式、含负值的 ACES(学院色彩编码系统,是由超过 50 家电影行业前沿技术专家和实际从业者在 2004 年订立的,即 SMPTE ST 2065-2:2012,这里的“学院”就是指发奥斯卡奖的那个学院)或者 scRGB 色彩空间吧?

很遗憾的是,这两种色彩空间的实现成本还是太高了,而且并非是为人类视觉系统设计的,专注于电影工业制作端的 ACES 不太适合于 UHDTV 这类显示终端上应用。

在 ITU-R 的 UHDTV 规范 Rec.2020 中,UHDTV 系统级色域采用了基于 CIE 1931 XYZ 的 RGB 色彩空间,红基色波长为 630 纳米(x = 0.708, y = 0.292),绿基色波长为 532nm(x = 0.170, y = 0.797),蓝基色波长为 467nm(x = 0.131, y = 0.046),参考白场和 HDTV 的 Rec.709(CIE D65)一样(都是 x = 0.3127, y = 0.3290)。

这里的一些数字和当初 UHDTV 最初的提案是有些出入的,目前这个数字是一个折中的方案,因为最初 UHDTV 的提案在这方面有两个方案,分别由日本和韩国提出,总之现在算是某种程度上兼顾了 LCD/AMOLED 和激光电视的色域。

CIE 1931 色彩空间中的 UHDTV/HDTV 色彩空间包络线
这是 CIE 1931 色彩空间 xy 示意图
马蹄形的包络线里包含了自然界所有的真实色彩
最里面的黄色三角形包含了 HDTV 的色域,黑色三角形则是 UHDTV 的色域
HDTV 和 UHDTV 的参考白点都是“D65”

从上图大家可以看到,UHDTV 的色彩空间要比 HDTV 大不少,许多 HDTV 无法呈现的色彩都能在 UHDTV 上呈现。以覆盖范围来看,UHDTV 是 CIE 1931 的 75.8%,相比之下,而 Adobe RGB 是 52.1%,数码相机是 53.6%,HDTV 是 35.9%。

HDTV UHDTV 色域覆盖对比

上图是国际电联提供的 UHDTV 和 HDTV 在不同真实表面色彩上的(xy 色度坐标)涵盖表现对比测试结果,大家可以更加直观地体会 UHDTV 广色域系统的优势和 HDTV 的限制。

在信号取样格式方面,UHDTV 可以是非线性的 Y’C’BC’R(目的是兼容现有的 HDTV 广播系统),线性的 Y’CC’BCC’RC(用于精确保留亮度信息),或者是非线性的 R’G’B’(用于呈现最佳画面品质),其中 Y’C’BC’R 和 Y’C’BC’R 的色度取样模板可以是 4:2:0(第一个数字是 Luma 亮度取样数;第二个数字是水平色度取样数;第三个数字是垂直色度取样色)、4:2:2 或者 4:4:4(至于 R’G’B’ 当然只有 4:4:4 了),取决于实际的应用(例如是素材拍摄、后期制作、最终信号的传送或存储等)由“用家”选择。

关于不同色度子取样模版的差别大家可以看看这个链接,简单来说,4:2:2 表示亮度取指样本数为 1 个,Cb 色度分量取样样本为 0.5 个,Cr 色度取样样本数为 0.5 个,或者说亮度是全分辨率,两个色度分量均为半分辨率):http://en.wikipedia.org/wiki/Chroma_subsampling#4:2:0

UHDTV 的每个色彩分量的编码格式是 10-bit 或者 12-bit,根据色深的不同,非线性传递函数的 α 和 β 值会略有不同,不过差别非常小,就是小数点后第四位的区别。

根据 ITU 的 UHDTV 参数推荐测试文件,如果 UHDTV 采用 8-bit 色深的话,平均色彩错误数是 0.78 个,最大色彩错误数是 2.05 个,远高于 HDTV 采用 8-bit 色深时候的 0.58 和 1.45。

因此 UHDTV 的色彩编码必须是 10-bit,如果想更好的话那就要选择 12-bit,不过即使是 12-bit 在个别情况下还是不够用的,例如在人类视觉系统最低可察觉对比度特征测试的 Barten 模型中就会出现 12-bit 也都不够用的情况。

第6页:NHK SHV 的 22.2 声道音频系统

UHDTV 规范 ITU-R Rec.2020 是视频方面的规格,并没有涉及音频系统的规格定义,所以目前并不存在一个所谓的 UHDTV 音频系统标准(但是毫无疑问都会是数字格式),不过在 NHK 的 Super High Vision 原型系统中,的确有一个多达 22.2 声道 48KHz 24-bit 的音频系统,这里我们也不妨介绍一下。

UHDTV 22.2 声道空间层分布

NHK 的这个 22.2 声道音频系统分为三个空间层(见上图),分别是有 9 个声道的上层、有 10 个声道的中层、有三个声道的下层,此外还有两个位于屏幕下方与下层声道放在一起的低音声道,主要用于较大的室内空间,像爱知县世博会的 450 英寸 8K 巨幕放映厅就是这个音频系统的首次公开亮相。

“4K”时代将来临!标准/技术一网打尽

上图是 NHK 22.2 声道的各层水平布局以及角度定位。

22.2 音频系统个声道混音参数
NHK 22.2 音频系统个声道混音参数

在这个 22.2 多声道音频系统中,NHK 以中层前置中央声道(M-F-C)定义为参考点(100 点),其余声道则是由六位音频工程师和声音设计师依据各声道的重要性进行设置,如果某个声道被认为重要性是 M-F-C 的两倍,则该声道会被设置成 200 点,上图中个声道的数值就是由这几位专家最终设定的混音参数。

按照 NHK 在世博会期间进行的主观评价测试,22.2 声道系统在 450 英寸屏幕反映厅中的听感测试中要比 2.1、5.1 系统的评分(采用 7 分制,一分为效果最佳)高 5%,不过在听感中的真实感、透明度、华丽度方面并没有明显的优势,NHK 认为这可能是因为大礼堂式的放映厅影响了音频系统的主观感受。

可以说 22.2 声道系统虽然会有不错的音效体验,但是它的实现复杂性可能不是一般家庭能承受的,定位应该是放在未来替代现行数字影院音频系统或者是超级多声道耳机上比较有可操作性。

第7页:UHDTV 带来的技术挑战

相对于 10 年前 HDTV 概念出来的时候,现在的平板技术和驱动电路已经有了不少的改进,在显示面板这一端的障碍更多的在于能不能提供实现 3840×2160 10bit 120Hz 这样基本满规的驱动技术。

目前的液晶电视或者说 LCD 除了 TN 面板外,鲜有能实现 100Hz 的产品出现,在 120Hz.net 上曾经出现过一波著名的 Yamakasi Catleap Extreme 2B 120Hz 特制超频版订货,引起了全球玩家关注。

请注意,我们这里说的不是电视机厂商动不动就推销电视机视频插帧时候动不动就数百 Hz,而是屏幕真正的画面更新率和输入信号帧率。

Yamakasi 对许多人来说都是一个名不见经传的日本显示器品牌,在去年年中的时候,有人发现这个品牌下一款名为 Catleap Q270 的 27 英寸 LED IPS 显示器采用修改过的驱动有机会实现 120Hz 刷新率显示。

这下可不得了了,这款显示器的价格马上被炒高了。而 120Hz.net 的站长更是立马联系厂商,要求提供确保可以上 120Hz 的特别版,取名为“2B Extreme OC”,价格从市售版的 300 美元直接拉到 720 美元并且很快就被买光了,这说明僧多粥少的同时也说明高刷新驱动显示器的稀缺。


4K视频的超高分辨率可以带来更为精细的画面细节

让我们再来看看电视机的情况,众所周知,现在市面上已经有了 4K 电视机售卖,例如创维的 E780U-50E780U 是一款 50 英寸 4K 电视,就面板来说的确是 3840×2160,但是由于配备的是 HDMI 1.4,结果发生了什么呢?答案就是在 3840×2160 模式下,刷新率只有 30Hz,是现有 HDTV 的一半刷新率。除此以外,这台显示器的色域基本上就是遵循 Rec.701。

可以看出,对于家电行业来说,要实现 ITU-R Rec.2020,必须引入相匹配的色彩转换电路和软件,从人机工程学角度,应该采用可以达成 3840×2160 下提供至少 60Hz 时间采样的信号界面和面板驱动技术,原因我们在介绍 UHDTV 帧频部分已经作过介绍,而在现实中卡梅隆已经表示过如果可能的话,将会选择 60 fps 拍摄阿凡达第二、三集。

换句话说,一台成熟的 UHDTV,应该具备 3840×2160 10-bit 60Hz(非插帧)、遵循 Rec.2020 色域、能支持至少 Displayport 1.2 或者其他同级以及以上(例如 HDMI 2.0)的信号传输界面、提供三原色独立调控的白场/黑场设定以及下一代视频编码技术的硬件解码支持等。

根据 EETimes 2013 年 1 月 10 日的 Broadcom 首席技术官采访,HDMI 2.0 芯片将会在一年内问世,不过要知道 HDMI 2.0 的规格目前还没出来…..

对游戏玩家来说,不仅仅有 UHDTV 能提供 4K 级别分辨率,而且已经有了一些 4K 级分辨率的显示器可供选择,问题在于显卡这端能否满足 4K 渲染性能,当然有一些游戏对渲染的性能要求并不会很高,例如模拟城市、三国志之类的策略类游戏。总之,如果你是游戏发烧友的话,在你选择 4K 显示器之前,最好留有对等价格预算来购买高端显卡。

对于一些目前正在使用 1920×1080 显示器的玩家来说,其实有一个办法浅尝 4K 的滋味,不过我说的滋味是带双引号的,意思是你可以像这篇帖子那样,感受一下 4K 带来的性能衰减幅度。

UHDTV 不可能只能用于看电脑、播放器上的节目,它终归要能收看 4K 电视节目才能算是完整的电视。要收看 4K 电视节目当然需要电视台一端提供 4K 节目并透过地面无线信号或者有线网络传递到电视机。

这里就带来了一个问题,4K 级信号的带宽需求极高,像中国大陆现在采用的 HDTV 广播是基于 MPEG-2 压缩标准,根据 NHK 2006 年的测试,MPEG-2 虽然可以将 8K UHDTV 从 24Gbit/s 压缩到 600Mbit/s,但是很显然除了光纤外,现行的大部分传播手段在 4K 传输的时候都会捉襟见肘,像移动网络方面 IMT-Advanced 顶多也就是 1Gbps 下载速率。

第8页:H.265 视频编码技术的由来

从 2003 年第一版规格获得批准到现在,H.264(MPEG4 AVC)已经有 16 个版本,其中比较重要的版本分别是版本 1、3、8、11。和 MPEG-2 相比,H.264 的压缩效率提高了 50%,但是这样的效率在 UHDTV 时代还不是很够用。

要知道 UHDTV 是没有隔行模式的,H.264 中的 MBAFF、PAFF 隔行或者说视频场压缩能力无从发挥,官方规格里目前还不能提供在 3840×2160 和 7680×4320 支持 120 fps 这样的帧率,当然 H.264 在分辨率和帧率上都可以透过版本更新来实现。此外,H.264 的 CABAC 熵编码是串列执行的,如果要实现 CABAC 编码动作并行化的话,编写编码器的程序员就得自己另想办法。

其实在 H.264 第一版完成后的第三年(2005 年)一月份,VCEG(视频编码专家小组,属于 ITU 旗下的技术标准组织,前身是 CCITT)就已经展开了一个名为 Key Technical Areas(KTA)的专题讨论,在这次讨论后一个名为 KTA 的代码库开始被建立起来用于评估各种可以用于增强编码效率的技术。

KTA 代码库是基于 Join Model(简称 JM,是 H.264 编码标准组织即 MPEG 和 VCEG 合组而成的 JVT 提供的参考软件)提供的,在接下来的四年里,更多被提议的技术整合到 KTA 中并被业界测试。

对于 KTA 中包含的增强式压缩技术有两个标准化形式的提议,一个建议是创订新的标准,而另一个则是作为 H.264/MPEG-4 AVC 的扩展提供。后来,这个项目被暂定为 H.265(NGVC),并在 2010 年的时候成为 VCEG 与 MPEG 的合作项目:HEVC。

VCEG 的 NGVC 目标是在 H.264/MPEG-4 AVC High Profile 的二分之一到三倍计算复杂性下以 50% 码率提供相当的“主观”画面品质

而 ISO/IEC MPEG 这边在 2007 年展开的 HPVC(高性能视频编码)被设定为 50% 码率实现 MPEG-4 AVC 相当的画面品质,早期的执行和修订都是在 VCEG 的 KTA 参考软件编码器上实行。到了 2009 年七月,体验性的测试结果表明可以比 AVC High Profile 节省 20% 码率,这样的成果促成 MPEG 决定与 VCEG 共同制定新的视频编码标准。

在 2010 年双方决定展开新编码标准合作后,四月份的会议上共有 27 项完整的提议被提交,其中的一些提议是在 2~10 倍 AVC 计算复杂度下实现许多情况下的 50% 码率缩减,而某些提议则是在比 AVC HP 更低的计算复杂度下达成良好的“主观”画面品质和码率,同时也是在这次会议上这个联合项目被定名为 HEVC。

上述部分最佳的提议被整合到名为 Test Model under Consideration(考虑中的测试模型,TMuC)代码库中,到了 2010 年 10 月在广州召开的会议上,建立了 HEVC Test Model(TM)(HM 1.0)、Core Experiments(CE),实现了比 H.264 高 30% 的压缩效率。

到了今年一月,HEVC 的第一版最终草案(Main Profile、Main 10 Profile、Main 静止图像 profile)终于获得 ITU-T 批准,并被命名为 H.265。同日 MPEG 方面也宣布 HEVC 进入最终草案国际标准状态,距离称为正式的国际标准 MPEG-H 就差两步,这两步就是“提议成为新国际标准”、“成为国际标准”,当然,说是两步,其实也就是一步。

“4K”时代将来临!标准/技术一网打尽

上面的表格是 H.264 High Profile 和 H.265 Main 10 Profile、H.265 Main Profile 在特性功能和个别参数上的对比,下面让我们进行简单的介绍。

第9页:H.265 的技术关键点——四叉树编码单元

H.265 CTU

首先是 H.265 采用名为 CTU(编码树单元)的分块形式进行编码,输入的画面按照光栅扫描(从画面左上角开始,从左到右)顺序切成大小最大为 64 像素 * 64 像素的 CTU,当然你也可以将它设置小一些,例如 32*32、16*16,其中 16*16 是最小的 CTU 大小。

H.265 CTU CTB

视频是以 YUV 分量保存,对应到各个分量上的 CTU 被称作 CTB(编码树块),对于 4:2:2 格式视频来说,其中 Y 分量(亮度,Luma)的 CTB 和 CTU 是一样的大小,例如 CTU 设定为 64*64 则亮度分量 CTB 同样是 64*64,而 Cr、Cb 的 CTB 则可能是一半(取决于 YUV 格式)即 32*32。

H.265 CTB CB

H.265 CB

H.265 编码器依据流参数对这些 CTB 采用四叉树分割,分割(也可能不再分割)出来的块被称作 CB(编码块)块,最大的 CB 是 64*64,最小可以拆到 8*8,这些 CB 是 HEVC 中用于帧间预测和帧内预测的判决点。更准确来说的话,就是预测类型是在 CU 内编码的,而 CU中包含了三种 CB(Y、Cb、Cr)以及相配的 Syntax Element(语法元素)。

CTB 按照连续顺序组成被称作 slice(切片)的单元,一张画面可以分为任意数量的 slices,也可以整个画面只算作一个 slice。每个 slice 可以分割为一个或者多个 slice segment(切片段),每个 slice segments 都在自己的 NAL 单元里,每个 slice 只有第一个 slice sgements 包含该 slice 的完整 slice header,其余的 slice segments 都属于依附于其上的 slice segment。

在解码的时候必须访问 slice 的第一个 slice segment,而“依附”的 slice segment 无法独立地用于解码。

在采用大量完整 slice 的情况下将其划分成多个 slice segment,可以实现不损失编码效率的同时提供画面的低时延传送。例如,当摄像机传输出第一行 CTB 的一个 slice segment 后,位于传送网络另一端的播放设备就能在摄像机还在对第二行 CTB 编码的时候执行绘制动作,像视讯会议之类的应用都可以从中受益。

CB 适合于判断采用何种预测模式,但是如果用来存放运动向量(帧间预测)和帧内预测模式的话就会显得太大,例如鹅毛大雪中的细小对象可能会跑到 8*8 大小的 CB 中央,而这时候我们是需要对中央部分采用不一样的运动向量。

H.265 PB

为此,H.265 引入了名为 PB(Prediction Block,预测块)的单元块,根据时间以及空间的可预测性把各个 CB 劈开成若干个 PB,这些 PB 的大小可以从 64*64 到 4*4,并且根据预测的类型提供了类似 H.264 的对称分割(2N*2N、N*N 等)和新的非对称分割(2N*nU、2N*nD 等)两种分割方法。

其中 2N*2N 用于 Skip 类型,帧内预测类型采用 2N*2N、N*N,帧间预测类型的 PB 在帧内预测的分割方法上基础上增加了 2N*N、2N*NU 等非对称分割方式。

为了有效降低码率,H.265 的帧内预测提供了 35 种预测模式(33 个方向),相比较之下上一代的 H.264 只是提供了三种预测分块(即针对亮度分量的高细节度 Intra 4*4、低细节都 Intra 16*16 以及针对色度的 Chroma 8*8)和 9 种预测方向。

不过为了降低复杂度,H.265 对 64*64 和 4*4 大小的 PB(或者说 PU)预测模式作了精简,分别只有 5 种和 17 种。

对于视频画面来说,同一场景中的画面往往是连续的,画面之间有很高的相关性,这样我们就可以透过单凭保存的参考帧画面来预测当前画面,从而达到提高压缩率,实现节省大量的空间和传输时间,像 H.265 或者 H.264 这样的编码器都可以只保存或者传输参考帧以及移动评估的数据就能实现重建所有的画面,这一切离不开帧间预测。

H.265 在帧间预测方面引入了 AMVP(先进运动向量预测)预测技术,除了和 H.264 一样在空间域里找周围相关性高且已经编码的区域外,它还会利用前后画面的相关性在时间域里找参考帧中可利用的移动向量,籍此可以减少码率。

不过 AMVP 还是需要传输运动向量与运动向量预测的差值,而且每个 PU 都需要进行运动评估找出最好的运动向量,这会增加码率并且导致复杂度显著提高。为此 H.265 又引入了名为合并模式的帧间预测方法,原理就是 PU 之间的移动信息非常相似,因此可以就近采用附近 PU 的形式而不做运动评估等计算。

在传输编码信息给解码器的时候,只传少量的位元,无需传输运动向量与运动预测的差值,让解码器从附近某块已编码的 PU 上获得运动信息,就可以在保持一定画面品质的情况下实现解码输出。

由于物体可能刚好落在参考帧非整数点的像素上,此时会导致较大的误差,使得编码的效果下降,因此从 H.264 开始提供了非整数点精确度,将原本 1:1 的像素形幅进行插值补点,相当于将画面的分辨率提高,实现对这种情况的更准确运动评估。H.265 和 H.264 都提供了 1/2、2/4、3/4 的像素非整数点位置运动评估,但是 H.265 提供了 8 点插值滤波,而 H.264 只有 6 点插值非整数移动评估。

H.265 TB

一旦预测动作完成后,就需要采用类似 DCT 的整数变换算法对残差(预测出来的画面和实际画面的差值)进行编码籍此进一步降低码率(当然,你也可以选择跳过量化、变换和下面的环路去块,这样就成了 H.265 的无损编码模式了,此时压缩率会下降很多倍,不过依然比 JPEG2000、7-zip 等现存的所有无损压缩法具备更高的压缩率)。由于一个 CB 中可能同时包含有高细节(高频)部分和低细节(低频)部分,因此 CB 直接用于变换处理的话还是太大了。

H.265 在进行变换操作的时候会先把 CB 拆开成若干个 TB(变换块),这些 TB 并不需要和 PB 对齐,所以对来自多个 PB 的残差只需要执行单次变换处理即可。

在执行变换处理的时候 H.265 采用了 7 个位元来存放基本矩阵系数,加上更大的变换块(TU),是 H.265 完胜 H.264 的其中一个主要原因。

完成了量化和变化后,TB 还需要进行熵编码处理,熵编码的目的是进一步压缩码率,但是这个操作不会对之前步骤处理出来的数据产生损失,办法就是对出现概率高的符号采用短码字表示,对出现较少的符号采用较长的码字表示,其实就是 big.Little 的概念。在 HEVC 中,只提供效率较高的 CABAC 熵编码方式。

第10页:H.265 的去块滤波及其他技术特点

此外,H.265 和 H.264 一样都有被称作去块滤波的处理,作用是对信号进行重构,减少视频编码压缩时经常出现的斑块现象。

在 H.265 中这个处理过程分为三步,即 in-loop deblocking filter(环路去斑块滤波,简称DBF,以 8*8 区块大小进行处理)和新增的 Sample Adaptive Offset(自适应样本补偿,简称 SAO,以 CTB 区块大小进行处理)。SAO 的作用主要是恢复环路去块造成的锐利边缘偏模糊现象,恢复其对比度,提升主观画面品质。和 H.264 相比,H.265 的去块处理复杂度有所降低并且更便于并行化处理。

在 H.265 中期开发阶段之前曾经还引入了第三个去块模块:Adaptive Loop Filter(自适应环路滤波,简称 ALF。它的作用是当信号经过前面两步的去块处理器后,会依据编码过程中提供的自适应参数决定是否执行 ALF 以及对色度信号决定在图片级还是 CU 级进行雪花状或者是十字状滤波),但是这个模块在最终草案中被拿掉了。

“4K”时代将来临!标准/技术一网打尽
H.265 编码器运作流程图

“4K”时代将来临!标准/技术一网打尽
H.265 解码器运作流程

结合四分树的超大区块编码方式和新增的 SAO 去块滤镜被认为是 H.265 和 H.264 之间的两个最重大区别。

除此以外,H.265 虽然支持对序列隔行视频场编码,但是不再提供像 MBAFF 这样的隔行专用编码模式,不再支持视频场+完整帧的混合编码方式。

H.265 Main 10 Profile 提供了 10-bit 存储/输出模式,是为 UHDTV 而在 2012 年的草案(本来叫 HE10)中开始新增的,同时这也是首次有视频编码器将 10-bit 作为消费级应用,不过第一波的 H.265 解码器大部分不会支持 Main 10 Profile 而只提供 Main Profile 支持等等。

“4K”时代将来临!标准/技术一网打尽
H.265 MP/M10P 在不同分辨率(亮度样本规模)和级别下的最高帧率

如上图所示,H.265 在超高分辨率下的官方帧率上限设定比 H.264 高很多,H.265 Main/Main 10 Level 5.2 下可以做到 4096×2160 120fps。

第11页:H.265 路线图及官方参考软件编码效果

“4K”时代将来临!标准/技术一网打尽

上图是业界对 H.265 编解码技术部署的路线图,可以看到,在 2013 年上半年应该能看到支持 H.265 的软件播放器,到 2014 年会有 H.265 硬件解码芯片,依据目前的新闻,包括高通、Boardcom 等厂商都已经宣布会在明年(2014 年)提供集成 HEVC 硬件解码器的应用处理器。

在解码器实现难度上,官方的说法是 H.265 的解码复杂度大约是 H.264 的三倍,根据档案号 JCTVC-K0327 的上海会议记录,HM8 版参考软件解码器已经可以在单核 1.3GHz ARMv7 处理器上实现多个不同的 1080p30 片段播放(此外还得算上他们这里是用了 GPU 来做 YUV to RGB 转换)。

需要注意的是,前面所说的 H.265 获得批准是指草案而非真正成为国际标准,因此虽然已经有不少开发人员在埋头编写代码,但是真正的成品级编解码器目前(2013 年 2 月)并不存在,甚至连 JVT-CT 的新版 HM 参考编解码器目前都并未完全遵循当前草案的最新规格,而这个草案目前还在频密的更新中,当然随着时间的推移,各项进度按部就班执行,上面的路线图一定会如期完成。

“4K”时代将来临!标准/技术一网打尽

上图是爱立信 2012 年采用 HEVC 和 AVC 编码器对 3840*2160 分辨率的鸭子视频片段进行的压缩效率对比,这样的图通常被称作 RD 图,Y 轴的 PSNR 值是客观画面评价指标,X 轴是码率,曲线反映了要达成某级别的压缩后画面品质所需要的码率。

从测试结果来看,HEVC 可以做到比 AVC(是 H.264 官方参考编码器“JM”压出来的 AVC)低 53% 的码率就能得到水平相当的客观画面品质。

HM 只是参考之用,用来验证编解码器的功能是否可行,同时也要求第三方编解码器能兼容按照正式版标准编写的 HM,这就好象 H.264 的 JM 一样由于性能效率等原因是不太可能用于商业用途,因此真正的 H.265 编解码器还是需要商业公司或者是软件社区来提供。

就目前而言,已知的开源 H.265 编码器有 x265、OpenHEVC,其中 x265 目前还是一个个人项目,由国人 chenm003 在开发,不过因为精力有限的缘故,似乎进展相对迟滞,而且项目里只有编码器没有解码器。OpenHEVC 是由“Smarter”牵头做的项目,基本上是 HM 实现而已。

x264 的开发团队虽然正积极观望 H.265 标准的最终敲定(成为正式标准可能要到今年夏季),但是尚未展开相关的工作。

“4K”时代将来临!标准/技术一网打尽
在同样采用 10-bit 时 x264 2 pass vs HM 9.0(H.265 参考编码器)的码率/品质对比
这里的 BD-Rate 代表了同样品质下所需的码率差别(和 x264 相比)

近日在 Doom9 就出现了网友基于 HM 9.2 Main vs x264 的压缩效率比较图表(见上图),测试结果表明 HM 9.0 版 参考编码器在同样画面品质下能够平均比 x264 减少大约 28% 以上的码率(都是 10-bit 精度),要知道 x264 是目前最佳的 H.264 实现,而历史上新编码器的官方参考版未必都能击败业界最佳的上一代编码器。

关于 H.265 相关资料:

1、H.265 官方常用的测试片段下载:ftp://hvc:US88Hula@ftp.tnt.uni-hannover.de/testsequences

2、H.265 目前的草案文件(也被称作 L1003):http://phenix.it-sudparis.eu/jct/doc_end_user/current_document.php?id=7243

3、H.265 官方参考软件以及其他相关的官方文档:http://hevc.hhi.fraunhofer.de/

第12页:4K 技术发展总结以及展望

在本文中,我们介绍了各种 4K 标准,例如 DCI 4K、UHDTV,对为何需要 4K 分辨率以及 UHDTV 正式标准中除了比 HDTV 高一倍的分辨率外还有帧频、色域、色深等重要的变化,顺带说了 NHK SHV 中的变态音频系统,对现在的第一波 UHDTV 或者类似级别分辨率的 4K 显示器所面临的挑战和消费陷阱作了一些简单的讨论。

DCI 虽然号称是数字影院,但是只要你有足够的预算,大可以自己在家里弄一个 DCI 4K 影院,例如 dcicentral.com 的讨论区就有人购买了 Barco 的 DCI 认证 4K-23B DLP(8.2 万美元一台,相比之下索尼 11 万一台的 4K SXRD 真是价廉物美:p)搭建了一个 130 英寸屏幕的家庭 DCI 4K 影院。有人对汽车发烧、有人热衷炒房子,为什么不能烧烧家庭影院呢?当然能不能找到 DCI mxf 文件就是另一回事了:)

相对于 UHDTV、超高清电视这些术语,“4K 电视”一词虽然有点歧义但是对于普通人来说更容易理解,所以我相信在未来 4K 电视的说法会相当普遍。但是我希望大家在了解了 UHDTV 的各项细节后,不会盲目地认为只要分辨率达到 3840×2160 就可以称之为 UHDTV。

从实用性角度出发,我们需要支持 3840×2160 下具备 60Hz 刷新率(并非只是插帧速率,如果可能的话,最好能做到 3840*2160 120Hz 输入/显示)、10-bit 色深显示(不仅仅是电视机内部处理计算精度),此外我们还应该要求电视具备白场、暗场的三基色独立控制(某牌子吹嘘的六基色?见鬼去吧)。至于智能系统什么的,一般这个级别的电视都已经具备,甚至可以说以后的电视都将是具备智能操作系统的,所以这个不需要作为重点。

制约 4K 电视的最大问题显然是内容或者说节目稀缺,和 40 年前 HDTV 概念刚刚浮出水面相比,现在的数字化处理技术已经不可同日而语,但是要将浩瀚的 35mm 转为 4K 数字载体依然需要不少时间。

不过和旧内容相比,人们对新节目内容的 4K 化需求会更大,在这方面其实已经有部分节目是 4K 拍摄,例如索尼这边从 2005 年开始就有许多电影都是采用 35mm 胶卷拍摄并以 4K 作为母版格式,这使得新电影的 4K 化变得很容易,基本上就是将母版调一下比例后进行转码就可以了。

“4K”时代将来临!标准/技术一网打尽
电影霍比特人使用了四十八台 Red Epic 数字摄像机拍摄 5K 高帧率 3D 画面
上图是霍比特人制作特辑中导演彼得杰克逊在片场介绍使用 Red Epic 数字摄像机
黄色框中的就是 Red Epic 裸机机身

“4K”时代将来临!标准/技术一网打尽
Red 公司的“廉价版”5K 分辨率 SCARLET X 数字摄像机,据说 13 分钟就能制造一台
相比之下高阶的 Epic 当初第一台花了 12 小时才生产出来
SCARLET X 和 Epic 相比主要是拍摄帧率弱很多(5K 是 12fps,4K 是 30fps)
相比之下 Epic 可以做到 5K 96fps 和 4K 120 fps(HDRx 60fps)

除此以外,还有像《龙纹身的女孩》(2011 年)这样从拍摄到发行、放映(美国版)全程 4K 化的电影。

“4K”时代将来临!标准/技术一网打尽
Red 公司网站上公布的采用 Red 数字式摄像机拍摄的电影
上图是其中一小部分,点击后才能看到完整列表
Red 的摄像机都是具备 4.5~5K 拍摄能力

除了这些商业化电影外,在开源社区也有一些以 4K 发行的数字电影,例如 Sintel 就提供了 24 GB 大小的 4K DCP 版供免费下载,但是受资源限制,这样的玩票性质作品不可能推动 4K。

第13页:免费的 4K 片段下载与大家共赏

“4K”时代将来临!标准/技术一网打尽
独立电影 The Underwater 是在 Kickstarter 上集资拍摄
它采用的摄像机同样是 Red Epic
在 Youtube 上有该系列短片的 4K 版本观看

相对于电影工业来说,电视广播行业在这方面的动作要晚很多,受制于技术限制,现在绝大部分的电视摄像机拍摄出来的效果自然没法在 UHDTV 上呈现 4K 级画面,要指望这个利益关系错综复杂同时危机感并不十分强的行业升级到 4K,对许多国家来说没有十年是不太可能的事。

制约 4K 视频内容的技术原因之一是编解码技术。现在的新 H.264 编解码器虽然可以应付 4K,但是缺乏 UHDTV(Rec.2020)所需的 Hi10P 硬件支持,由于压缩率的缘故在面对广播传输的时候需要占用较大的带宽。

本文提及的 H.265 由于可以实现 50% 码率实现和 H.264 相当的画面品质,被认为是 4K 时代的首选编解码技术,由于设计伊始就已经考虑了硬件实现的难度,因此当标准得以从目前的草案阶段获得正式通过后,预计今年内就能看到相关的产品级软硬件实现,但是第一波的 H.265 硬件实现可能会普遍缺乏 UHDTV 所需要的 main 10 profile 支持,而目前上市的第一波 4K 电视也不具备 H.265 硬件解码器。

除了 H.265 外还有 Google 的 VP9 以及其他一些新编码技术,不过 VP9 的压缩率其实和 x264(目前最主流的 H.264 社区实现)差别不大。

而其他新编码技术方面目前看到的一个是名为 Daala 的项目,有 Mozilla 基金、Xiph.org 基金等机构推动,目标是做一个比 H.265 更好的免费编码标准。

DiAVC 的作者 schweinsz 也在 Doom9 讨论区上表示他正在做一个性能比 H.265 更好的私有编码器,不过既然是私有,那似乎意味着和我们没啥关系了。

对于电脑游戏玩家来说 4K 不会带来什么明显的好处,很多人使用的 20 英寸的显示器都有 1920*1080 级别的分辨率,跑实时渲染的 4K 游戏需要极高的图形性能,相比之下电影播放只要解决成本不高解码器即可,因此在这个领域用 4K 作为卖点吸引力不大。

图片处理、后期制作可能会比较需要 4K,但是分辨率不代表一切,对这些用户来说精确的色彩呈现和内置硬件色彩校正功能更加重要。

最后,我们在这提供一些免费的 4K 片段给大家吧(不要问我怎么翻墙,我不懂什么叫翻墙,也不要问我如何下载 Youtube 的 4K 版本,篇幅有限):

1、Lupa 4K(点 Youtube 播放器右下角的小齿轮选择“原画”模式就是 4K 版了):http://www.youtube.com/watch?v=D30a61m5byk&list=PL0234A32740F436B8

2、The underwater realm 4K:http://www.youtube.com/watch?v=_vUWrbBjPM8

这片子的第 II~V Part 都是 4K,我在土豆上也上传了 4K 版本,你可以到这里选择原画模式看看:http://www.tudou.com/programs/view/dAiErwJp3xk/

3、Iron Man 3 4K 预告片:http://www.youtube.com/watch?v=s3r74atUqic

4、暮光破晓下集 4K 预告片:http://www.youtube.com/watch?v=s3r74atUqic

5、Spring 4K 示范片段(片长两分钟,注册登录后点播放器左下方的下载按钮):http://www.4shared.com/video/ODyGXs2v/Spring_2_min_4K_60p.html

6、TimeScapes 4K 片段节选(片长两分钟,点播放器左下方的下载):http://www.4shared.com/video/vYmOVnyf/TimeScapes_2_min_4K_24p.html

7、精研事务所的 4K 测试片段官方下载链接:http://www.hd.club.tw/thread-126205-1-1.html


精研事务所推出的这段 4K 视频颇为流行

8、World War Z 4K 预告片:http://www.youtube.com/watch?v=p-AuCiu9R60&list=PLSO-njRpctecoOlDXapAfnOLBO9uKW5Fm

9、Warm Body 4K 预告片:http://www.youtube.com/watch?v=kFNBvKWxHy4&list=PLSO-njRpctecoOlDXapAfnOLBO9uKW5Fm

10、The Last Stand 4K 预告片:http://www.youtube.com/watch?v=7SqxAd68lhY&list=PLSO-njRpctecoOlDXapAfnOLBO9uKW5Fm&index=11

评论已关闭。