每帧的数据量不是1280 X 720再乘以3的。视频和静态图片不一样,每个像素不是具备R,G,B三色信息的,视频为兼容过去的黑白电视,以亮度和两个色度最后换算为R,G,B的。而且人眼对亮度敏感,色度一般敏感度只有亮度的一半,因此,以连续4个像素为单位,Y:PR:PB即亮度比两个色度的采样比率不是4:4:4,而多数是4:2:2(广播级录像格式,DIGITAL BETACAM\HDCAM\DVCPRO 50\DIGITAL S等),甚至民用级录像格式如DV\HDV\AVCHD等的只有4:2:0(PAL制式,如NTSC制式则为4:1:1)。只有最顶级的某些格式如拍摄数字高清电影的HDCAM SR等,能支持到4:4:4完全的RGB。
还有,可以用标清分辨率即PAL的720 X 576或NTSC的720 X 480,足够分清了。
另外,每帧实际像素数要高于以上这个数字。按照第一点说,对每个像素而言,亮度肯定是采样的,色度根据格式高级与否,看是只采亮度的二分之一还是四分之一。因此,通常一个格式会告诉我们亮度的采样频率为多少。标清格式而言,都是13.5MHZ就是1350万赫兹。如果以标清水平方向像素数720来算,PAL每帧共576行,1秒25帧,那么像素数实际也就是总的亮度采样频率为10.368MHZ,比13.5MHZ少。视频实际有个过扫描的情况,PAL系统而言,实际是625行,超过576的实际画面行数,同样,NTSC为525行,超过480行,而水平方向像素都是超过720个的,实际为854个左右。因此,PAL系统也有时标为625/50i(每秒50场,各行扫描方式,实际就是25帧)。
采样后,还有个位宽,其实就如最常见的静态图像24BIT一样,R,G,B三原色位宽为8BIT,就是每个原色幅度从0-255,一共构成2的24次方种色彩。同样,对视频而言,亮度、色度采样后,也有类似的位宽,当然,越细腻越好,这个道理和现在的HDCD,SACD等一样,比传统CD的16BIT位宽更高的位宽来提高音质。一般而言,DV,HDV,DVCPRO 25,DVCPRO 50等格式多为8BIT,SONY的DIGITAL BETACAM可选10BIT。
那么,假设,以标清PAL为例(实际PAL和NTSC每秒数据差不多,一个画面像素多,一个每秒帧数多,720 X 576):
亮度和两个色度比例完全可以只需要4:2:0即可(和4:1:1实际一样),DV就是这样的采样比,照样达到很不错的画质。每秒25帧时的亮度采样频率为13.5MHZ,那么两个色度都为3.375MHZ。位宽为8BIT。每秒10000帧就是25帧的400倍。
这样,每秒视频在未经过压缩时的数据量计算为:
亮度=400 X 13500000 X 8BIT=5400000000 X 8BIT。由于,1字节即1BYTE=8BIT,所以,这里的结果就是5400000000字节;
两个色度=400 X 2 X 3375000 X 8BIT ,同理,结果为2700000000字节。
结果相加,为8100000000字节。
后面么,就是1KB= 1024BYTE,1MB=1024KB这样的俗套。得到结果相当于7.54GB。
每秒未经压缩的,分辨率720 X 576,每秒10000帧的视频,数据量为7.54GB。
当然,还要压缩。广电行业里,目前非压缩格式都很少用,完全没必要。DV,DVCPRO系列和DIGITAL BETACAM用的都是基于MOTION JPEG的帧内/场内压缩,DV格式压缩比1:5,广播级的DIGITAL BETACAM等主要高级在色度采样频率更多,压缩比小,如1:2.3,当然,数据流量也就大。DV每秒数据流量就是25Mbps,注意是BIT,换算BYTE就差不多3.6MB。如果用MPEG-2,MPEG-4这种运动补偿这样更高级的压缩方式,那么数据量还可以更小。如同样适用DV磁带的HDV格式,之所以可以记录相同时间的1440 X 1080的HDV 1080I格式也是由于用了压缩更大的MPEG-2。