11.2 多媒体信息及文件格式

11.2 多媒体信息及文件格式

多媒体的信息形式主要有文本、图形、图像、音频、视频和动画等,每一种媒体形式都有严谨而规范的数据描述,其数据描述的逻辑表现形式是文件。

11.2.1 文本

文本包含字母、数字、字、词、句子等基本元素。 文本文件分为非格式化文本文件和格式化文本文件,非格式化文本是只有文本信息没有其他任何有关格式信息的文件,又称为纯文本文件,如“.TXT”文件;格式化文本文件是带有各种文本排版信息等格式信息的文本文件,如“.DOC文件”。

11.2.2 图形和图像

图形是指由外部轮廓线条(从点、线、面到三维空间)构成的矢量图,如直线、曲线、圆弧、矩形和图表等。 图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。 图形一般按各个成分的参数形式存储,可以对各个成分进行移动、缩放、旋转和扭曲等变换,可以在绘图仪上将各个成分输出。 因为图形文件只记录生成图的算法和某些特征点,所以也称为矢量图。 常用的矢量图形文件格式有“.3DS”(用于3D建模)、“.DXF”(用于CAD绘制图形)、“.WMF”(用于桌面出版)等。

图像是由扫描仪、摄像机等输入设备捕捉的实际场景或以数字化形式存储的任意画面。静止的图像是一个矩阵,它是由像素点阵构成的,阵列中的各项数字用来描述构成图像的各个像素点(pixel)的强度与颜色等信息,因此又称位图。 位图适于表现含有大量细节的画面,可直接显示或输出。 常用的图像文件格式有“.BMP”“.PCX”“.TIF”“.TGA”“.GIF”“.JPG”等。

图形和图像常见的文件格式有如下几种:

1)BMP(Bitmap)文件

BMP是一种与设备无关的图像文件格式,是最常见、最简单的一种静态图像文件格式,其文件扩展名是“.BMP”或者“.bmp”。

BMP图像文件格式共分3个域:一是文件头,它又分成两个字段,一是BMP文件头,一是BMP信息头;在文件头中主要说明文件类型,实际图像数据长度,图像数据的起始位置,同时还说明图像分辨率,长、宽及调色板中用到的颜色数。 第二个域是彩色映射(Color Map)。 第3个域是图像数据。 BMP文件存储数据时,图像的扫描方式是从左向右,从下而上。

BMP图像文件的主要特点是:文件结构与PCX文件格式相似,每个文件只能存放一幅图像;其文件存储容量较大,可表现从2位到24位的色彩,分辨率为480×320至1024×768。

2)GIF(Graphics Interchange Format)文件

GIF文件格式是由Compu Serve公司在1987年6月为了制定彩色图像传输协议而开发的,它支持64000px的图像,256到16M颜色的调色板,单个文件中的多重图像,按行扫描的迅速解码,有效地压缩以及硬件无关性。

GIF文件分为静态GIF和动画GIF两种,支持透明背景图像,适用于多种操作系统,存储容量很小,网上很多小动画都是GIF格式。 其实,GIF动画是将多幅图像保存为一个图像文件,从而形成动画,所以归根到底GIF仍然是图片文件格式。 但GIF只能显示256色。

3)JPEG(Joint Photographic Experts Group)文件

JPEG图像文件是目前使用最广泛、最热门的静态图像文件,其扩展名为“.jpg”。 JPEG是Joint Photographic Experts Group(联合摄影专家小组)的缩写,该小组是ISO下属的一个组织,由许多国家和地区的标准组织联合组成。

JPEG格式存储图像的基本思路是:开始显示一个模糊的低质量图像,随着图像数据被进一步接受,图像的清晰度和质量将会进一步提高,最后将显示一个清晰、高质量的图像。 同样一幅图画,用JPEG格式存储的文件容量是其他类型文件的1/20~1/10,一般文件大小从几十k B至几百k B,色彩数最高可达24位。

JPEG格式图像文件在表达二维图像方面具有不可替代的优势,被广泛运用于互联网以节约网络传输资源。

4)TIFF(Tag Image File Format)文件

TIFF图像文件格式是一种通用的位映射图像文件格式,是Alaus和Microsoft公司为扫描仪和桌上出版系统研制的,其扩展名为“.tif”。

TIFF图像文件具有以下特点:可改性,不仅是交换图像信息的中介产物,也是图像编辑程序的中介数据;多格式性,不依赖于机器的硬件和操作系统;可扩展性,老的应用程序支持新的TIFF格式的图像。

TIFF图像文件容量庞大,细微层次的信息较多,有利于原稿色彩的复制和处理,最高支持的色彩数达16M,传真收发的数据一般是TIFF格式。

5)WMF(Windows Meta File)文件

WMF是Windows Meta File的缩写,简称图元文件,是微软公司定义的一种Windows平台下的图像文件格式。 Microsoft Office的剪贴画使用的就是这个格式。

WMF图像文件比BMP图像文件所占用的存储容量小,而且它是矢量图形文件,可以很方便地进行缩放等操作而不变形。

6)PNG(Portable Network Graphic Format)文件

PNG图像文件是20世纪90年代中期开始开发的图像文件存储格式,其目的是替代GIF和TIFF文件格式,同时增加GIF文件格式所不具备的特性,称为流式网络图形格式,是一种位图文件存储格式,其文件扩展名为“.png”。

PNG图像文件用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位。

7)PSD/PDD文件

PSD/PDD是Adobe公司的图形设计软件Photoshop的专用格式,PSD文件可以存储成RGB或CMYK模式,还能够自定义颜色数并加以存储,还可以保存Photoshop的图层、通道、路径、蒙板,以及图层样式、文字层、调整层等额外信息,是目前唯一能够支持全部图像色彩模式的格式。 PSD文件采用无损压缩,因此比较耗费存储空间,不宜在网络中传输。

8)TGA(Targe Image Format)文件

TGA图像文件格式是Truevision公司为Targe和Vista图像获取板设计的TIPS软件所使用的文件格式,可支持任意大小的图像,专业图形用户经常使用TGA点阵格式保存具有真实感的三维有光源图像。

9)PCX文件

PCX图像文件是静态文件格式,是Zsoft公司研制开发的,主要与商业性PC⁃Paintbrush图像软件一起使用,其文件扩展名为“.pcx”。 PCX文件分为三类:各种单色PCX文件;不超过16种颜色的PCX文件;具有256种颜色的PCX图像文件。

PC⁃Paintbrush已经被成功移植到Windows环境中,PCX图像文件成为了个人计算机上流行的图像文件格式。

11.2.3 音频

音频是多媒体应用中的一种重要媒体,人类能够听到的所有声音都称为音频,正是音频的加入使得多媒体应用程序变得丰富多彩。 声音按频率可分为三种:次声(频率低于20Hz)、声波(20Hz~20k Hz)和超声(频率高于20k Hz)。 人耳能听到的声音就是频率为20Hz~20 k Hz的声波,多媒体音频信息就是这一类声音。 声音按表示媒体的不同可分为波形声音、语音和音乐三类。

①波形声音,包含了所有的声音形式,可以将任何声音进行采样量化,相应的文件格式是WAV文件和VOC文件。

②语音是由口腔发出的声波,一般用于信息的解释、说明、叙述、问答等,也是一种波形声音,所以相应的文件格式也是WAV文件和VOC文件。

③音乐是由各种乐器产生的声波,常用作欣赏、烘托气氛,是多媒体音频信息的重要组成部分。 相应的文件格式是MID和CMF文件。

常用的音频文件格式有以下几类:

1)WAV文件

WAV是Microsoft公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,是一种无损压缩。 其文件容量较大,多用于存储简短的声音片段,WAV文件打开工具是Windows的媒体播放器。

2)MPEG音频文件

MPEG音频文件是MPEG标准中的音频部分。 MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码程度的不同可分为三层(MPEGAudio Layer1/2/3),分别对应MP1,MP2, MP3这三种声音文件。

MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,标准的MP3的压缩比为10∶1。 一个长达3min的音乐文件压缩成MP3文件后大约是4MB,可保持音质不失真。 目前在网络上使用最多的是MP3文件格式。

3)MIDI(Musical Instrument Digital Interface)文件

MIDI是数字音乐/电子合成乐器的统一国际标准,定义了计算机音乐程序、合成器及其他电子设备交换音乐信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,可以模拟大提琴、小提琴、钢琴等常见音乐。

MIDI文件比数字波形文件所需的存储空间小得多,如记录1min MIDI音频数据文件只需4k B的存储空间,而记录1min8位、22.05k Hz的波形音频数据文件需要1.32MB的存储空间。 MIDI文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。

4)WMA(Windows Media Audio)文件

WMA文件是继MP3后最受欢迎的音乐格式,在压缩比和音质方面都超过了MP3,能在较低的采样频率下生成好的音质文件。 WMA不用像MP3那样需要安装额外的播放器,而Win⁃dows操作系统和Windows Media Player的无缝捆绑让用户只要安装了Windows操作系统就可以直接播放WMA音乐。

5)Real Audio文件

Real Audio文件是Real Networks公司开发的音频文件格式,其文件格式有“.RA”“.RM”“.RAM”,用于在低速率的广域网上实时传输音频信息,主要适用于在网络上进行在线音乐欣赏。

6)AAC(Advanced Audio Coding)文件

AAC文件是杜比实验室为音乐社区提供的技术,出现于1997年,是基于MPEG⁃2的音频编码技术,目的在于取代MP3,所以又称为MPEG⁃4AAC,即M4A。

11.2.4 视频

视频泛指将一系列静态影像以电信号方式加以捕捉、记录、处理、储存、传送与重现的各种技术,它是由一幅幅单独的画面序列(帧)组成,这些画面以一定的速率连续投射在屏幕上,使观看者产生动态图像的感觉。 常见的视频文件有以下几种格式:

1)AVI(Audio Video Interleaved)文件

AVI文件是音频视频交互的文件。 该格式的文件不需要专门的硬件支持就能实现音频和视频压缩处理、播放和存储,其扩展名为“.avi”。 它采用Intel公司的Indeo视频的有损压缩技术将视频信息与音频信息交错混合地存储在同一个文件,较好地解决了音频信息与视频信息的同步问题。

AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也用在互联网上供用户下载、欣赏新影片的精彩片段,但该格式文件保存的画面质量不是太好。

2)MOV文件

MOV文件是Quick Time的文件格式,是美国Apple公司开发的一种视频格式,默认的播放器是苹果的Quick Time Player,具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持Mac OS,同样也能支持Windows系列。

MOV文件格式支持256位色彩,能够通过因特网提供实时的数字化信息流、工作流与文件回放,国际标准化组织(ISO)选择了MOV文件格式作为开发MPEG⁃4规范的统一数字媒体存储格式。

3)MPEG(Moving Pictures Experts Group)文件

MPEG文件是一种应用在计算机上的全屏幕运动视频便准文件格式,被称为运动图像专家组格式,家里常看的VCD,SVCD,DVD就是这种格式。 它采用了有损压缩方法减少运动图像中的冗余信息,即认为相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达200∶1)。 目前,MPEG格式有三个压缩标准,分别是MPEG⁃1,MPEG⁃2和MPEG⁃4,此外,MPEG⁃7和MPEG⁃21仍处于研发阶段。

大多数视频播放软件均支持MPEG文件。

4)DAT(Digital Audio Tape)文件

DAT文件是VCD专用的视频文件格式,是一种基于MPEG压缩、解压缩技术的视频文件格式。

5)3GP文件

3GP文件是为了配合3G网络的高速传输速度开发的,是手机中最为常见的一种视频格式,其文件扩展名为“.3gp”。3GP文件还可以在个人计算机上观看,且视频容量较小。

11.2.5 动画

动画是活动的画面,实质是利用了人眼的视觉暂留特性将一幅幅静态图像的连续播放而形成。 计算机动画可分为两大类:一类是帧动画;另一类是矢量动画。

帧动画是指构成动画的基本单位是帧,很多帧组成一部动画片。 帧动画主要用在传统动画片的制作、广告片的制作,以及电影特技的制作方面。

矢量动画是经过计算机计算而生成的动画,其画面只有一帧,主要表现变换的图形、线条、文字和图案。 矢量动画通常采用编程方式和某些矢量动画制作软件完成。

动画文件常用的格式有以下几类:

1)FLIC文件

FLIC文件是Autodesk公司在其出品的二维、三维动画制作软件中采用的动画文件格式,采用256色,分辨率为320×200至1600×1280,其文件扩展名为“.FIC”。

FLIC文件的容量随动画的长短而变化,动画画面越多,容量越大。 该格式的文件采用数据压缩格式,代码效率高、通用性好,被大量用在多媒体产品中。

2)GIF(Graphics Interchange Format)文件

GIF文件具有多元结构,可以是静态图像(前面已经介绍过),也可以是动态图像即动画。GIF动画文件采用LZW缩算法来实现存储图像数据、多图像的定序和覆盖、交错屏幕绘图以及文本覆盖等技术。

3)SWF文件

SWF文件是基于Macromedia公司Shockwave技术的流式动画格式,是用Flash软件制作的一种格式,其扩展名为“.fla”。 该格式文件体积小、功能强、交互能力好、支持多个层和时间线程,较多地应用在网络动画中。