11.3 多媒体数据的获取与处理

11.3 多媒体数据的获取与处理

多媒体信息可以从计算机输出界面向人们展示丰富多彩的图、文、声、像,而计算机内的信息都是以0和1进行处理和交换的。 上一节已经介绍过多媒体信息的文件存储格式,本节主要介绍多媒体信息的获取与处理。

11.3.1 图像的获取与处理

1)图像的属性

(1)分辨率

图像由像点构成,像点的密度决定了分辨率的高低,图像分辨率的单位是dpi(displaypix⁃elsperinch)。 dpi的数值越大,像点密度越高,图像对细节的表现力越强,清晰度也越高。 根据应用场合可将图像分辨率分为以下三种类型:

①屏幕分辨率(Screen Resolution):指屏幕上的最大显示区域,取决于显示器硬件条件。如个人计算机显示器的屏幕分辨率是96dpi,则当图像用于显示时,分辨率应取96dpi。

②显示分辨率(Display Resolution):是一系列标准显示模式的总称,单位为像素;由水平方向的像素总数和垂直方向的像素总数构成,如某显示器分辨率为水平方向1024个像素,垂直方向768个像素,则记为1024×768。

③打印分辨率(Print Resolution):是打印机输出图像时采用的分辨率,不同打印机的最高打印分辨率不同,而同一台打印机可以使用不同的打印分辨率。 打印分辨率越高,打印质量越好。

(2)色彩

色彩是美学的重要组成部分,图像处理离不开色彩处理。 色彩具有以下属性:

①色相(Hue):颜色的相貌,用于区别颜色的种类,如红、橙、黄、绿、青、蓝、紫就是色相。色相的运用主要表现在色彩冷暖氛围的制造、表达某种情感等。

②饱和度(Saturation):又称纯度,指色彩的饱和程度。 自然光中的红、橙、黄、绿、青、蓝、紫光色是纯度最高的颜色。 在色料中,红色的纯度最高,橙、黄、紫色次之,蓝绿色的纯度相对较低。 人眼对不同颜色的纯度感觉不同,红色醒目,纯度感觉最高;绿色尽管纯度很高,但人们对绿色不敏感。 黑、白、灰色是没有纯度的颜色。

③亮度(Brightness):指色彩的明暗程度。 处理好物体各部分的亮度,可以产生物体的立体感。 白色是影响亮度的重要因素,当亮度不足时,增加白色,可增加亮度,反之亦然。

④对比度(Contrast):指不同颜色之间的差异程度。 对比度越大,两种颜色之间的反差就越大;对比度越小,两种颜色之间的反差就越小,颜色越相近。

⑤色阶(Levels):指各种图像色彩模式下图像原色的明暗度,色阶的调整也就是明暗度的调整。 色阶的范围为0~255,总共包括256种色阶。 如红色的色阶加大就成了深红色。

2)图像的获取

图像获取过程是把自然的影像转换成数字化图像的过程,其实质是进行模数(A/D)转换,即通过相应的设备和软件,把作为模拟量的自然影像转换成数字量。

图像获取的重要途径是两类:

(1)利用设备进行模数转换

在进行模数转换之前,首先收集图像素材,如印刷品、照片以及实物等,然后使用彩色扫描仪对照片和印刷品进行扫描,经过少许加工,即可得到数字图像。 也可使用数码照相机直接拍摄景物,再传送到计算机中进行处理。

(2)从数字图像库或网络上获取图像

数字图像库通常采用光盘作为数据载体,多采用JPG文件格式。 国际互联网的某些网站也提供合法的图片素材,有些需要支付少量费用;也可使用GOOGLE和BAIDU等搜索引擎搜索图片。 值得注意的是,在购买光盘或从互联网上下载图像时,应注意图像是否被授权使用、是否需要支付费用等。

3)图像的处理

矢量图形是由计算机绘图软件生成的,不必再对其进行数字化处理。 现实中的图像是一种模拟信号,图像数字化的目的是把真实的图像转变成计算机能够接受的显示和存储格式,更有利于计算机进行操作。 图像的数字化过程分为采样、量化和编码三个步骤。

(1)采样

图像采样就是将连续的图像转换成离散点的过程,其实质是用若干个像素点来描述这一幅图像。 其结果就是通常所说的图像分辨率,分辨率越高,图像越清晰,存储量也越大。

(2)量化

量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离散化为整数值的过程。 把量化时可取的整数值称为量化级数,表示色彩所需的二进制位数称为量化字长。 一般用8位、16位、24位、32位等表示图像的颜色,24位可表示为224=1677216种颜色,称为真彩色。

(3)编码

编码是指按照一定的方法用二进制表示量化后的样本值的过程,主要与图像压缩技术相关。

在取样、量化和编码处理后,就能产生一幅数字化图像,再运用图像处理软件就能进行修饰或者转换。

11.3.2 音频的获取与处理

音频信号是多媒体技术经常采用的一种形式,主要表现形式是语音、自然声和音乐。

1)声音属性

①音调:声音的高低。 音调与频率有关,频率越高,音调越高,反之亦然。 各种声源具有自己特定的音调,如果改变了某种声源的音调,则声音会发生质的转变。

②音色:具有特色的声音。 各种声源具有自己独特的音色,如各种乐器的声音、每个人的声音、各种生物的声音等,人们就是根据音色辨别声源种类的。

③音强:声音的强度,也称为声音的响度,也就是通常所说的“音量”。 音强与声波的振幅成正比,振幅越大,强度越大。 唱盘、CD光盘及其他形式声音载体中的音强是一定的,可以通过改变播放设备的音量改变聆听时的响度。

2)音频的获取

音频的获取就是将自然界中的模拟量声音转换成计算机能够处理的数字音频信号,即声音的数字化过程,也叫作音频数据采样过程。

声音采样分为以下类型:

①CD音乐采样:指使用专用软件对CD盘上的音乐、语言以及其他形式的声音进行数字转换,生成多种格式的数字音频信号。

②自然声采样:直接录音。 在录音过程中,实时地完成采样,形成数字音频信号。 话筒主要用于录制声音,使用时需要将话筒与计算机声卡上的“话筒”端口(MIC)相连,就可以录制声音了。

③线路输入采样:是指录制随身听等有源设备的声音,需要用声音信号线把有源设备与计算机声卡上的线路输入端口(Line In)相连。

④MIDI文件:需要用音序器进行录制,可以连接外部MIDI键盘进行录制。

3)音频的处理

对数字音频可以采用以下处理,从而使音频信号实现多重效果。

①剪辑、粘贴、复制、混合:实现单个声音的选取、剪裁,多个声音的连接、混合等。

②修改参数:改变声音的播放时间或改变声音的间距。

③特殊效果处理:如增加回声、逆向播放等。

④改变波形:使作品更加动听。

11.3.3 视频的获取与处理1)视频的分类和制式

(1)视频分类

①模拟视频:是基于模拟技术及图像显示所确定的国际标准,如电视和录像片等。 它具有成本低和还原度好等优点,缺点是经过长时间存放或多次复制后,视频质量将大为降低。

②数字视频:是基于数字技术及其他更为拓展的图像显示标准。 数字视频技术包含两层:第一是将模拟视频信号输入计算机进行数字化视频编辑制成数字视频产品;第二是由数字摄像机拍摄的视频图像通过软件编辑而制成数字视频产品。

(2)视频制式

电视信号采用不同的编码标准,就形成了不同的电视制式。 电视制式是指一个国家的电视系统所采用的特定制度和技术标准。 目前,世界上共有3种彩色模拟电视制式。

①NTSC(National Television Standard Committee)制:美国、加拿大、日本,中国台湾地区采用这种制式;帧频为每秒29.97帧,扫描线为525,逐行扫描,画面比例为4∶3,分辨率为720×480。

②PAL(Phase Alternate Line)制:中国、德国、英国和朝鲜等采用这种制式,帧频为每秒25帧,625条扫描线,隔行扫描。

③SECAM(Sequential Colorand Memory System)制:法国、俄罗斯以及东欧和非洲一些国家采用这种制式;帧频为每秒25帧,扫描线625行,隔行扫描,画面比例为4∶3,分辨率为720× 576,约40万像素,亮度带宽为6.0MHz。

这些制式标准定义了模拟彩色电视对视频信号的解码方式,不同制式对色彩处理方式、屏幕扫描频率等有不同的规定。

另外,人们在1966年研制出了HDTV电视(High Definition TV,高清晰度电视):分辨率最高可达1920×1080,帧频高达每秒60帧。 具有较高的扫描频率,传送信号全部数字化。 这是电视技术在经历了黑白电视和第一代彩色电视发展阶段之后,向新一代数字高清晰度电视的过渡阶段。

2)视频的获取

视频的获取主要是从资源库、电子书籍、课件及录像片、VCD、DVD片中获取,从网上也能找到视频文件。

获取视频文件最可靠的方法是用采集卡进行采集,最方便的方法是用超级解霸进行采集。

用采集卡采集视频素材的方法:安装好采集卡并连接好线路后,启动采集软件,设置好相关参数后,用录像机或影碟机进行浏览,发现要采集的内容后,单击“记录”按钮开始采集,记录完毕后,把采集到的信息保存为AVI格式即可。

3)视频的处理

数字视频的处理主要是非线性编辑完成的,包括数字视频编辑、数字音频制作和数字特技制作。

基于计算机的数字非线性编辑技术是数字视频技术与多媒体计算机结合的产物。 它采用了电影剪辑的非线性模式,用简单的鼠标和键盘操作代替了剪刀加胶水式的手工操作。 剪辑结果可以马上回放,可以对存储的数字文件反复更新和编辑。