570 likes | 650 Views
第六章 多媒体应用能力培养. 本章学习重点. 了解多媒体计算机中的关键技术. 1. 掌握音频、视频处理技术. 2. 掌握多媒体数据压缩技术和标准. 3. 4. 了解常见的多媒体软件. 6.1 多媒体的基本概念. 多媒体技术是 20 世纪 80 年代发展起来并得到广泛应用的计算机新技术。 20 世纪 90 年代后,多媒体技术得到了飞速发展,并带动了它在教育、商业、文化娱乐、工程设计及通信等领域的广泛应用,它不仅为人们勾画出一个多姿多彩的视听世界,也使得人们的工作和生活方式发生了巨大的改变。. 媒体( Medium ):
E N D
本章学习重点 了解多媒体计算机中的关键技术 1 掌握音频、视频处理技术 2 掌握多媒体数据压缩技术和标准 3 4 了解常见的多媒体软件
6.1 多媒体的基本概念 • 多媒体技术是20世纪80年代发展起来并得到广泛应用的计算机新技术。 • 20世纪90 年代后,多媒体技术得到了飞速发展,并带动了它在教育、商业、文化娱乐、工程设计及通信等领域的广泛应用,它不仅为人们勾画出一个多姿多彩的视听世界,也使得人们的工作和生活方式发生了巨大的改变。
媒体(Medium): 人们用于传播和表示各种信息的载体,如文本、声音、图形及图像等,两个或多个的组合称为多媒体(Multimedia)。 • 多媒体技术: 利用计算机技术把数字、文字、声音、图形和图像等各种媒体进行有效地组合,并对这些媒体同步地获取、编辑、存储、显示和传输的一门综合技术。 • 文本(Text): 多媒体中最基本也是应用最为普遍的一种媒体。 多媒体中的文本看上去整洁易懂,通常只显示10个左右的重要语句和内容,只要将鼠标移至其上并单击,就会出现对应这个语句的画面和声音。
图形和图像 • 多媒体中的图形和图像可以是人物画、景物照片或者其他形式的图案。 • 表达一个问题要比文字更具直观性,也更有吸引力。 • 例如,用图案去介绍一个自然景观,就不会像文字说明那样,给人一种呆板和缺乏想像力的感觉。 • Windows中最常用的图像文件格式是DIB、BMP、PCX和TIFF。
音频 • 音频:数字化后的声音,用来做解说词、背景音乐和音效。 • 常用声音文件格式:WAV、MIDI、RMI、MP3、WMA等。 • WAV文件:微软公司开发的一种音频文件格式,得到广泛支持,记录对实际声音进行采样的数据,也称波形数据文件。需要较大的存储空间,多用于存储简短声音片断。 • MIDI文件: “乐器数字接口”,世界MIDI协会设计的一种音乐文件标准。存储空间比WAV文件小得多。
6.1.2 多媒体的组成要素--音频 • RMI文件:微软公司的MIDI格式文件。 • MP3文件:使用MPEG-l压缩标准的声音文件格式。压缩比非常高,在一张CD唱盘中可以存储多达500首歌曲,并能保持高音质的立体声。 • WMA文件:微软公司发布的一种音频压缩格式,采用减少数据流量但保持音质的方法来达到比MP3更高压缩率的目的。
6.1.2 多媒体的组成要素--动画和视频 • 视频信息一般通过摄像机、录像机等设备捕获到计算机内部 • 视频文件主要有:AVI、MOV、MPG等格式 • AVI文件:Windows采用的动画、动态图像格式文件,采用Intel公司的Indeo视频有损压缩技术,将视频信息和音频信息混合存储在同一个文件中,较好地解决了音频与视频信息的同步问题。
6.1.2 多媒体的组成要素--动画和视频 • MOV文件:QuickTime for Windows视频处理软件所采用的视频文件格式。它采用先进的视频和音频处理技术,其图像画面的质量要比AVI文件好。 • MPG文件:采用MPEG标准,一种高度压缩的视频文件 • 将一段好的动画片穿插在多媒体中,不仅可使整体风格更为活泼,同时会更吸引人,尤其是儿童会更酷爱这类多媒体信息系统。
6.1.2 多媒体的组成要素--流媒体 • 流媒体:应用流技术在网络上传输的多媒体文件,将连续的图像和声音信息经过压缩后存放在网站服务器,让用户一边下载一边观看、收听,不需要等整个压缩文件下载到用户计算机后才可以观看。 • 流媒体就像“水流”一样从流媒体服务器源源不断地“流”向客户机。该技术先在客户机创建一个缓冲区,在播放前预先下载一段资料作为缓冲,避免播放的中断,也使得播放质量得以维护。 • 流媒体的主要文件格式:RM,ASF,MOV, MPEG-l,MPEG-2,MPEG-4,MP3等。
6.2 多媒体计算机的基本组成 • 多媒体计算机系统 = • 多媒体硬件系统 • + • 多媒体软件系统
6.2.1 多媒体计算机的硬件系统 • 多媒体计算机的硬件包括: • 多媒体主机:PC机、工作站及超级计算机等。 • 多媒体输入设备:摄像机、麦克风、录像机、录音机、扫描仪、视盘及数字相机等。 • 多媒体输出设备:高分辨率显示器、打印机、绘图仪、电视机、音响、立体声耳机、录像机及录音机等。
6.2.1 多媒体计算机的硬件系统 • 多媒体存储设备:硬盘、光盘及磁带等。 • 多媒体功能卡:声频卡、视频卡、图形加速卡、多媒体压缩卡、家电控制卡及通信卡等。 • 操作控制设备:鼠标、操纵杆、键盘及触摸屏等。
6. 2. 2 多媒体计算机的软件系统 • 多媒体计算机软件系统一般包括: • 多媒体操作系统 • 多媒体数据库 • 压缩解压程序 • 声像同步处理程序 • 通讯程序 • 多媒体开发制作工具软件
电视机 录像机 VCD机 麦克风 音箱 音响 设备 电视卡 多媒体 主机 声卡 扫描仪 打印机 CD-ROM 图6.1 多媒体硬件系统示意图 6. 2. 2 多媒体计算机的软件系统
6.3 多媒体计算机信息处理技术基础 • 多媒体计算机与其他具有声音、影像播放功能的电视机、录音机、录像机等家用电器的根本区别: • 多媒体计算机具有信息集成、交互等特有的功能。 • 从计算机信息处理角度进行划分,多媒体技术在对各种媒体信息处理方面一般主要采取转换、集成、管理和控制以及传输等方式。
6.3 多媒体计算机信息处理技术基础 • 转换可以分为两个阶段:信息采集和信息回放。信息采集是将这些媒体信息转换成计算机能够识别的数字信号;而信息回放则是把计算机处理后的数字信息还原成人们所能接收的各种媒体信息,用于信息的再现。 • 集成是对各种类型的媒体信息进行组合 • 管理和控制是在应用媒体信患过程中对各种媒体素材进行编辑、剪裁和重组等操作。 • 传输是将处理后的媒体信息以各种方式传递给其他用户。
6.3.1 音频处理 • 声波:由机械振动产生的一维压力波,是机械振动,振动越强,声音越大。 • 模拟音频技术:通过模拟电压的幅度表示声音的强弱。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,例如磁带或唱片,播放时将记录在媒体上的信号还原为声音波形。 • 数字音频:声音信号也用一组数字表示 • 数字音频与模拟音频的区别:模拟音频在时间上是连续的,而数字音频是一个数据序列,在时间上是断续的。
6.3.1 音频处理 • 采样(量化) : • 声音信息的数字化过程是每隔一个时间间隔在模拟声音波形上取一个幅度值,并把得到的表示声音强弱的模拟电压用数字表示。 • 采样周期: • 采样的时间间隔称
6.3.1 音频处理 • 采样时钟间隔 • 数字信号 • 模拟信号输入 模/数 数/模 模拟信号输出 • 处理、存储、传输 • 图6.2 数据处理过程
6.3.1 音频处理 • 采样周期越短,数字化音频的质量也就越高。根据采样定理可知,在对模拟信息采集时,选用该信号所含最高频率两倍的频率采样,才可基本保证原信号的质量。 • 采样量化位数的大小反映出对各个采样点进行数字化时所选用的精度。 • 采样和量化的主要硬件:模数字转换器(A/D转换器); • 数字音频回放时硬件:数模转换器(D/A转换器
6.3.1 视频处理 • 多媒体计算机最常用的图像有图形、静态图像和动态图像(视频) • 获得这3种图像的方法: • 1.利用相关工具软件,由计算机直接产生图形、静态图像和动态图像 • 2.利用彩色扫描仪,输入图形和静态图像 • 3.通过视频信号数字化仪,将彩色全电视信号数字化后,输入到多媒体计算机中
6.3.1 视频处理--图形图像的数字化 • 模拟图像的数字化:采样、量化 • 采样:把时间和空间上连续的图像转换成离散点的过程 • 量化:在图像离散化后,将表示图像色彩浓淡的连续变化值离散成等间隔的整数值(即灰度级) • 在多媒体计算机系统中,图像的颜色是用若干位二进制数表示的,被称为图像的颜色深度。例如,黑白图像的颜色深度为1,只能表示出两种色彩,即黑和白。图像数据类型有多种形式,其主要区别就是图像颜色深度不同。
6.3.1 视频处理--图形图像的数字化 • 常见的图像数据类型: • Black White:黑白图,图像颜色深度为1,2种颜色 • Gray Scale:灰度图,图像颜色深度为8,256种颜色 • RGB 8-color:S色图,图像颜色深度为3,8种颜色 • Indexed 16-color:索引16色图,图像颜色深度为4,通过建立调色板,可以任选16种颜色供图像使用,调色板中的颜色根据不同的图像可以进行改变 • Indexed 256-color:索引256色图,图像颜色深度为8 • RGB true color:真彩色图,图像颜色深度为24,可表示1670万种颜色,其像素的色彩数由3个字节组成,分别代表R(红)、G(绿)和B(蓝)三色值。人的眼睛能够分辨出的颜色大约有l万6千多种,把这种图像数据类型称为真彩色。
6.3.1 视频处理--动态图像的数字化 • 人眼的属性:当图像出现在视网膜上后,在它消失前将滞留几毫秒。图像以每秒25帧或以上的速度呈现时,眼睛看到的景象是连续的。 • 从存储形式看,视频可分为模拟视频和数字视频。 • 视频采集卡任务:将模拟视频信号转换成数字视频信号并送到计算机中。 • 视频采集卡构成:视频信号采集模块、音频信号采集模块和总线接口模块组成。音频信号采集模块完成对音频信息的采样和量化。总线接口模块实现对视频、音频信息采集的控制,并将采样、量化后的数字信息存储到计算机中。
6.4 多媒体数据的压缩 • 多媒体信息数字化后,数据量庞大 • 与计算机存储资源和网络带宽之间有很大差距 • 为适应多媒体信息的处理:对多媒体数据在存储和传输时进行压缩,当用到它时把数据解压缩以还原。
6.4.1 数据压缩机制 • 数据压缩机制分为两类: • 熵编码 • 信源编码
6.4.1 数据压缩机制--熵编码 • 熵编码:仅处理比特流而不考虑这些比特的具体含义。一种通用 的、无损的、完全可逆的技术,可应用于任何数据。 • 下面,通过一个行程编码例子说明它: • 行程编码:将数据中重复出现的符号,用该数据中不允许出现的一个特殊标记替换,后跟一个行程符号,其后跟有该符号重复出现的次数,从而缩短数据的表示。
6.4.1 数据压缩机制--信源编码 • 例如,下面给出的十进制数字串: 44600000000000008357111111111111111165780000000000000000000056 • 如果加入标记A,并使用两位数做重复计数,则可将上面的数字串编码为: • 446A0138357A1166578A02056 • 这里,行程编码将数字串长度减少了一半。
6.4.1 数据压缩机制--信源编码 • 信源编码:利用数据的属性进行更大程度的压缩,这种压缩一般是有损的。 • 信源编码的一个例子是向量量化信息编码,它是一种面向图像数据的应用。这里,图像被固定尺寸的矩形分割,由此建立一个矩形索引表(又称“代码手册”),每个矩形的传送通过查找代码手册,用索引代替矩形。显然,如果图像只由少数矩形决定,将能节省大量的带宽。
6.4.1 数据压缩机制--信源编码 • 无损压缩:利用数据统计特性进行的压缩处理,压缩效率不高,但保留了原文件中的全部信息。 • 常用的无损压缩图像格式有BMP,TIFF、PCX、GlF等。 • 有损压缩是以损失原文件中某些信息为代价来换取较高的压缩率,其损失的信息多数是对视觉和听觉感知不重要的信息。 • 常用的图像压缩技术标准:JPEG • 常用的视频压缩技术标准:MPEG
6.4.2 JPEG标准与MPEG标准 • JPEG: Joint Photographic Experts Group • 国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合制定 • 适合于连续色调、多级灰度、彩色或单色静止图像数据压缩 • 采用离散余弦变换(Discrete Cosine Transform,DCT)算法来进行压缩 • 将图像切割成8×8的二维像素,称为一个“块”,再以块为单位进行适当的量化处理,这样的压缩可获得10:1到80:1的压缩比。
6.4.2 JPEG标准与MPEG标准 • MPEG:Moving Picture Experts Group • ISO/IEC委员会的第11172号标准草案 • 包括MPEG视频、MPEG音频和MPEG系统3部分,是一种动态图像压缩标准。 • 其方法是先利用动态预测及差分编码方式去除相邻两张图像的相关性,因为对于动态图像而言,除了正在移动的物体附近,其余的像素几乎是不变的,因此可以利用相邻两张甚至多张来预测像素可能移动的方向与亮度值,再记录其差值。 • 将这些差值利用转码或分频式编码将高低频分离,然后用一般量化或向量量化的方式舍去一些画质而提高压缩比,最后再经过一个可变长度的不失真型压缩而得到最少位数的结果,可以得到50:1到 100:1的压缩比。
6.4.2 JPEG标准与MPEG标准 • MPEG主要的三个版本:MPEG-l、MPEG-2和MPEG-4 • MPEG-l:1992年,针对1.5 Mb/s以下数据传输率的数字存储媒体运动图像及其伴音编码 • MPEG-2:1994年,针对高清晰电视(HDTV)的视频及伴音信号,数据传输率3~10 Mb/s • MPEG-4:1998年,基于视听(AV)对象的多媒体编码标准,更加注重多媒体系统的交互性和灵活性。可以应用于数字视频的存储和交互式视频信息服务。
6.5 常用的多媒体信息处理工具 6.5.1 图形图像处理工具Photoshop • 6.5.2 动画制作软件 • 6.5.3 视频编辑软件Premiere • 6.5.4 多媒体著作工具Authorware和Director • 6.5.5 使用超级解霸播放DVD • 6.5.6 其他多媒体播放软件及插件
6.5.1 图形图像处理工具Photoshop • 多媒体图形处理软件:通过对点、线、面等基本元素进行有机组合,从而形成各种图形以及对它们进行各种特效处理,最终形成图形文件。 • 在众多图像处理软件中, Adobe Photoshop已成为数字图像处理软件处理程序的标准,以便宜的个人计算机,通过直观的界面,制作各种特效的图像产品。
6.5.1 图形图像处理工具Photoshop 图6.4 Adobe Photoshop 7.0的工作界面
6.5.1 图形图像处理工具Photoshop • Photoshop: • 功能强大,集绘图及编辑工具、色彩修正工具、产生特殊效果工具于一身。 • 用户可以利用它做很多事情,例如,扫描图片并对扫描后的图片进行调整;处理来自数字照相机的照片;捕捉一张计算机屏幕上显示的图像;对图片进行各种艺术处理;为Office文档或网页文件等制作精美的插图;制作具有特殊效果的文字等。
6.5.2 动画制作软件 • 二维动画制作软件: • 将一系列画面连续显示以达到动画效果。动画生成的步骤基本包括:给出运动对象的背景,设定对象的尺寸、初始位置,勾画出对象的运动路径等。 • 目前流行的二维动画制作软件: • Animator Studio、AXA 2D、Flash等
6.5.2 动画制作软件 • Macromedia公司推出的Flash,特点如下: • 矢量动画。由于Flash动画是矢量的,不论把它放大多少倍,它依然那么清晰,因此可以把Flash的文件做得很小,而在网页中用HTML命令把它放大。 • 采用“流”技术播放。Flash动画是边下载边演示。 • 交互按钮。可方便加入按钮控制页面跳转、与其他网页的链接,或触发一系列事件,丰富了网页的表现手段。 • 易学易用。使用过类似Photoshop软件的人都可轻松掌握Flash动画的制作。自1998年问世后,Flash已成为一种Web多媒体的标准格式,它能够帮助读者制作出更精彩的多媒体网页。 • 此外,Flash还广泛应用在交互软件开发、演示和教学方面。
6.5.3 视频编辑软件Premiere • 对多媒体应用系统的开发者来说,将模拟视频信号进行数字化采样后,还应对视频文件进行编辑或加工,然后才能在多媒体应用系统中使用。目前常见的视频处理软件有Premiere、idea For Windows和Digital Video Productor等。Premiere是Adobe公司推出的一种专业化数字视频处理软件。该软件利用数字方式对视频信息进行编辑处理,制作出具有多种视觉效果的视频文件。
6.5.3 视频编辑软件Premiere • 在Premiere中,任何工作都是从Project(项目)开始的。在每个项目文件(*.ppj)中包含了制作过程中所有的设置工作,以及所调用的在视频片段、静止图像、音频片段等。一般情况下,在Premiere中只能打开一个项目文件。
6.5.3 视频编辑软件Premiere 图6.5 “新建项目”对话框
6.5.3 视频编辑软件Premiere 图6.6 视频编辑窗口
6.5.4 多媒体著作工具Authorware和Director • 多媒体电子出版物是多媒体技术应用的重要领域之一. • 多媒体著作工具是多媒体电子出版物开发制作过程中不可缺少的,使用它可以将多种媒体素材集成为一个完整的、具有交互功能的应用程序。 • 从创作形式划分,多媒体著作工具大致可分为4种: • 1.以图标为基础的编辑工具(如Authorware) • 2.以书页为基础的编辑工具(例如ToolBook) • 3.以时间轴为基础的编辑工具(例如Director) • 4.传统的编程工具(例如Visual Basic)
1. Authorware • Authorware:Macromedia20世纪90年代初推出的一种多媒体著作工具,其工作界面如下图。
1. Authorware • Authorware:从1.0版本到目前的7.0版本,一直都是众多多媒体著作工具中的佼佼者 • Authorware创作环境:提供13种用以表现不同媒体对象的编辑图标以及11种在人们日常生活、工作中经常被采用的交互方式,向开发者提供了一种“搭积木”式的创作方法。开发者只需根据作品的特点,设计出产品流程图,然后将这些图标用流程图方式有机地结合在一起,即可完成多媒体应用系统的制作。 • 以其易学易用的特征、方便灵活的创作方式以及结构化的设计思想,也深受专业创作人员的喜爱。
2. Director • 以时间轴为基础的多媒体著作工具借鉴了影视制作的形式,按照对象的出场时间设计和规划整个作品的表现方式,其代表是Director。 • Macromedia公司推出的Director多媒体著作工具,采用基于角色(cast)和帧(frame)的动画制作方式。 • 在Director系统中,所使用的各种素材统称为“角色”,被放置在角色窗口中进行管理、使用和查找都很方便。Director提供一个总谱(score)窗口,该窗口中主要包括横向的帧序列(时间轴)和纵向的通道(channel)序列。
2. Director • 总谱窗口是Director的核心,二维动画的逐帧制作就是在此完成的,即动画中出现的每个对象,在动画编辑过程中都被设定为相应的帧,沿着时间轴帧序列构成了一组动画画面。 • 每个角色的动作都是单程控制,最后在总谱窗口中集成。总谱窗口实现对舞台上的每个角色进行动画制作和同步设置,并精确控制画面过渡、双声道、调色板以及播放速度等。 • 总谱窗口共有48个动画通道,在任意时刻可同时对舞台上多达48个角色分别作独立的控制。
2. Director • 在Director系统中内嵌了一个面向对象的脚本描述语言 Lingo语言,用于在Director作品中加入交互性及许多复杂控制。