欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

音频与图像转化的研究_硬性改写-论文网

时间:2013-11-30  作者:佚名
联系到上面所说的倍率关系,音频所转化成的图像文件将会非常庞大。可以归纳为,时间坐标轴转化为空间坐标轴时,两点间距离会展宽;空间坐标轴转化为时间坐标轴时,两点间的距离会缩短。

另一个使得这种转化变得可能的条件,是随着计算机的发展,各类信息都最终归为二进制码元。这种二进制码元,即图像与音频在计算机中存储处理的格式的共同点,成为了我们实行这种转化的天然桥梁。不同格式的文件在计算机中都是以二进制数的形式存储的,只有当通过不同的播放软件,经过不同的解码,才可以显示出不同之处。其中播放软件通过对文件头的识别来区分文件的格式。所以即使数据原本表示的信息不一样,但是对于计算机而言它都是0和1两种符号而已。

2.2问题的分析

基于上述分析思路,我们首先对各类音频格式和图形格式进行研究,确定我们在物理世界中所熟悉的图像或者音频,在计算机内部用二进制码表示时的具体细节。

计算机多媒体技术在近些年得到了长足的进步,各类适用于不同场合、满足不同要求的多媒体格式层出不穷。我们对此进行筛选,从最基本的格式入手,通过了解其编码及存储的具体方式,找到实现转化的具体方法。经过筛选,我们将研究对象确定为图像格式中的BMP、JPEG、以及在网络及各类商业LOGO中较为常用的矢量型图形SVG,音频格式中的WAV、MP3、以及在电子音乐制作中大名鼎鼎的MIDI。

2.2.1BMP与WAV

对这六种格式进行研究后,我们发现BMP与WAV之间存在很多相似关系。

BMP的存储机制十分简单。首先,文件头标志出其文件属性为BMP,同时包含其他基本信息,比如文件的大小,文件头大小,位图的宽度和高度,每个像素点中颜色的位数,分辨率,有无压缩等。文件头结束后它便按从左下角到右上角的顺序,将整幅图像中每个像素点的R\G\B三种色彩值以像素矩阵的形式进行记录,成为数据块。

WAV格式中包括三个到四个Chunk。首先是文件头信息。文件头标志该文件属性为WAV,并包含其他基本信息如采样率,声道数目,每个采样所需要的bit数,数据块对应关系等。最后一个Chunk用来保存wav数据。具体存储时,根据文件头所规定的声道数和采样频率,将每次采样时各声道的声音进行不同精密程度的量化,并以二进制码的形式记录下来。

综合以上可以看到,除了文件头必须标志出本格式的种种特征以外,BMP和WAV格式在具体数据的存储上是相似的。BMP把图像文件划分为一个个像素,将像素的中心颜色加以记录;WAV把音频文件划分为一个个采样点,将各个采样点对应的声音波形加以记录。

因此我们将WAV和BMP称为第一类似对。它们都将文件划分为基本元素,然后进行取样并记录取样值。应用的优点在于可以表现完整丰富的效果,缺点在于文件往往过大,且不易对其进行编辑改变。

2.2.2SVG和MIDI

同样的类似关系也存在于SVG格式和MIDI格式之间。

SVG格式属于矢量图形。前面所说的BMP属于位图格式。位图格式的特点是将整幅画面分割成像素分别存储。这种存储方式有利于表现颜色多样且色彩结构丰富的图像。缺点在于文件往往较大,只适合表现静态图像,不适应网页快速打开或者刷新的要求。而且位图文件在放大到一定程度后,画面的边缘会出现锯齿,也就是“马赛克”。这是因为放大的原理是将原来的像素点上的各颜色值通过例如求均值一类的算法,填充出新增的像素点。这个缺点也制约了它在LOGO上的应用。

矢量图形的存储机制与位图完全不同。它存储的基本单位不是像素点,而是一个图形,或者说是一个事件。比如一个SVG文件中有一条线段,记录时就只记录这条线段的两个端点,线的粗细颜色等特征。一个圆就记录这个圆的圆心坐标和半径长度等。矢量图像的优点是文件小,而且对图像进行放大缩小不影响图像质量,因此在网页和LOGO上得到大量应用。但是矢量图像对颜色的处理非常粗糙,它只能将某个边缘明确的区域填充一种纯色。因此它无法表现丰富复杂的颜色效果。

音频格式MIDI的特点是,它存储的不是声音符号,而是一个事件,包括音符、控制参数等指令。它通过指令控制MIDI设备工作,从而产生不同的声音效果。比如一个MIDI格式文件中有一个音符,它不会像WAV一样记录声音的波形,而是记录这个音符的开始发音时间,结束发音时间,发声通道,音色,音高,音量等信息。在播放时,它将每个音符视为一个事件,在适当的时候控制MIDI设备开始发声,结束发声,并指示MIDI设备按照音色表发出这个音符的音色,这样这个音符就从扬声器中发出。

由此可以看出MIDI和SVG的相似之处。二者将物理实体(图形或者音符)抽象化为事件,只存储事件特征。文件打开的时候,只需要将事件的各个特征取出,进行判决再生的工作,重构事件,就可以还原整个文件。这种以事件进行的存储非常利于控制。

所以,我们将MIDI和适量图形称为第二类似对。

查看相关论文专题
加入收藏  打印本文
上一篇论文:基于专利分析透视有机发光显示器OLED的发展前景_德温特-论文网
下一篇论文:用专业级的音频处理软件Audition打造个人专辑-论文网
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
    无相关信息
最新计算机论文
读者推荐的计算机论文