欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

基于凌阳单片机的电视机声控选台系统设计与实现

时间:2011-04-24  作者:秩名

论文导读:由于两个送话器相对于电视机和其它噪声源位置基本一样远,可以近似认为通过二者输入的干是一样的。语音命令识别单元采用凌阳公司的SPCE061A单片机,这是一种语音识别系统级芯片,实际上是一个DSP+MCU,并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统,拥有强大的语音数据处理能力并具有良好的接口功能。
关键词:凌阳单片机,电视机,语音识别,声控选台

 

1 、引言

随着科技的发展和社会文化事业的进步,电视机可供观众选择的频道数目日益增多。但是传统的电视遥控方法需要观众记忆每个电视台对应的频道序号,否则就无法快捷地将频道切换到所需位置。这显然给用户带来了很大的不方便。本文利用凌阳科技有限公司专门为语音处理而设计研制出的16位单片机SPCE061A设计了一个彩电智能声控选台系统。该系统无需对电视机做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,较好地解决了记忆频道这个难题。

2 、系统总体方案设计

系统总体方案如图1所示。

  图1 系统总体方案

3、各功能模块设计

3.1 语音命令提取单元

语音命令提取单元(如图2所示)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。

  图2 语音命令提取单元

MIC选用驻极体送话器, 它具有结构简单、重量、体积小、频率响应宽、保真度好等优点,但灵敏度低, 必须再加放大器才行。由于输出阻抗可高达 10         数量级,所以必须进行阻抗变换后才能与放大配合使用。放大器采用差分放大电路,一个驻极体话器面对送话者, 其输出接放大器正向输入端;另个驻极体送话器背对送话者,其输出接放大器负向入端。由于两个送话器相对于电视机和其它噪声源位置基本一样远,可以近似认为通过二者输入的干是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。论文参考网。

3.2 语音命令识别单元

语音命令识别单元采用凌阳公司的SPCE061A单片机,这是一种语音识别系统级芯片,实际上是一个DSP+MCU,并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统,拥有强大的语音数据处理能力并具有良好的接口功能。

语音识别控制系统结构图3所示

  图3 语音识别控制系统结构图

3.3 语音识别算法

消费类电子产品中的语音识别主要为孤立词识别,它有两种实现方案:一种是基于隐含马尔科夫统计模型(HMM)框架的非特定人识别;另一种是基于动态规划(DP)原理的特定人识别。它们在应用上各有优缺点。DP特定人识别的优点是方法简单,对硬件资源要求较低;此外,这一方法中的训练过程也很简单,不需预先采集过多的样本,不仅降低了前期成本,而且可以根据用户习惯,由用户任意定义控制项目的具体命令语句,因而适合大多数家电遥控器的应用。

3.3.1 端点检测方法

影响孤立词识别性能的一个重要因素是端点检测准确性。在10个英语数字的识别测试中,60毫秒的端点误差就使识别率下降2%。对于面向消费类应用的语音识别芯片系统,各种干扰因素更加复杂,使精确检测端点问题更加困难。为此,李虎生等在参考文献5中提出了称为FRED(Frame-based Real-time EndpointDetection)算法的两级端点检测方案,提高端点检测的精度。第一级对输入语音信号,根据其能量和过零率的变化,进行一次简单的实时端点检测,以便去掉静音得到输入语音的时域范围,并且在此基础上进行频谱特征提取工作。第二级根据输入语音频谱的FFT分析结果,分别计算出高频、中频和低频段的能量分布特性,用来判别轻辅音、浊辅音和元音;在确定了元音、浊音段后,再向前后两端扩展搜索包含语音端点的帧。FRED端点检测算法根据语音的本质特征进行端点检测,可以更好地适应环境的干扰和变化,提高端点检测的精度。

3.3.2 模板匹配算法

DTW是典型的DP特定人算法, 为了克服自然语速的差异,用动态时间规整方法将模板特征序列和语音特征序列进行匹配,比较两者之间的失真,得出识别判决的依据。

为了提高DTW识别算法的识别性能和模板的稳健性,采用了双模板策略,第一次输入的训练词条存储为第一个模板,第二次输入的相同训练词条存储为第二个模板,希望每个词条通过两个较稳健的模板来保持较高的识别性能。

综上所述,本语音识别系统采用了改进端点检测性能的FRED算法,12阶Mel频标倒谱参数(MFCC)作为特征参数,使用双模板训练识别策略。通过一系列测试,证明该系统对特定人的识别达到了很好的识别效果。

3.4 控制面板

为了能输入字段号, 以便建立语音样本,SPCE061A单片机扩展了一个行列矩阵式非编码键盘。键盘共有12个按键, 其中十个定义为:0~9 数字键,一个定义为:语音样本建立键(TRN),一个定义为:语音样本清除键(CLR )。由于控制面板只在建立语音样本时使用,为防止误操作,应将这12个按键用塑料外壳封闭起来。论文参考网。

3.5 操作指示电路

采用两片数码管和译码驱动电路CC4558组成操作指示电路。在本系统中,操作指示电路的作用是:建立语音命令样本时,用于显示存入的字段号;语音命令识别时用于显示识别结果及芯片识别结果的处理报告。

3.6 逻辑控制电路

整个逻辑控制电路如图4 所示。SPCE061A单片机通过并行接口输出识别结果,经过逻辑控制电路进行必要的译码后,用来控制后面的红外发射装置。

  图4 逻辑控制电路如图4

3.7 遥控发射电路

红外遥控发射器主要由三大部分组成:一是键盘矩阵,二是发射专用集成电路,三是放大驱动和红外线发射部分。该电路与电视机的特定型号有关,可以根据电视机品牌选用适当的专用红外发射电路。论文参考网。需要说明的是:由于不同品牌电视机的红外发射、接收电路各不相同,因此它只对兼容电视有效。

4、结束语

该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有:

开关电视:电视接通电源处于待命状态,操作者发出“开机”命令,则打开电视机;操作者发出“关机”命令,则关掉电视机。

选台功能:操作者想看某某电视台的节目,只要发出“某某台”的命令,电视机就自动跳转到该台。

识别主人功能:为防止误操作,该系统只对事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。

其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。

由于采用了高性价比的SPCE061A这种语音识别系统级芯片,并设计了科学的算法,本系统可靠性高,价格低廉,使用方便,具有较好的市场前景。


参考文献
[1] 赵力.语音信号处理[M] .北京: 机械工业出版社,2003
[2] 李晶皎.嵌入式语音技术及凌阳l6位单片机应用[M].北京:北京航空航天大学出版社,2003
[3] 李虎生等. 高性能汉语数码语音识别算法[J] .北京:清华大学学报( 自然科学版),2000;40:( 1)
[4] 孙景琪. 遥控彩色电视机集成电路及应用[M].北京:人民邮电出版社,1995
[5] 胡延平等. 电视机智能声控选台系统设计与实现[J] .通讯与电视,2001( 1)
[6] 周季华等. 语音识别在家电遥控器中的应用 [J] .计算机应用,2002( 8)
 

 

查看相关论文专题
加入收藏  打印本文
上一篇论文:基于快速跳频OFDM的UWB系统研究(图文)
下一篇论文:基于语音类应用的识别与跟踪系统(图文)
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
最新计算机论文
读者推荐的计算机论文