基于凌阳单片机的电视机声控选台系统设计与实现

时间：2011-04-24 作者：秩名

论文导读：由于两个送话器相对于电视机和其它噪声源位置基本一样远，可以近似认为通过二者输入的干是一样的。语音命令识别单元采用凌阳公司的SPCE061A单片机，这是一种语音识别系统级芯片，实际上是一个DSP+MCU，并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统，拥有强大的语音数据处理能力并具有良好的接口功能。
关键词：凌阳单片机，电视机，语音识别，声控选台

1 、引言

随着科技的发展和社会文化事业的进步，电视机可供观众选择的频道数目日益增多。但是传统的电视遥控方法需要观众记忆每个电视台对应的频道序号，否则就无法快捷地将频道切换到所需位置。这显然给用户带来了很大的不方便。本文利用凌阳科技有限公司专门为语音处理而设计研制出的16位单片机SPCE061A设计了一个彩电智能声控选台系统。该系统无需对电视机做任何改动。在保留原有遥控功能的基础上，实现语音控制选台，较好地解决了记忆频道这个难题。

2 、系统总体方案设计

系统总体方案如图1所示。

　　图1　系统总体方案

3、各功能模块设计

3.1 语音命令提取单元

语音命令提取单元（如图2所示）在电视话音和其它噪音背景下，完成提取出操作者语音命令功能，其示意图如图3所示。

　　图2　语音命令提取单元

MIC选用驻极体送话器，它具有结构简单、重量、体积小、频率响应宽、保真度好等优点，但灵敏度低，必须再加放大器才行。由于输出阻抗可高达 10 　　　　　　数量级，所以必须进行阻抗变换后才能与放大配合使用。放大器采用差分放大电路，一个驻极体话器面对送话者，其输出接放大器正向输入端；另个驻极体送话器背对送话者，其输出接放大器负向入端。由于两个送话器相对于电视机和其它噪声源位置基本一样远，可以近似认为通过二者输入的干是一样的。但考虑到送话器具有方向性，前者送入的操作者语音命令远远大于后者，适当选择各电阻值可以抵消掉各种干扰。论文参考网。

3.2 语音命令识别单元

语音命令识别单元采用凌阳公司的SPCE061A单片机，这是一种语音识别系统级芯片，实际上是一个DSP+MCU，并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统，拥有强大的语音数据处理能力并具有良好的接口功能。

语音识别控制系统结构图3所示

　　图3　语音识别控制系统结构图

3.3 语音识别算法

消费类电子产品中的语音识别主要为孤立词识别，它有两种实现方案：一种是基于隐含马尔科夫统计模型（HMM）框架的非特定人识别；另一种是基于动态规划（DP）原理的特定人识别。它们在应用上各有优缺点。DP特定人识别的优点是方法简单，对硬件资源要求较低；此外，这一方法中的训练过程也很简单，不需预先采集过多的样本，不仅降低了前期成本，而且可以根据用户习惯，由用户任意定义控制项目的具体命令语句，因而适合大多数家电遥控器的应用。

3.3.1 端点检测方法

影响孤立词识别性能的一个重要因素是端点检测准确性。在10个英语数字的识别测试中，60毫秒的端点误差就使识别率下降2%。对于面向消费类应用的语音识别芯片系统，各种干扰因素更加复杂，使精确检测端点问题更加困难。为此，李虎生等在参考文献5中提出了称为FRED(Frame-based Real-time EndpointDetection)算法的两级端点检测方案，提高端点检测的精度。第一级对输入语音信号，根据其能量和过零率的变化，进行一次简单的实时端点检测，以便去掉静音得到输入语音的时域范围，并且在此基础上进行频谱特征提取工作。第二级根据输入语音频谱的FFT分析结果，分别计算出高频、中频和低频段的能量分布特性，用来判别轻辅音、浊辅音和元音；在确定了元音、浊音段后，再向前后两端扩展搜索包含语音端点的帧。FRED端点检测算法根据语音的本质特征进行端点检测，可以更好地适应环境的干扰和变化，提高端点检测的精度。

3.3.2 模板匹配算法

DTW是典型的DP特定人算法，为了克服自然语速的差异，用动态时间规整方法将模板特征序列和语音特征序列进行匹配，比较两者之间的失真，得出识别判决的依据。

为了提高DTW识别算法的识别性能和模板的稳健性，采用了双模板策略，第一次输入的训练词条存储为第一个模板，第二次输入的相同训练词条存储为第二个模板，希望每个词条通过两个较稳健的模板来保持较高的识别性能。

综上所述，本语音识别系统采用了改进端点检测性能的FRED算法，12阶Mel频标倒谱参数（MFCC）作为特征参数，使用双模板训练识别策略。通过一系列测试，证明该系统对特定人的识别达到了很好的识别效果。

3.4 控制面板

为了能输入字段号，以便建立语音样本，SPCE061A单片机扩展了一个行列矩阵式非编码键盘。键盘共有12个按键，其中十个定义为：0～9 数字键，一个定义为：语音样本建立键（TRN），一个定义为：语音样本清除键（CLR ）。由于控制面板只在建立语音样本时使用，为防止误操作，应将这12个按键用塑料外壳封闭起来。论文参考网。

3.5 操作指示电路

采用两片数码管和译码驱动电路CC4558组成操作指示电路。在本系统中，操作指示电路的作用是：建立语音命令样本时，用于显示存入的字段号；语音命令识别时用于显示识别结果及芯片识别结果的处理报告。

3.6 逻辑控制电路

整个逻辑控制电路如图4 所示。SPCE061A单片机通过并行接口输出识别结果，经过逻辑控制电路进行必要的译码后，用来控制后面的红外发射装置。

　　图4　逻辑控制电路如图4

3.7 遥控发射电路

红外遥控发射器主要由三大部分组成：一是键盘矩阵，二是发射专用集成电路，三是放大驱动和红外线发射部分。该电路与电视机的特定型号有关，可以根据电视机品牌选用适当的专用红外发射电路。论文参考网。需要说明的是：由于不同品牌电视机的红外发射、接收电路各不相同，因此它只对兼容电视有效。

4、结束语

该系统不对彩电做任何改动。在保留原有遥控功能的基础上，实现语音控制选台，主要功能有：

开关电视：电视接通电源处于待命状态，操作者发出“开机”命令，则打开电视机；操作者发出“关机”命令，则关掉电视机。

选台功能：操作者想看某某电视台的节目，只要发出“某某台”的命令，电视机就自动跳转到该台。

识别主人功能：为防止误操作，该系统只对事先录入命令样本的操作者语音敏感，其他人发出的命令包括电视伴音均无效。

其它功能：具有电视音量、画面亮度调节等适合语音控制的功能。

由于采用了高性价比的SPCE061A这种语音识别系统级芯片，并设计了科学的算法，本系统可靠性高，价格低廉，使用方便，具有较好的市场前景。

参考文献
[1] 赵力．语音信号处理[M] ．北京: 机械工业出版社，2003
[2] 李晶皎．嵌入式语音技术及凌阳l6位单片机应用[M]．北京：北京航空航天大学出版社，2003
[3] 李虎生等. 高性能汉语数码语音识别算法[J] ．北京：清华大学学报（自然科学版），2000；40：( 1)
[4] 孙景琪. 遥控彩色电视机集成电路及应用[M]．北京：人民邮电出版社，1995
[5] 胡延平等. 电视机智能声控选台系统设计与实现[J] ．通讯与电视，2001( 1)
[6] 周季华等. 语音识别在家电遥控器中的应用 [J] ．计算机应用，2002( 8)

查看相关论文专题：

	加入收藏打印本文
上一篇论文：基于快速跳频OFDM的UWB系统研究(图文)
下一篇论文：基于语音类应用的识别与跟踪系统(图文)

科技论文分类

相关计算机论文

最新计算机论文

读者推荐的计算机论文