论文导读:由于两个送话器相对于电视机和其它噪声源位置基本一样远,可以近似认为通过二者输入的干是一样的。语音命令识别单元采用凌阳公司的SPCE061A单片机,这是一种语音识别系统级芯片,实际上是一个DSP+MCU,并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统,拥有强大的语音数据处理能力并具有良好的接口功能。
关键词:凌阳单片机,电视机,语音识别,声控选台
1 、引言
随着科技的发展和社会文化事业的进步,电视机可供观众选择的频道数目日益增多。但是传统的电视遥控方法需要观众记忆每个电视台对应的频道序号,否则就无法快捷地将频道切换到所需位置。这显然给用户带来了很大的不方便。本文利用凌阳科技有限公司专门为语音处理而设计研制出的16位单片机SPCE061A设计了一个彩电智能声控选台系统。该系统无需对电视机做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,较好地解决了记忆频道这个难题。
2 、系统总体方案设计
系统总体方案如图1所示。
图1 系统总体方案
3、各功能模块设计
3.1 语音命令提取单元
语音命令提取单元(如图2所示)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。
图2 语音命令提取单元
MIC选用驻极体送话器, 它具有结构简单、重量、体积小、频率响应宽、保真度好等优点,但灵敏度低, 必须再加放大器才行。由于输出阻抗可高达 10 数量级,所以必须进行阻抗变换后才能与放大配合使用。放大器采用差分放大电路,一个驻极体话器面对送话者, 其输出接放大器正向输入端;另个驻极体送话器背对送话者,其输出接放大器负向入端。由于两个送话器相对于电视机和其它噪声源位置基本一样远,可以近似认为通过二者输入的干是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。论文参考网。
3.2 语音命令识别单元
语音命令识别单元采用凌阳公司的SPCE061A单片机,这是一种语音识别系统级芯片,实际上是一个DSP+MCU,并将A/D、D/A、RAM、ROM以及预放、功放等电路集成在一个芯片上的系统,拥有强大的语音数据处理能力并具有良好的接口功能。
语音识别控制系统结构图3所示
图3 语音识别控制系统结构图
3.3 语音识别算法
消费类电子产品中的语音识别主要为孤立词识别,它有两种实现方案:一种是基于隐含马尔科夫统计模型(HMM)框架的非特定人识别;另一种是基于动态规划(DP)原理的特定人识别。它们在应用上各有优缺点。DP特定人识别的优点是方法简单,对硬件资源要求较低;此外,这一方法中的训练过程也很简单,不需预先采集过多的样本,不仅降低了前期成本,而且可以根据用户习惯,由用户任意定义控制项目的具体命令语句,因而适合大多数家电遥控器的应用。
3.3.1 端点检测方法
影响孤立词识别性能的一个重要因素是端点检测准确性。在10个英语数字的识别测试中,60毫秒的端点误差就使识别率下降2%。对于面向消费类应用的语音识别芯片系统,各种干扰因素更加复杂,使精确检测端点问题更加困难。为此,李虎生等在参考文献5中提出了称为FRED(Frame-based Real-time EndpointDetection)算法的两级端点检测方案,提高端点检测的精度。第一级对输入语音信号,根据其能量和过零率的变化,进行一次简单的实时端点检测,以便去掉静音得到输入语音的时域范围,并且在此基础上进行频谱特征提取工作。第二级根据输入语音频谱的FFT分析结果,分别计算出高频、中频和低频段的能量分布特性,用来判别轻辅音、浊辅音和元音;在确定了元音、浊音段后,再向前后两端扩展搜索包含语音端点的帧。FRED端点检测算法根据语音的本质特征进行端点检测,可以更好地适应环境的干扰和变化,提高端点检测的精度。
3.3.2 模板匹配算法
DTW是典型的DP特定人算法, 为了克服自然语速的差异,用动态时间规整方法将模板特征序列和语音特征序列进行匹配,比较两者之间的失真,得出识别判决的依据。
为了提高DTW识别算法的识别性能和模板的稳健性,采用了双模板策略,第一次输入的训练词条存储为第一个模板,第二次输入的相同训练词条存储为第二个模板,希望每个词条通过两个较稳健的模板来保持较高的识别性能。
综上所述,本语音识别系统采用了改进端点检测性能的FRED算法,12阶Mel频标倒谱参数(MFCC)作为特征参数,使用双模板训练识别策略。通过一系列测试,证明该系统对特定人的识别达到了很好的识别效果。
3.4 控制面板
为了能输入字段号, 以便建立语音样本,SPCE061A单片机扩展了一个行列矩阵式非编码键盘。键盘共有12个按键, 其中十个定义为:0~9 数字键,一个定义为:语音样本建立键(TRN),一个定义为:语音样本清除键(CLR )。由于控制面板只在建立语音样本时使用,为防止误操作,应将这12个按键用塑料外壳封闭起来。论文参考网。
3.5 操作指示电路
采用两片数码管和译码驱动电路CC4558组成操作指示电路。在本系统中,操作指示电路的作用是:建立语音命令样本时,用于显示存入的字段号;语音命令识别时用于显示识别结果及芯片识别结果的处理报告。
3.6 逻辑控制电路
整个逻辑控制电路如图4 所示。SPCE061A单片机通过并行接口输出识别结果,经过逻辑控制电路进行必要的译码后,用来控制后面的红外发射装置。
图4 逻辑控制电路如图4
3.7 遥控发射电路
红外遥控发射器主要由三大部分组成:一是键盘矩阵,二是发射专用集成电路,三是放大驱动和红外线发射部分。该电路与电视机的特定型号有关,可以根据电视机品牌选用适当的专用红外发射电路。论文参考网。需要说明的是:由于不同品牌电视机的红外发射、接收电路各不相同,因此它只对兼容电视有效。
4、结束语
该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有:
开关电视:电视接通电源处于待命状态,操作者发出“开机”命令,则打开电视机;操作者发出“关机”命令,则关掉电视机。
选台功能:操作者想看某某电视台的节目,只要发出“某某台”的命令,电视机就自动跳转到该台。
识别主人功能:为防止误操作,该系统只对事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。
其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。
由于采用了高性价比的SPCE061A这种语音识别系统级芯片,并设计了科学的算法,本系统可靠性高,价格低廉,使用方便,具有较好的市场前景。
参考文献
[1] 赵力.语音信号处理[M] .北京: 机械工业出版社,2003
[2] 李晶皎.嵌入式语音技术及凌阳l6位单片机应用[M].北京:北京航空航天大学出版社,2003
[3] 李虎生等. 高性能汉语数码语音识别算法[J] .北京:清华大学学报( 自然科学版),2000;40:( 1)
[4] 孙景琪. 遥控彩色电视机集成电路及应用[M].北京:人民邮电出版社,1995
[5] 胡延平等. 电视机智能声控选台系统设计与实现[J] .通讯与电视,2001( 1)
[6] 周季华等. 语音识别在家电遥控器中的应用 [J] .计算机应用,2002( 8)
|