欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 毕业论文 > 计算机毕业论文

“冲压模具设计”精品课智能答疑系统设计(图文)

时间:2011-04-24  作者:秩名
(1) 问题编号;

(2) 问题:对问题内容的自然语言描述 ;

(3) 知识单元:本系统对每一个问题都按知识单元进行划分,这里是问题的知识单元编号;

(4) 专业关键词:根据系统专业关键词库,得出问题中与专业相关的、必须含有的关键词;

(5) 一般关键词:问句中的非专业关键词;

(6) 答案:对问题的解答;

(7) 访问次数:系统自动记录该属性的值。初始时访问次数为0,以后每访问一次自动加1,体现了学生对这个问题的关注程度;

(8) 删除标记:系统对答疑知识库自动更新的时候,若该记录不常被访问而需要被删除,只需添加删除标记。

2 系统实现的关键技术

目前的答疑系统大部分还是以关键词查询,基于关键词的查询方式应用比较多,因为实现相对比较简单,但是系统的智能性不够,智能答疑要涉及到一些比较复杂的算法,比如:自然语言分析,专家系统,信息检索,数据挖掘等以及相关的关键技术,如:分词、词语权重的计算、语义的相似度计算等,下面简单介绍一下智能答疑部分的关键技术。

2.1 自然语言分析技术

一个答疑系统能否实现智能答疑,关键是看系统能否更好地理解自然语言,因为学生是用自然语言来提问题的,所以这就涉及到中文的自动分词、词语的权重和语义的相似度计算等技术。一般而言,中文的自动分词方法主要有3种算法:基于字符串匹配的方法、基于知识的分词方法和基于统计的分词方法。因为基于字符串匹配的方法不能识别新词,基于知识的分词方法不易于实现,网络教育系统中的领域知识有相对专业性较强的特点,采取的方案是基于统计的分词方法,依据字与字相邻共现的频率或概率能够较好地反映成词的可信度来进行分词。在分词以后需要对词语进行加权和语义的相似度计算。词语的权重反映了该词语对标识文本内容的贡献度。各个词语在不同文本中的出现频率满足一定的统计规律,因此可根据词语的频率特性来计算词语的权重。而对语义的相似度计算则需要一定的语义知识资源。

2.2 全文检索技术

全文搜索技术是一项被广泛采用的搜索技术。包括两个核心技术,一是如何建立和维护全文索引库,二是如何提供快速有效的全文检索机制。全文搜索技术最重要之处在于将原始文档中所有的基本元素的位置信息记录在索引库汉语中,可选择的基本元素可以是字,也可以是词。从而形成了两种索引库结构:基于字表的索引库和基于词表的索引库。字表法是将原始文档中每个字的位置信息记录在索引库中;而词表法则是以词为单位将其位置信息记录在索引库中。字表法和词表法各有自己的优缺点。词表法需要使用切分词典,因而适用于特定领域中内容相对固定文档的全文搜索。其优点是索引库比较小,检索速度快。缺点则是不能适应跨领域的文档处理要求,因为此时的词典将急剧膨胀,难以使用。另外歧义的消除也是比较大的问题。而字表法采用对每个字的出现位置进行统计,不需要任何词典,适用范围强。当然,采用字表法的检索精度没有采用词表法那么高。对于智能答疑系统来说,其答疑内容基本上 是针对某个学科或者专有领域的。因此,本文采取词表法来组织全文索引。在问题库中有Key words属性值中的词序列是关键词序列。将库中的关键词作为样本,在问题库的分词结果中进行匹配搜索,把相匹配的关键词作为问题库自己的关键词。索引库既要方便搜索,还要便于增加、删除和修改等维护工作的进行,因此,索引库的大小、组织形式显得非常重要。目前,考虑按照全文的章节组成一个个相对较短小的索引库。索引库是由关键词的各类词表构成的。其中,词表结构为Wordlist:(wordl,word2,word3,), Wordlist是答案材料经索引后形成的关键词序列。词表结构如表1所示:

表1词表结构Word

Wordid 词语编号
Wordid 词语文本
Wordid 词语的权值

2.3 基于聚类规则数据挖掘技术

聚类分析法是一种探索性的识别方法,它是在不知道应该为哪些模式类的情况下进行分类的。

聚类分析法是根据模式间的相似程度自动地进行分类的,聚类时的基本出发点是使类内模式问的相似度尽量大,而类间的相似度尽量小,类内的模式比不同类的模式更相似。根据聚类的特点,该系统通过对问题相似度的计算,对问题进得分类,构建分类数据库,以便扩大查询范围。

3 系统的实现

在前面分析的基础之上,系统采用当前比较流行的网络技术,在.NET下使用c群,ASP.NET,Web Service,对该系统的主要功能模块进行了编程实现,数据库采用SQL Server2000。在系统的重复编程工作,为了加快系统的速度和保证数据的一致性,也使实现过程中,对共有的功能使用了Web Service,从而减少用存储过程和触发器。

4 结语

智能答疑系统是网络课程的重要组成部分,要提高答疑系统的智能性,只有结合当前的先进技术,这样答疑的效率才能够得到提高。本文的创新之处在于能够结合自然语言分析技术、数据挖掘技术和全文检索等先进技术来设计系统,使系统的智能性得到真实的体现。

[1]柳泉波,黄荣怀,何克抗.智能答疑系统的设计与实现[J].中国远程教育,2000,(8):4348.

[2]刘挺,吴岩.王开铸.串频统计和词形匹配相结合的中文自动分词系统[J].中文信息学报,1998,12(1):17—25.

[3]石冰,郑燕峰.信息检索中的数据挖掘技术[ J ].情报学报,1999,18(增刊):11—13.

[4]徐彩娜,徐建良.基于语义的查询重新定义及其应用[J].微计算机信息,2006,(22):230-232.

[5]季永华,许华虎,沈敏,等.自动答疑系统的研究与实现[J].计算机工程与应用,2005(14):224-226.

[6]赵成龙,薛欣.基于Web的智能答疑系统的设计与实现[J].计算机工程与科学,2005,(8):3143 .

 

 

查看相关论文专题
加入收藏  打印本文
上一篇论文:抓住机遇,深化电信工程专业实验技术改革
下一篇论文:《数控车床编程与操作项目教程》多媒体课件开发与应用研究测试分析报告
毕业论文分类
行政管理毕业论文 工商管理毕业论文
护理毕业论文 会计毕业论文
会计专业毕业论文 英语专业毕业论文
大学毕业论文 硕士毕业论文
计算机毕业论文 市场营销毕业论文
物流管理毕业论文 法学毕业论文
相关计算机毕业论文
最新计算机毕业论文
读者推荐的计算机毕业论文