欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网

时间:2015-03-30  作者:方攀

论文摘要:项目反应理论(Item Response Theory)是一种现在心理测量理论,它是对经典测量理论的补充发展,伴随着计算机发展而被应用于考试题库的建设,测验的编制,项目分析等各个方面,本文将详细介绍IRT在国内外计算机自适应考试(Computerized Adaptive Testing)中的应用,分析它们的异同。
论文关键词:项目反应理论,计算机自适应考试

1.引言

项目反应理论(IRT)又称“潜在特质”理论,于20世纪50年代初正式成立,于20世纪60年代后期,伴随着计算机的发展而快速发展。IRT较经典测量理论来讲,样本独立,可反复测量,又因为理论框架科学,应用范围广泛,是我国测量领域的热点。计算机自适应测量(CAT)是在项目反应理论基础上发展起来的一种新的测验形式。它不同于纸币测验,是以计算机为手段,测验试题的呈现和被试的作答是通过计算机完成,它又不同于一般计算机化测量,而是因人而异选题,根据被试能力水平自动选择试题,及时了解被试能力水平。

2.国内应用研究综述

我国著名心理学家张厚粲老师是自适应考试的先驱,她首先把IRT引入国内。江西师大“题库理论”组,编写《考生智能水平的自适应测验》时指出:自适应考试可以在不损害测验的信效度前提下,减少试题题量,缩短测验,提高测验效率。国内最早关于编制自适应测验的文献是出自江西师大。他们编制的高中数学水平测验,用于考察高中毕业生的数学智能水平。江西师大这个课题组还编制了参数估计程序和自适应考试程序。

在计算机适应测验选题策略上,2011毛秀珍,辛涛撰文做了全面探讨,选题策略是CAT重要组成部分,关系到策略信效度,效率等。有人在Science发表文章主张谨慎CAT高风险,原因是频繁使用质量较好的项目,会因为被试“分享”而削弱了测验的效率,针对传统的选题策略不足,2012罗芬、丁树良、王晓庆提出了利用区间估计思想,将两级评分推广到多级评分以改进最大信息量选题策略,可以有效降低测验长度,极大降低项目曝光率。制定高效并且安全的选题策略是CAT追求的目标,2011程小扬、丁树良、严深海、朱隆尹针对极大项信息量准则(MIC)和a分层法选题策略的优缺点,对0-1评分下的CAT引入曝光因子的选题策略。

在我国自适应测试的计算机软件还是比较少,九十年代开始,全国英语四六级考试委员会,一直致力于项目反应理论的研究与开发。目前IRT已成功应用于CET分数等值处理过程了,基于计算机自适应测试题库也在建设和完善中。

3.国外研究

国外对于计算机自适应考试研究较早,计算机自适应测验是从比奈的智力测验基础上发展起来的。1971年,Lord在前人基础上提出了“计算机自适应测验”。美国军方在80年代开始应用计算机自适应系统CAST(TheComputerizedAdaptiveScreenTest)。如今在美国,CAT己经用于教育测试、职业测量、人事评测等领域:GRE(GraduateRecordExamination)考试、TOFEL测试、工商管理类研究生入学测试GMAT(GraduateforManagementandAdministrationTest)以及全美护士国家委员会资格测试(NurseNationalCommitteeLicenseTest)等都己经采用了CAT测试方式。日本的职称英语测试系统CASEC是普遍使用的系统,遍布于各大公司,教育部门和政府机构。通常CASEC测试题目不足30个,就能让测试的结果达到90%以上,提高了测试的准确率,也节约了测试时间。在欧美许多国家,CAT已成为教育测试职业测试和认证测试的主要形式。微软的MCSE(微软认证系统工程师)测试也采用了这一种形式。

总体来说,计算机自适应考试系统,在美国起步早,发展快,国外部分权威资格认证考试都逐步采用计算机自适应考试。

4.研究总结与展望

CAT相对传统的纸笔测验,可以施测较少项目就准确测量被试特质,极大提高测验效率。目前国内较多研究集中于CAT的选题策略上,由于测验的精度和安全性相互制约,如何比较,选择最优项目,有待于进一步研究。未来研究应进一步提高选题策略的综合表现、深入探讨多级评分项目和认知诊断。

我国引进国外IRT先进理论,坚持独立创新,应用发展较快,但由于受IRT理论模型的局限性和我国传统测试方式、教育模式等因素的影响,基于IRT理论模型的自适应测试在我国实际教学的应用仍处于探索阶段,如何克服IRT理论模型的局限性,并结合教学的实际情况,设计出一种具有较好性能和实际可操作性的自适应测试方法。也有待于进一步努力。

参考文献
1 罗芬,丁树良,王晓庆,多级评分计算机化自适应测验动态综合选题策略,心理学报.2012
2 毛秀珍,辛涛,计算机自适应测验选题策略述评,心理科学进展.2011年
3 程小扬,丁树良,严深海,朱隆尹,引入曝光因子的计算机化自适应测验选题策略,心理学报.2011
4 唐小娟,丁树良,俞宗火,计算机自适应测验在认知诊断中的应用,心理科学进展.2012
5 林健,闰华,武兵,计算机自适应考试理论分析.太原理工大学学报,2004,35(2):222一223
6 曾彦钧, 张雅媛, 郭伯臣.基于知识结构之适性诊断测验系统的防猜选题策略.测验统计年刊.2006
7 Thompson, N. A. A practitioner's guide for variable-length computerized classification testing. Practical Assessment,Research & Evaluation.2007
8 Jason A.Collins,Jim E.Greer,and Sherman X.Huang. Adaptive Assessment using Granularity Hierarchies and BayesianNets[J].Proc.Intelligent Tutoring Systems ITS.96. Berlin: Springer, 1996

查看相关论文专题
加入收藏  打印本文
上一篇论文:DSA加密算法中素数选取的优化设计_密钥-论文网
下一篇论文:RAID0请求性能的模拟评估_磁盘阵列-论文网
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
    无相关信息
最新计算机论文
读者推荐的计算机论文