关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网

时间：2015-03-30 作者：方攀

论文摘要：项目反应理论（Item Response Theory）是一种现在心理测量理论，它是对经典测量理论的补充发展，伴随着计算机发展而被应用于考试题库的建设，测验的编制，项目分析等各个方面，本文将详细介绍IRT在国内外计算机自适应考试（Computerized Adaptive Testing）中的应用，分析它们的异同。
论文关键词：项目反应理论,计算机自适应考试

1.引言

项目反应理论（IRT）又称“潜在特质”理论，于20世纪50年代初正式成立，于20世纪60年代后期，伴随着计算机的发展而快速发展。IRT较经典测量理论来讲，样本独立，可反复测量，又因为理论框架科学，应用范围广泛，是我国测量领域的热点。计算机自适应测量（CAT）是在项目反应理论基础上发展起来的一种新的测验形式。它不同于纸币测验，是以计算机为手段，测验试题的呈现和被试的作答是通过计算机完成，它又不同于一般计算机化测量，而是因人而异选题，根据被试能力水平自动选择试题，及时了解被试能力水平。

2.国内应用研究综述

我国著名心理学家张厚粲老师是自适应考试的先驱，她首先把IRT引入国内。江西师大“题库理论”组，编写《考生智能水平的自适应测验》时指出：自适应考试可以在不损害测验的信效度前提下，减少试题题量，缩短测验，提高测验效率。国内最早关于编制自适应测验的文献是出自江西师大。他们编制的高中数学水平测验，用于考察高中毕业生的数学智能水平。江西师大这个课题组还编制了参数估计程序和自适应考试程序。

在计算机适应测验选题策略上，2011毛秀珍，辛涛撰文做了全面探讨，选题策略是CAT重要组成部分，关系到策略信效度，效率等。有人在Science发表文章主张谨慎CAT高风险，原因是频繁使用质量较好的项目，会因为被试“分享”而削弱了测验的效率，针对传统的选题策略不足，2012罗芬、丁树良、王晓庆提出了利用区间估计思想，将两级评分推广到多级评分以改进最大信息量选题策略，可以有效降低测验长度，极大降低项目曝光率。制定高效并且安全的选题策略是CAT追求的目标，2011程小扬、丁树良、严深海、朱隆尹针对极大项信息量准则（MIC）和a分层法选题策略的优缺点，对0-1评分下的CAT引入曝光因子的选题策略。

在我国自适应测试的计算机软件还是比较少，九十年代开始，全国英语四六级考试委员会，一直致力于项目反应理论的研究与开发。目前IRT已成功应用于CET分数等值处理过程了，基于计算机自适应测试题库也在建设和完善中。

3.国外研究

国外对于计算机自适应考试研究较早，计算机自适应测验是从比奈的智力测验基础上发展起来的。1971年，Lord在前人基础上提出了“计算机自适应测验”。美国军方在80年代开始应用计算机自适应系统CAST(TheComputerizedAdaptiveScreenTest）。如今在美国，CAT己经用于教育测试、职业测量、人事评测等领域：GRE(GraduateRecordExamination)考试、TOFEL测试、工商管理类研究生入学测试GMAT(GraduateforManagementandAdministrationTest)以及全美护士国家委员会资格测试(NurseNationalCommitteeLicenseTest)等都己经采用了CAT测试方式。日本的职称英语测试系统CASEC是普遍使用的系统，遍布于各大公司，教育部门和政府机构。通常CASEC测试题目不足30个，就能让测试的结果达到90%以上，提高了测试的准确率，也节约了测试时间。在欧美许多国家，CAT已成为教育测试职业测试和认证测试的主要形式。微软的MCSE(微软认证系统工程师)测试也采用了这一种形式。

总体来说，计算机自适应考试系统，在美国起步早，发展快，国外部分权威资格认证考试都逐步采用计算机自适应考试。

4.研究总结与展望

CAT相对传统的纸笔测验，可以施测较少项目就准确测量被试特质，极大提高测验效率。目前国内较多研究集中于CAT的选题策略上，由于测验的精度和安全性相互制约，如何比较，选择最优项目，有待于进一步研究。未来研究应进一步提高选题策略的综合表现、深入探讨多级评分项目和认知诊断。

我国引进国外IRT先进理论，坚持独立创新，应用发展较快，但由于受IRT理论模型的局限性和我国传统测试方式、教育模式等因素的影响，基于IRT理论模型的自适应测试在我国实际教学的应用仍处于探索阶段，如何克服IRT理论模型的局限性，并结合教学的实际情况，设计出一种具有较好性能和实际可操作性的自适应测试方法。也有待于进一步努力。

参考文献
1 罗芬,丁树良,王晓庆,多级评分计算机化自适应测验动态综合选题策略,心理学报.2012
2 毛秀珍,辛涛,计算机自适应测验选题策略述评,心理科学进展.2011年
3 程小扬,丁树良,严深海,朱隆尹,引入曝光因子的计算机化自适应测验选题策略,心理学报.2011
4 唐小娟,丁树良,俞宗火,计算机自适应测验在认知诊断中的应用,心理科学进展.2012
5 林健,闰华,武兵,计算机自适应考试理论分析.太原理工大学学报,2004,35(2):222一223
6 曾彦钧, 张雅媛, 郭伯臣.基于知识结构之适性诊断测验系统的防猜选题策略.测验统计年刊.2006
7 Thompson, N. A. A practitioner's guide for variable-length computerized classification testing. Practical Assessment,Research & Evaluation.2007
8 Jason A.Collins,Jim E.Greer,and Sherman X.Huang. Adaptive Assessment using Granularity Hierarchies and BayesianNets[J].Proc.Intelligent Tutoring Systems ITS.96. Berlin: Springer, 1996

查看相关论文专题：

	加入收藏打印本文
上一篇论文：DSA加密算法中素数选取的优化设计_密钥-论文网
下一篇论文：RAID0请求性能的模拟评估_磁盘阵列-论文网

科技论文分类

相关计算机论文

无相关信息

最新计算机论文

读者推荐的计算机论文