测验的效度、信度和精确性

测验的结果仅仅当它们有效度、可信度和精确方才有用。这些术语定义如下:

 1.效度。测验测量了它所想要测量的内容了吗?

    2.信度。测验一致地测量出相同或相近的得分吗?

    3.精确性。测验反映个体的知识技能或能力的真实水平吗?

一、效度的种类

    如果一项测验测量了它所想要测量的内容,那么它就是有效度的。例如,如果它想测验三年级的算术能力,那么它应该测量的是三年级的算术技能,而不是阅读能力。如果它想要测量书写行为目标的能力,它应该测量那项能力,而不是测量识别之类的较低目标的能力。

    显而易见,如果测验的结果将要用于进行任何种类的判断,如果要测验的信息有用,那么测量的效度则是重要的。最常用的三种方法是内容效度、一致性效度和预测效度。

1、内容效度

    通过考察测验的内容,建立测验的内容效度。教师审查测验试题,确保它们是否同所测的内容相一致,当试题测试成绩时,这是最容易做到的,它可能相当容易地详细列出测验应包括什么。如果对一个个体人格和性向的概念进行测试,它将要难得多,因为要预先详细指明某个相关问题看起来像什么,是有一定难度的。

    有时候,测验可能看似有效,但测量的却是某种不同于其意图的东西,像猜测能力、阅读水平、学习者在教学前已经获得的技能等。因此,内容效度是有用测验的一种最低要求,但并不确保它是有效的测验。

2、一致性效度

    为建立一致性效度,你必须在已经编制好一个新的试题的同时,实施一个已编制好的试题。不同于内容效度,一致性效度以相关系数的形式产生一数字值,称为效度系数。

    教师对一组学生既采用新的试题,也采用固有的试题进行测验,然后找到这两组考分的相关性。如果固有的标准试题与新试题存在着可比性,并且人们对此有信心,那么则说明一致性效度提供了评估测验效度的好方法。

3、预测效度

    预测效度指测验分数所代表的测验内容对于预测被测试者未来的行为的程度。这种形式的效度对于性向测验特别有用。所谓性向测验,是试图预测考生在某种未来的背景下,从事某项活动所能做到的程度。预测效度同样也是以相关效度的形式产生数字索引。然而这一次,它是测量某种未来的行为和测验之间的相互关系。

    这三种判断效度的方法——内容效度、一致性效度和预测效度,都假定试题之外存在着某种标准可以用来固定测验或使之有效。对于内容效度,由教学目标提供固着点或参考;对于一致性效度,由另外一种为大家广泛认可的测验题测量同样的事项;对于预测效度,是我们打算预测的某种未来行为或条件。

二、信度的种类

    一个测验的信度,是指该测验测量其所意图测量的东西,个体几次参试后,得分等级的一致程度。换句话说,保持我们所意图测量的特质不变,对所有个体经过反复测试,假如它前后一贯地导出相同或近乎相同的等级,那么该测验就可信。

    有几种评估一项测试信度的方式。三种最常用的基本方式是前测一复测,更替形式,内部一致性。

1、前测——复测

    前测——复测是恰如其名的测评信度的方法。教师对同一位个体两次测验,判断相互关系——前面一组得分和第二组得分的相互关系。

2、更替形式

如果手头有一项测验的两套相等的试题,教师能够运用这两套试题来评估该测验

的可信度。教师对一组学生实施这两套测试,判断两组分数之间的关系。因为这两套题题目不同而内容相似,这种测评消除了在前测——复测评估信度中的记忆和练习所导致的问题。同一学生若在假定测量相同行为的两套题得分差异极大,则说明该测验不可信。运用这种方法测量可信度,必须拥有两套相等的测验题,并且教师必须尽可能在近似相等的条件下、在大约相同的时间内实施测验。

3、内部一致性

    如果测验测量一个单个基本原理,那么可以有理由认为如果一个人能够正确解答一道题,那么他正确解答其他的、相似的题目的可能性增加了。换句话说,题目应该相互关联,测验应该具有内部一致性。如果是这种情况,那么该测验的信度能够通过内部一致性方法进行测量。

    这里有一些关于信度相互有效性解释的一些小建议和警告:

    从异质组比从同质组获得更高的相互有效性。由各种差异很大的个体组成的小组(如,有天赋的和资质差的、年长的和年少的、有动机的和无动机的学习者)将比更为同质的小组导致更高的信度。

    得分信度限制着测验信度。如果评判测验不令人信服,那么评分中的误差就将限制该测验的信度,一项测验的信度不可能高出评分的信度。

    所有其他因素相同时,一份测验中题目越多,该测验的信度就越高。

    当测验过易或过难时,信度倾向于下降。

    就共同有效性而言,一项测验的效度远低于其信度。一项测验的一个可以认可的效度的一般范围在0600.80之间或更高,而一项测验的可以接受的信度的一般范围在0800. 90之间或者更高。可以获得的最高的信度和效度为1.00测验的精确性一方面是测量的信度和效度的联合,一方面由测验内容与所采用的一般教育课程相配程度来决定。

本文标签: 测验 效度 信度 精确性

发布于2011年05月12日 16:08 | 评论数(2) 阅读数(2979)

评论

律君 发表于2011-05-12 17:35:15

做老师还真难,要保证每个知识点都测到真的不容易
从历 发表于2011-05-12 16:49:06

老师有时候出的卷子很难,这样的话是不是信度很低?我就记得我们那一年高考数学大部分人不及格。

发表评论  登录










版权所有 © 2009-2011 Jiguang.ci123.com 极光博客 向极光网举报