评价方法

性格测试提供了诸如感觉和情绪状态、关注点、动机、态度和人际关系方法等特征的测量方法。有一个多样性研究人格的方法评估,并且围绕广泛使用的方法和技术的许多方面存在争议。这些包括评估随着面试、评分量表、自我报告、人格量表、投射技巧和行为观察。

面试

在面试中,被评估的个人必须在“讲述他的故事”方面有相当大的自由度。面试包括口头的和非口头的(如。,手势)组件。面试的目的是收集信息,收集到的信息是否充分在很大程度上取决于面试官提出的问题。在求职面试中,面试官的重点通常是求职者的工作经验,一般和具体的态度,以及职业目标。在诊断性医学或精神病学面谈中,应相当注意病人的身体健康状况以及多年来可能出现的任何行为障碍症状。

面试可以分为两大类划定.在为研究而设计的访谈中,采访者和被采访者之间面对面的接触是为了引出可能与一般研究中的特定实际应用或正在研究的人格理论(或假设)相关的信息。另一种是临床访谈,侧重于评估特定个体的状态(如。精神病患者);这样的面试是以行动为导向的(即。,这可能意味着适当的治疗)。研究和临床访谈都可能经常进行,以获得个人的生活历史和传记信息(如。(识别事实、家庭关系),但它们在信息的用途上有所不同。

尽管它不是可行的为了量化采访中发生的所有事件,性格研究人员设计了对一个人所说内容的许多方面进行分类的方法。在这种方法中,称为内容分析,具体使用的类别取决于研究人员的兴趣和独创性,但内容分析的方法是相当普遍的,涉及到一个类别系统的构建,希望能够被分析师或记分员可靠地使用。分类可能很简单(如。,即受访者在指定时间内说出的字数),或以上述字数为准推论如。,即受访者似乎表达的个人不快乐程度)。内容分析的价值在于,它提供了使用发声反应频率来描述言语行为的可能性,并为实验研究中或多或少精确的研究定义了行为变量。内容分析已经被用于,例如随着时间的推移,人的态度会发生变化。例如,在一系列心理治疗访谈中,神经症患者对其父母的敌意参考频率的变化,可以被检测和评估,精神病院囚犯的自我评价变化也可能与住院时间有关。

的来源错误的从面对面的面试中得出的结论可能源于面试情况的复杂性,受访者的态度、恐惧和期望,以及面试官的态度和培训。为了识别、控制并在可能的情况下消除这些访谈无效和不可靠的来源,进行了研究。通过对同一受访者进行多次访谈,并使用多个访谈者来评估受试者的行为,可以揭示信息的可靠性派生的还可以揭示不同面试官之间的影响力差异。访谈格式的标准化有助于提高所收集信息的可靠性;例如,所有的面试官都可能使用同一套问题。然而,这种标准化可能会限制所引出的信息的范围,即使是完全可靠(一致)的访谈技术也可能导致不正确的推论。

等级量表

评分量表是最古老和最通用的评估技术之一。评分量表向用户提供一个项目,并要求他们从许多选项中进行选择。评分量表在某些方面类似于多项选择测试,但它的选项代表了一个特定的程度特征

评分表由观察员使用,个人也用于自我报告(见下文)自我报告的测试).他们可以方便地描述其他人及其行为。有些观察结果不像对运动行为的简单计数那样容易量化(比如一个工人离开车床去洗手间的次数)。例如,很难量化一个办公室接待员有多有魅力。在这种情况下,人们可能会依靠相对主观的判断、推断和相对不准确的估计,比如判断一个孩子有多不尊重人。评级量表是确保这种判断的一种方法。评级尺度表示一个带有标量的观察者那些被观察的人将被安置在那里。例如,老师可能会被要求对每个学生的行为在多大程度上反映了领导能力、害羞或创造力。同事之间可能会根据友好度、可信度和社交技能等方面对彼此进行评分。有几种标准化的、印制的评定量表可用于描述精神病院病人的行为。相对客观的评价量表也被设计用于其他群体。

为了最大限度地发挥评分表的作用,应满足若干要求。其一是它们是可靠的:不同的观察者对同一个人的评价应该是一致的。其他要求包括减少人格测量不准确的来源;所谓的光环效应导致观察者在某一特定特征上对某人给予好感,因为观察者对被评价的人有普遍好感的反应。一个人倾向于只说别人的好话,或者倾向于认为所有人都是平均水平(使用中等范围的量表),这代表了使用评分量表时出现的其他方法学问题。

自我报告的测试

便捷的智力测试成功地为个人能力提供了可靠的、定量的(数值的)指标,这激发了人们对设计类似的测试来衡量性格的可能性的兴趣。目前可用的程序在取得分数的可靠性和便捷性的程度上各不相同。这些理想的属性可以部分地通过以指定的方式限制受试者可以自由作出的反应来实现。自我报告工具遵循这一策略。例如,一项限制受试者回答是非题的测试很可能方便给出,也很容易得分。所谓的人格量表(见下文)往往具有这些特征,因为它们相对限制性强,可以客观地评分,并且便于管理。其他用于评估人格的技术(如墨迹测试)在较小程度上具有这些特征。

自我报告型人格测试在临床环境中用于诊断在决定是否需要治疗时,以及在计划使用治疗时。第二个主要用途是在选择员工时提供帮助,第三个用途是在心理学研究中。后一种情况的一个例子是,测试焦虑的分数——也就是人们在考试前感受到的紧张和担忧——可能被用来根据他们在考试时的不安程度将他们分为不同的群体。研究人员调查了在实验情境中,考试焦虑程度较高的学生与不那么焦虑的学生的表现是否不同。

个性的库存

自我报告测试中最常见的是人格量表。它们起源于人格的早期历史测量,当时大多数测试都是在所谓的基础上构建的脸的有效性;也就是说,它们看起来是有效的。项目被包括,仅仅是因为,在错误的判断中,建造或设计了在测试中,他们反映了某些人格特质。换句话说,面孔有效性不需要通过仔细的定量研究来定义;相反,它通常反映了一个人或多或少的不准确,甚至可能是错误的印象。个人判断,即使是专家的判断,也不能保证特定的测试项目集合在实际实践中是可靠和有意义的。

一种广泛使用的早期自述库存,即所谓伍德沃斯个人资料表,是在一战找出情绪上不适合战斗的士兵。在它表面上看起来有效的项目中有:看到血会让你恶心或头晕吗?你大部分时间都快乐吗?你有时会希望自己从未出生吗?新兵回答这些问题的方式可能意味着他们患有精神障碍,将被拘留进行进一步的询问和评估。显然,然而,症状这样的答案所揭示的是许多相对没有情绪障碍的人所表现出来的。

性格问卷不是测试一般知识或特定技能,而是询问人们关于自己的问题。这些问题可能有多种形式。在进行这样的测试时,受试者可能必须决定作为自我描述的一系列陈述中的每一个是准确的,还是对一系列关于个人信仰的对-错问题的回答。

有几份清单要求将一系列报表中的每一份都放在一个评分表上,根据个人判断这些报表反映其倾向和态度的频率或适当程度。不管被试者的反应如何,大多数人都会收益率有几个分数,每个分数都是为了确定性格的一个独特方面。

其中之一是明尼苏达多相人格量表(MMPI)可能是英语世界中使用最广泛的人格量表。它也有其他语言版本,包含一个550项的版本(如。,“我喜欢高个子的女人”),受试者将回答“是”、“否”或“不能说”。这个清单的工作始于20世纪30年代,当时它的建造是出于对描述和预测精神病人行为的实用、经济手段的需求。在开发过程中,努力实现管理和评分的便利性,并克服了早期人格量表的许多已知缺陷。不同类型的项目包括和强调他的任务是使这些打印出来的陈述(以小卡片或小册子形式呈现)即使是阅读能力有限的人也能理解。

大多数早期的清单缺乏微妙之处;许多人能够伪造或歪曲他们的答案,因为所呈现的项目很容易反映出严重的混乱;事实上,在许多这样的调查中,不良适应倾向要么全部为真,要么全部为假。也许在MMPI中发现的最重要的方法进步是,它的开发者试图衡量反应的倾向,而不是实际的行为,并且很少依赖于表面有效性的假设。真假题“我总是听到奇怪的声音”对大多数人来说表面上是有效的,因为回答“是”似乎提供了异常幻觉经历的强烈迹象。但一些“听到奇怪声音”的精神病人仍然能理解社会上不受欢迎的行为影响一个“正确”的答案,因此可能试图通过回答“错误”来掩盖自己的异常。在测试构建中过分依赖表面效度的一个主要困难是,测试对象可能像测试构造者一样意识到某些反应的重要性,因此可能会误导测试者。然而,一个人听到奇怪的声音,却清楚地回答“错误”这个问题,他是在对某种东西做出反应——这个答案仍然是性格的反映,即使它可能不是这个问题似乎所指的性格方面;因此,仔细研究超出表面有效性的反应往往是有益的。

人们对这些方法进行了大量的研究响应集考试态度会影响MMPI和其他人格测试的行为。响应集被称为例如,默认指的是一个人倾向于对问卷中的问题回答“是”或“是”,而不管问题的内容是什么。可以想象,两个人除了倾向于默认之外,可能在所有方面都很相似。这种反应集上的差异可能会导致性格测试中不同的分数具有误导性。一个人可能是“yes -sayer”(倾向于对测试项目回答真实的人);另一个可能是“否定者”;第三个人可能在这两个方向上都没有明显的默认倾向。

默认不是唯一的响应集;还有其他一些应试态度也会影响学生的性格特征。其中之一,已经在那个听到奇怪声音的人的例子中提出了,就是社会可取性。一个患有惊厥的人可能会对“我患有惊厥”这一项说“假”,因为他认为如果别人知道他患有惊厥,就会看轻他。从性格测试中得出的受试者的反应集和考试态度对分数的侵入性潜在欺骗效应有时可能是规避通过改变测试项目的内容和措辞。然而,问卷的使用者还没有完全解决偏差问题,如反应集引起的问题。事实上,这些问题中的许多首先在MMPI的研究中得到了广泛的关注,对这个和类似清单的研究极大地促进了对整体的理解纪律人格测试。