研究结果的整理与分析
研究结果的整理与分析
本章主要内容
一、研究资料的整理和定性分析
(一)研究资料的质量审核
(二)研究资料的编码
(三)研究资料的定性分析
二、研究资料的统计分析
(一)统计分析的含义与地位
(二)描述统计
(二)推论统计
(四)复杂统计分析
(五)统计分析方法的选择
(六)计算机统计分析
一、研究资料的整理和定性分析
(一)研究资料的质量审核
心理学研究所获得的原始数据和资料往往数量巨大、杂乱无章、质量参差不齐,因此必须通过检查和整理,才可以进行分析,进而得出研究结论。质量审核是研究结果整理的第一步。它是指审查、核实研究所获资料、数据的真伪,去伪存真,并根据实际情况予以补充,以保证结果的质量。
1.质量审核的内容
质量审核通常包括两方面的内容,一是从研究的总体看,检查研究目的所要求的各个方面的资料、数据是否收集齐备,如问卷或量表是否全部回收,实验的数据是否全部收集。二是对被试个体的资料、数据的审核,检查每一个被试的资料、数据有无缺失或遗漏,有无前后矛盾之处,结果登记中有无错行、错号等错误。
2.质量审核的方法
质量审核有计量审核和逻辑审核两种方法。计量审核即核查研究数据资料中各项计量资料行无错误或矛盾的地方,其中包括计量关系是否正确、计量单位是否一致等。逻辑审核方法是检查研究数据、资料的内容是否合乎逻辑,有无不合理的地方。比如,某一项目只有“是”和“否”两个选择项,分别用“1”、“2”表示,若在答案中出现“3”则显然不合逻辑。此外,如果每份资料的量较小且较简单,可采用全部审核的方式;如果每份资料的量较大、项目较多或问题较复杂,可采用“流水作业”的方式进行审核。
3.数据资料的剔除与补充
对于有明显错误的资料和数据,应找出原因,尽量加以纠正。若无法纠正,在不影响抽样效果、保证一定有效率的基础上,应予以剔除。如果不完整,应查明原因,想办法补充。
(二)研究资料的编码
1.编码的含义与方法
编码就是将研究所获得的资料转换成计算机可识别的数字、形成码值的过程。心理学研究中使用的码值有两种,其一为数码,本身具有数学意义,能进行计算;其二为代码,本身无数学意义,只能作为分类或分组的一种代号。编码的基本方法有事前编码和事后编码两种,前者指在设计的同时作编码设计,使研究结果能直接编录入编码表的编码方法,后者在研究完成之后,根据研究目的和所记录的本身反应或答案,构建编码系统,对资料进行编码的方法。
2.编码系统及其设计
编码系统包括编码指导手册和编码表。编码指导手册是编码的要求和依据,它包括变量的分类和答案代码。其编制步骤依次为详细列出研究涉及的变量,将反应或答案分类,规定代码,举例说明,预试检验和修改完善。编码表则是根据编码指导手册绘制的、可供编码者对研究资料进行编码的表。编码表必须包括所有的变量和代码,使研究结果中的任一部分都能在其中找到合理的位置。同时应清晰明确,方便使用。
3.编码注意事项
编码除严格按照编码指导手册中的规定和要求之外,还需注意以下几条:按顺序进行编码;码值或记号必须填写在规定之处,切忌粗心大意,造成错编或漏编等错误;出现问题应及时记录下来,加以解决;编码完毕后应进行复核等等。
(三)研究资料的定性分析
1.定性分析的含义与特点
定性分析指对研究结果的“质”的分析,是运用分析和综合、比较和分析、归纳和演绎等逻辑分析方法,对研究所获资料进行思维加工,从而认识心理与教育科学中的心理现象和行为的本质,揭示其发生发展的规律.为研究结果的解释和理论的建构提供依据。
定性分析具有以下特点:①建立在描述基础上的逻辑分析或推断;②侧重揭示心理现象背后的“意义”;③倾向于运用归纳分析的方法;④不仅注意对结果和产品的分析,更重视对过程和相互关系的分析。
2.定性分析的基本方法
①比较与分类
比较是指依据一定的标准,确定事物或现象之间的异同及相互关系,从而寻找心理行为的普遍性及特殊本质。比较有纵向和横向两种,前者指对同一对象在不同时间的比较,后者指对同时并存的不同对象的比较。分类就是将对象划分为不同的类别。
②归纳与演绎
归纳就是从大量资料中概括或推论出某一类事物、现象所具有的某种属性;演绎是从一般性前提推出个别性结论的逻辑方法。
③分析与综合
分析是指把复杂的研究对象(研究结果、现象等)分成简单的部分,进行单独的考察,从而认识各部分的性质和特点。综合则是指根据分析的结果,在已经认识到的事物本质的基础上,将事物的各方面的本质联合成为一个整体,从而使人们的获得对已知对象随全面、完整的认识。
④抽象与具体
心理学研究对象是具体的,要认识其中的本质和规律,必须借助抽象方法。另一方面,为了描述、解释、预测心理现象,必须要经过由抽象到具体的过程,才能使理论运用于实践。
二、研究资料的统计分析
(一)统计分析的含义与地位
1.统计分析的含义与功能
心理学研究中的定量分析需要借助一定的数理统计方法来进行,因此,定量分析也常常被称为统计分析。心理学研究数据具有变异性和统计规律性的特点,它要求在纷繁复杂的数据中寻求研究对象的特征和规律性,正确地使用统计分析方法。目前,统计分析已成为心理学研究的一个重要工具。统计分析具有以下功能:①可以为心理学研究提供一种清晰的形式化的描述;②是进行解释和科学预测的重要方法;③可以训练科学、严谨的思维方法。
2.统计分析的作用与地位
在心理学研究中,统计分析与上述的定性分析都具有十分重要的地位,两者缺一不可。一方面,统计分析是现代心理学研究的必备工具,心理学研究成果通常以统计分析的方式表现出来,不懂得统计分析就难以了解他人的研究进展,也难以确定自己的研究方向并进行深入的研究。另一方面,那种以为“统计万能”的思想是片面的、错误的。统计分析要以定性分析为基础,以心理学理论为基础,只有在正确的观点和思想方法指导下的统计分析才是有用的。统计分析是为了揭示数据的特征和规律性,因此,这种定量分析的方向、范围须由定性分析来规定,而不是由研究者随意确定。脱离了定性分析的统计分析只是“无本之木”,“无鱼之水”。统计分析的进行需依据一定的方法和公式,这些方法和公式的选择需要研究者具备一定的心理学专业知识。否则,这些统计分析就只是在数据上绕圈子,而不具有任何意义。此外,统计分析得出的规律或特征也需要借助于心理学理论才能科学地解释。可见对心理学研究的结果必须进行定性与定量两方面的分析,才能揭示心理与教育现象的本质和规律。定性分析与定量分析(主要是统计分析)应该是相互补充,相辅相成的。
(二)描述统计
描述统计的目的在于使纷繁的数据清晰直观地显示研究对象的特征和性质,以利于进一步的分析。它主要包括集中趋势和离散趋势的度量以及相关关系的度量。
描述数据的一个例子
一家制药公司出资赞助一个实验,想了解一种麻醉药物对老鼠行为的影响。于是我们让实验者观察一下药物是如何影响老鼠奔跑速度的。40只食物剥夺的老鼠经训练己能为了一份食物奖赏而走完直线型迷宫。随机地将它们分成两组,对其中的一组注射麻醉药物,然后在30分钟之后观察,看药物对老鼠在迷宫中奔跑的速度有何影响。另一组的其他条件与第一组老鼠相同,只是注射的不是药物而是安慰剂(一种无活性的物质)。
实验结果
面是20只控制组老鼠的奔跑时间,单位是秒:
13、11、14、18、12、14、10、13、13、16、15、9、12、20、11、13、12、17、15、14
注射麻醉药物组的老鼠奔跑时间为:
17、I 5、16、20、14、19、14、13、18、18、26、17、19、13、16、22、18、16、18、9
数据处理
我们可以用图示的方式来表示这些数据,如下图的两个直方图。此处,横坐标(X铀)代表奔跑的秒数,纵坐标(Y抽)代表每一种情况下,每一种速度所出现的频率。控制组的情况见上图,下图代表实验组的情况。
本章主要内容
一、研究资料的整理和定性分析
(一)研究资料的质量审核
(二)研究资料的编码
(三)研究资料的定性分析
二、研究资料的统计分析
(一)统计分析的含义与地位
(二)描述统计
(二)推论统计
(四)复杂统计分析
(五)统计分析方法的选择
(六)计算机统计分析
一、研究资料的整理和定性分析
(一)研究资料的质量审核
心理学研究所获得的原始数据和资料往往数量巨大、杂乱无章、质量参差不齐,因此必须通过检查和整理,才可以进行分析,进而得出研究结论。质量审核是研究结果整理的第一步。它是指审查、核实研究所获资料、数据的真伪,去伪存真,并根据实际情况予以补充,以保证结果的质量。
1.质量审核的内容
质量审核通常包括两方面的内容,一是从研究的总体看,检查研究目的所要求的各个方面的资料、数据是否收集齐备,如问卷或量表是否全部回收,实验的数据是否全部收集。二是对被试个体的资料、数据的审核,检查每一个被试的资料、数据有无缺失或遗漏,有无前后矛盾之处,结果登记中有无错行、错号等错误。
2.质量审核的方法
质量审核有计量审核和逻辑审核两种方法。计量审核即核查研究数据资料中各项计量资料行无错误或矛盾的地方,其中包括计量关系是否正确、计量单位是否一致等。逻辑审核方法是检查研究数据、资料的内容是否合乎逻辑,有无不合理的地方。比如,某一项目只有“是”和“否”两个选择项,分别用“1”、“2”表示,若在答案中出现“3”则显然不合逻辑。此外,如果每份资料的量较小且较简单,可采用全部审核的方式;如果每份资料的量较大、项目较多或问题较复杂,可采用“流水作业”的方式进行审核。
3.数据资料的剔除与补充
对于有明显错误的资料和数据,应找出原因,尽量加以纠正。若无法纠正,在不影响抽样效果、保证一定有效率的基础上,应予以剔除。如果不完整,应查明原因,想办法补充。
(二)研究资料的编码
1.编码的含义与方法
编码就是将研究所获得的资料转换成计算机可识别的数字、形成码值的过程。心理学研究中使用的码值有两种,其一为数码,本身具有数学意义,能进行计算;其二为代码,本身无数学意义,只能作为分类或分组的一种代号。编码的基本方法有事前编码和事后编码两种,前者指在设计的同时作编码设计,使研究结果能直接编录入编码表的编码方法,后者在研究完成之后,根据研究目的和所记录的本身反应或答案,构建编码系统,对资料进行编码的方法。
2.编码系统及其设计
编码系统包括编码指导手册和编码表。编码指导手册是编码的要求和依据,它包括变量的分类和答案代码。其编制步骤依次为详细列出研究涉及的变量,将反应或答案分类,规定代码,举例说明,预试检验和修改完善。编码表则是根据编码指导手册绘制的、可供编码者对研究资料进行编码的表。编码表必须包括所有的变量和代码,使研究结果中的任一部分都能在其中找到合理的位置。同时应清晰明确,方便使用。
3.编码注意事项
编码除严格按照编码指导手册中的规定和要求之外,还需注意以下几条:按顺序进行编码;码值或记号必须填写在规定之处,切忌粗心大意,造成错编或漏编等错误;出现问题应及时记录下来,加以解决;编码完毕后应进行复核等等。
(三)研究资料的定性分析
1.定性分析的含义与特点
定性分析指对研究结果的“质”的分析,是运用分析和综合、比较和分析、归纳和演绎等逻辑分析方法,对研究所获资料进行思维加工,从而认识心理与教育科学中的心理现象和行为的本质,揭示其发生发展的规律.为研究结果的解释和理论的建构提供依据。
定性分析具有以下特点:①建立在描述基础上的逻辑分析或推断;②侧重揭示心理现象背后的“意义”;③倾向于运用归纳分析的方法;④不仅注意对结果和产品的分析,更重视对过程和相互关系的分析。
2.定性分析的基本方法
①比较与分类
比较是指依据一定的标准,确定事物或现象之间的异同及相互关系,从而寻找心理行为的普遍性及特殊本质。比较有纵向和横向两种,前者指对同一对象在不同时间的比较,后者指对同时并存的不同对象的比较。分类就是将对象划分为不同的类别。
②归纳与演绎
归纳就是从大量资料中概括或推论出某一类事物、现象所具有的某种属性;演绎是从一般性前提推出个别性结论的逻辑方法。
③分析与综合
分析是指把复杂的研究对象(研究结果、现象等)分成简单的部分,进行单独的考察,从而认识各部分的性质和特点。综合则是指根据分析的结果,在已经认识到的事物本质的基础上,将事物的各方面的本质联合成为一个整体,从而使人们的获得对已知对象随全面、完整的认识。
④抽象与具体
心理学研究对象是具体的,要认识其中的本质和规律,必须借助抽象方法。另一方面,为了描述、解释、预测心理现象,必须要经过由抽象到具体的过程,才能使理论运用于实践。
二、研究资料的统计分析
(一)统计分析的含义与地位
1.统计分析的含义与功能
心理学研究中的定量分析需要借助一定的数理统计方法来进行,因此,定量分析也常常被称为统计分析。心理学研究数据具有变异性和统计规律性的特点,它要求在纷繁复杂的数据中寻求研究对象的特征和规律性,正确地使用统计分析方法。目前,统计分析已成为心理学研究的一个重要工具。统计分析具有以下功能:①可以为心理学研究提供一种清晰的形式化的描述;②是进行解释和科学预测的重要方法;③可以训练科学、严谨的思维方法。
2.统计分析的作用与地位
在心理学研究中,统计分析与上述的定性分析都具有十分重要的地位,两者缺一不可。一方面,统计分析是现代心理学研究的必备工具,心理学研究成果通常以统计分析的方式表现出来,不懂得统计分析就难以了解他人的研究进展,也难以确定自己的研究方向并进行深入的研究。另一方面,那种以为“统计万能”的思想是片面的、错误的。统计分析要以定性分析为基础,以心理学理论为基础,只有在正确的观点和思想方法指导下的统计分析才是有用的。统计分析是为了揭示数据的特征和规律性,因此,这种定量分析的方向、范围须由定性分析来规定,而不是由研究者随意确定。脱离了定性分析的统计分析只是“无本之木”,“无鱼之水”。统计分析的进行需依据一定的方法和公式,这些方法和公式的选择需要研究者具备一定的心理学专业知识。否则,这些统计分析就只是在数据上绕圈子,而不具有任何意义。此外,统计分析得出的规律或特征也需要借助于心理学理论才能科学地解释。可见对心理学研究的结果必须进行定性与定量两方面的分析,才能揭示心理与教育现象的本质和规律。定性分析与定量分析(主要是统计分析)应该是相互补充,相辅相成的。
(二)描述统计
描述统计的目的在于使纷繁的数据清晰直观地显示研究对象的特征和性质,以利于进一步的分析。它主要包括集中趋势和离散趋势的度量以及相关关系的度量。
描述数据的一个例子
一家制药公司出资赞助一个实验,想了解一种麻醉药物对老鼠行为的影响。于是我们让实验者观察一下药物是如何影响老鼠奔跑速度的。40只食物剥夺的老鼠经训练己能为了一份食物奖赏而走完直线型迷宫。随机地将它们分成两组,对其中的一组注射麻醉药物,然后在30分钟之后观察,看药物对老鼠在迷宫中奔跑的速度有何影响。另一组的其他条件与第一组老鼠相同,只是注射的不是药物而是安慰剂(一种无活性的物质)。
实验结果
面是20只控制组老鼠的奔跑时间,单位是秒:
13、11、14、18、12、14、10、13、13、16、15、9、12、20、11、13、12、17、15、14
注射麻醉药物组的老鼠奔跑时间为:
17、I 5、16、20、14、19、14、13、18、18、26、17、19、13、16、22、18、16、18、9
数据处理
我们可以用图示的方式来表示这些数据,如下图的两个直方图。此处,横坐标(X铀)代表奔跑的秒数,纵坐标(Y抽)代表每一种情况下,每一种速度所出现的频率。控制组的情况见上图,下图代表实验组的情况。
没有找到相关结果
已邀请:
12 个回复
肖瘦 (威望:1) (广东 中山) 在校学生 员工 - 本人来自江西,希望朋友们多多交流,互相学习,共同...
赞同来自:
从图中可以看出,在两种条件下,得分出现次数最多的往往是中间的数字;而两边则逐渐变少。这一现象控制组比实验组更为明显。同样,实验组跑迷宫的耗费时问要比控制组的长。
次数多边形
同样的信息也可用次数多边形的方式来加以表示。其构成与直方图相同,如果你将直方图上底边的中点连起来,就可窥见一二。
在这里直方图和次数多边形都是次数分配的类型。在某种程度上,它们使数据系统化,便于概括描述结果。
心理学研究中,度量数据的集中趋势的统计数据主要有:
(1)算术平均数(M),为应用最普遍的一种集中量数,由各单位数值之和除以单价数目而成。算术平均数反应灵敏,计算简便,较少受抽样变动的影响。但当出现数据性质不同或者包含极端数据或者数据模糊不清时,应避免采用。
前面的实验中,实验组与控制组所有被试奔跑的时间总数分别为338秒和272秒,由于在每一条件下各观察了20次,因此实验组的平均奔跑时间为16.9秒,控制组的为13.6秒。
(2)中数(Md),又称中位数、中点数,它是指数据的次数分布处于50%位置处的数值,即位于一组数据中较大一半与较小一半中间位置的数。中数计算简便,但反应不够灵敏,受取样影响较大,常用于偏态分布或有极端数据的分布中表示集中趋势。
如果观察次数分布是奇数,如27次,那么从低往高或从高往低的第14个分数即为中位数,显然这一分数将其他的分数分为上下两组,每组各有13个分数。而当观察次数为偶数时,如中间的两个分数不相等,中位数则为两个中间分数的算术平均致。比如下面一组数:66、70、72、76、80、96,中位数为(72十76)/2即74。
中数计算简便,不受极端分数的影响。但反应不够灵敏,受取样影响较大,常用于偏态分布或有极端数据的分布中表示集中趋势。
(3)众数(Mo),是指在次数分布中出现次数最多的数据的值。众数可通过观察的方法直接得到,也可用积分的方法求出。众数不够稳定,易受样本变动的影响,但较少受极端数据的影响,反应不灵敏。以上三种集中趋势在个同的次数分布中描述的情况是不同的(图2-9),应加以区别。
图2-9 不同分布的三种集中量表
此外还有几种集中量数,如几何平均数、调和平均数、加权平均数等。
2.离散趋势的度量
对集中趋势的测量能反映分数中心位置的情况,而对离中趋势的测量则能反映出分数相对于中心的离散情况。对离中趋势最为简单的测量称为全距,即分布中最高分数与最低分数之间的差异数。
如关于麻醉药物实验例子中,控制组老鼠的全距为11(20一9),而实验组的则为17(26—9)。但由于全距仅仅反映的是极端分数的情况,所以很少使用。
度量数据变异性即离散趋势的统计量称差异量数。除了全距外,方差和标准差是最常用的差异量数。标难差是方差的算术平方根。方差和标准差适合于代数运算方法,数值较稳定且反应灵敏,在计算中全部数据都参与运算,是数据离散程度的最好的指标。标准分数(Z分数)是根据标准差计算出来的,常被用来表示一个数据在团体中所处的相对位置,以便于团体成员间的比较。
(1)平均差
为了更好地对离中趋势进行测量,我们用平均差来代表数据的离中趋势。
平均差的计算方法如下:先计算出分布中每一分数与平均数之间的差,然后计算这些差的和,再除以分数的数目。当然,计算时我们必须取离差的绝对值(即不管该分数是大于还是小于平均数,离差皆取正值)。原因在于如果不取正值那么所有的离差之和必为0,因此,平均差必然是绝对平均差。
下表是关于麻醉药物的实验中,实验组和控制组的平均差。
(2)标准差和方差
一组分数的绝对平均差足以反映数据的离中趋势。然而标准差和方差却要优于平均差,因为它们所具有的数学特征使得它们在较高级的统计计算中更为有用。
一个分布的方差定义为分数与平均数之差的平方和除以分数的个数。即取每一个分数减去平均数,再平方;然后将所有的这些值相加,除以观察次数,公式如下:
虽然方差是一个非常有用的数值,但其描述离中趋势是以平方的形式——此例中是奔跑时间的平方——而这常常不是很有用的。为了回到原来的度量单位,只需对此开方即可。标准差就是方差的平方根,用s表示。由于s使用的是原始的度量单位,因此它和平均数常常共同用来描述分数的分布情况。方差是用来计算其他统计值的基础。
下表是通过平均差的方法对控制条件和实验条件下标准差s的计算。
续表
(3)平均数和标准差
心理学家在描述一组数据时,通常会使用两个描述统计量:平均数和标准差。虽然还有其他的反映集中趋势和离中趋势的统计量,但这两个统计量能胜任完成描述的使命,而方差的应用也非常广泛,特别是在推断统计中。
(4)正态分布
从前面的麻醉药物实验分数图中可以发现,图形中分数的分布形态是中央隆起,两边下沉趋向分数轴。虽然这些分数皆为假造的,但是该分数的分布仍旧反映出对多数行为进行测量时所显示出的特性,也就是说,在大多数的测量中,分数一般集中分布在中心。这一形状被称为正态曲线。如下图。
如果我们观察到的心理学数据标在图上的话,那么大量分数分布在中间,从中间向两端几乎对称地衰减。数据分布在低于平均数10个分数点的位置的可能性与高于平均数10个分数点的可能性相当。
上图所示的三条曲线都是对称的图形。在正态分布中,分数的平均数与中位效都落在同一点上,具有相同平均数和中位数的曲线变化性却可以有所不同。如上图所示,标示以字母A的曲线高且窄,比其他两条曲线代表的分布的标淮差要小,同样,扁平的曲线(c)比其他两条的标准差要大。
正态曲线具有非常有用的特征。正态曲线每一段的分数都占有特定的比例,其特征如下图所示,在该图的曲线中,从某一点开始曲线的方向发生了微微的变化,即从该点开始曲线更多地向外(相反方向)弯曲。这一点就称为转折点。转折点的位置总是位于距平均数一个标准差的位置上。
事实上,正态曲线具有相当有用的特性,它所代表的分数分布的特定比例,总是包含在该曲线所占的特定的面积之内。所有分数中大约68%的分数分布在距平均数位置正负一个标准差之间(每边各占约34%)。同理,离平均数正负两个标准差之间分布了几乎96%的数据,在正负三个标准差之间分布了99.74%的数据,每个面积范围之内分数分布的百分比如下图所示。
正态曲线的这一特性是极为有用的:如果我们知道了某人的分数,也知道了该分布的平均数和标准差,我们也就知道了此人相对的位置和等级。
例如,大多数的IQ测验的平均数都被设计为100,标准差为15。如果一个人的IQ分数是115,那么我们就能知道他的得分要比测验中84%的人高(其中50%的人得分低于平均数,34%的人高于平均数)。同样,如果一个人的IQ分数为130的话,其得分就要高于98%的人;IQ分数145,则高于99.87%的人