forcode想看的


forcode看过的


新技术
新趋势
奇思妙想
科学探索
科幻奇幻
资料搜集
网络研究
统计定量
社会学研究
书摘读后感
数码网络
软件评测
数据指标
实用信息
有趣的东西
房地产
网络赚钱
投资创业
新闻评论
网站经营
电影八卦
美景美人
人物朋友
情感回忆梦
forcode生活

2006-04-17

袁方《社会学方法教程》笔记总结(第一章到第十七章)

袁方《社会学方法教程》笔记总结(第一章到第十七章)

第一章:绪论
[url]http://feeds.feedburner.com/woodphone?m=469[/url]

第二章:社会研究发展史
[url]http://feeds.feedburner.com/woodphone?m=468[/url]

第三章:社会研究的方法论问题
[url]http://feeds.feedburner.com/woodphone?m=467[/url]

第四章:社会研究的过程
[url]http://forcode.pdx.cn/blog/diary,575343.html[/url]

第五章:社会研究的设计
[url]http://forcode.pdx.cn/blog/diary,575345.html[/url]

第六章:测量
[url]http://forcode.51.net/blog/?p=524[/url]

第七章:抽样
[url]http://forcode.pdx.cn/blog/diary,575349.html[/url]

第八章:问卷法
[url]http://forcode.pdx.cn/blog/diary,575350.html[/url]

第九章:访问法(含第十章)
[url]http://forcode.pdx.cn/blog/diary,575352.html[/url]

第十一章:观察法
[url]http://forcode.51.net/blog/?p=525[/url]

第十二章:实验法
[url]http://forcode.51.net/blog/?p=526[/url]

第十三章:文献法
[url]http://forcode.pdx.cn/blog/diary,575359.html[/url]

第十四章:资料整理
[url]http://forcode.51.net/blog/?p=528[/url]

第十五章:资料的统计分析
[url]http://forcode.pdx.cn/blog/diary,575365.html[/url]

第十六章:变量分析的逻辑和策略
[url]http://forcode.pdx.cn/blog/diary,575366.html[/url]

第十七章:多元分析概论
[url]http://forcode.51.net/blog/?p=527[/url]

--
"奇思妙想"http://www.forcode.net
rss订阅: [url]http://feeds.feedburner.com/woodphone[/url]
邮件联系我:[email]woodphone@gmail.com[/email]

袁方《社会学方法教程》笔记总结第十五章:资料的统计分析f

第十五章:资料的统计分析

114、 统计分析的作用:(1)可对资料进行简化和描述。(2)可对变量间的关系进行描述和深入地分析。(3)可通过样本资料推断总体。

115、 统计分析的步骤:(1)对应用统计分析的前提条件进行考察。统计分析是建立在树立统计理论基础上的,因此他的应用必须满足一定的理论前提。(2)制定统计分析方案:<1>再次确定自变量与因变量。<2>定义复合变量。问卷或调查表上出现的各个变量,一般称为基本变量或原始变量。用基本变量组合而成的新的变量,称作复合变量。<3>变量分组:将类别或属性相同的变量组合成有意义的数组。<4>提出统计计算的要求并提出适当的统计方法。(3)选择统计分析方法的原则。必须根据研究目的和资料本身的特点选择适当的统计分析方法。从研究目的考虑:是描述性研究还是解释性研究。描述性研究在于说明某种社会现象的状况;对于解释性研究,除了采用描述性研究的方法外,还要使用控制变量、建立因果统计模型和分类及综合变量等多种统计分析技术。研究资料的性质,主要考虑:<1>变量的测量尺度;<2>资料的收集方法;<3>数据的分布形态;<4>变量的个数。(4)对于统计结果的解释。统计分析是一种定量分析方法,但任何具体的两都是有质的规定性以及数量关系背后的社会背景情况,如果不了解这种质的规定性以及数量关系背后的社会背景情况,就可能做出肤浅、错误的甚至荒谬的解释。因此,对于统计结果的分析,有赖于对事物作深入地观察和了解,决不能凭表面的数据就轻易的下结论。

116、 单变量的统计描述:(1)变量的分布:<1>频次分布:就是变量的每一取值出现的次数。对于连续性变量,如定距变量
,频次的计算必须分组进行。其中每组上限即下一组的下限,通常将下限包括在本组中,每组用组中值表示。<2>频率分布:用变量每个取值的频次数除以总个案数,他是一个相对指标,派出了样本规模的影响,因而可以用来比较不同的样本。一般频率分布使用比率的形式表示的。(2)统计图与统计表。<1>统计表就是以表格形式来表示变量的分布。在制作统计表时,如果有未回答或回答不符合要求的情况,可以有两种处理方法:(A)仍以调查总数为基础计算频率,这时应加入一类:未详。(B)以有效回答为基数计算频率,这时应在表的下面、紧接着表的地方注明:未详****户。<2>统计图:是以图形表示变量的分布情况。统计图虽然不如统计表精确,但是更直观、生动、醒目。(A)圆瓣图:是用一个圆代表现象总体,每一瓣代表现象中的一类,其大小代表他在总体中所占的百分比频率。(B)条形图:多用于描述定类与定序变量的分布,他是以长条的高度表示变量不同取值的频率分布的,其中长条的宽度没有意义,一般均化成等宽长条。长条的排列可以使离散的,也可以使紧挨着的。(C)直方图:是由紧挨着的长条构成的,与长条图不同的是,他的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率密度=频率/组距),长条的宽度表示组距。直方图仅适用于定距变量。(D)折线图:是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。
(3)集中趋势分析:是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。<1>众数(北大92<问>:试用分布理论简述算术平均数、中位数和众数三者之间的关系):就是出现频率最高的变量值。众数可以适用于任何测量层次的变量,对于定类和定序变量,众数可直接从变量的频率分布中观察到;对于定距变量,如果变量是在第I组具有最高的频率密度,则用第I组的组中值表示变量的众数。<2>中位数:是将观察总数一分为二的变量值。若将数据从小到大顺序排列,则取值于(N+1)/2处的变量值。当N为偶数,由于(N+1)/2处无数值,取中间位置左右两数的平均值。对于经过分组的资料,中位数的位置则是通过计算累计百分比频率得到的。即首先计算出含有累积频率50%的区间,然后求出这个区间的上下限值(U、L)最后利用公式

计算中位数值。中位数一般用于描述定序及定序以上的测量尺度的变量的集中趋势。
<3>平均数:仅适用于定距及定距以上变量,但有时也可用于定序变量。如求平均等级。对于分组值,一般用组中值来代替变量值,然后加权平均计算平均数。需要指出的是,用组中值计算的加权平均数知是用原始数据计算的平均数的近似值。由于分组是人为的,所以在变量分布不均匀的情况下,不同的分组会有不同的结果。<4>分布与三值的关系:正态分布时,三值重合;偏态分布中,三值不重合,在正偏态时,由于左边频次密集,这使得中位数偏向左方,但由于右侧的变量取值大,故平均数叫中位数偏右,即平均数>中位数>众数;而在负偏态时则相反,有平均数<中位数<众数。

(4)离中趋势分析:用以概括描述数据间差异程度的统计指标。与集中趋势相比,二者区别:<1>集中趋势描述的是现象的共性,而离中趋势描述的是现象的差异性,如果离中量数大,说明数据分布很分散,这时集中值对数据的代表性低;反之,则说明数据的分布很集中,集中值对数据的代表性高。<2>在由样本资料推论总体时,集中值告诉我们的是如何去估计与预测总体,而离中趋势则告诉我们这一估计与预测的误差大小,因此,两者是互补的。

(5)常用的李中趋势测量指标:<1>异众比率:即非众数的各变量值得总频数在观察总数中的比例。可见,异众比率是对众数的补充,异众比率越小,说明众数的代表性越好。<2>极差:是对定序及定序以上尺度的变量离散程度的测量。它等于最大观察值与最小观察值间得差。极差越小说明资料分布越集中。<3>四分互差(复旦97<名>):也是对定序及定序以上测量尺度的变量离散程度的测量指标。把一组数据按序排列,然后分成四个数据数目相等的段落,各段分界点上的数叫作四分位数,即第一个四分位数Q1以下包括了25%的数据,Q2是中位数,第三个四分位数Q3以下包括了总数据中的75%的数据。四分互差就是第三个四分位数与第一个四分位数的差,即Q=Q3-Q1。优点是可以克服极差中几支队资料分散程度度量的干扰。四分互差的间距越小,说明中位数的代表性越大,数据分布越集中。对于分组数据,求Q1与Q3的方法也可以用线性插值法或直接用公式:

文本框: 文本框:

文本框:
进行计算。其中L1、L3为含有累计百分比25%与75%的区间的下限,U1、U3为对应上限,n1、n3为含有累计百分比25%与75%的区间的频次;cf1与cf3为含有累积百分比25%与75%所在组以前组的累积频次。
(4)方差与标准差。只适用于定距变量。方差等于每一观察值与其平均数的差的平方和除以观察总数,即

而标准差则是它的正平方根。

(5)离散系数与标准分数:离散系数是标准差与平均数之百分比: 标准分数:


文本框:
文本框:

将原始数据标准化有两个作用:<1>确定原始数据在总体分布中的位置;<2>对不同分布的各原始数据进行比较。

117、 双变量的统计分析:(1)列联表(北大92<名>;人大98<名>:偏表、边缘表):<1>定义:又称交互分类表,所谓交互分类,指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较个组的分布状况,以寻找变量间的关系。这样的表又叫作条件次数表。表的最下一行和最右一列分别是每类地区和每种产业的总次数,称为边缘次数。其分布称为边缘分布。其余的次数称为条件次数。每一条件下的分布称为条件分布。

<2>注意:(A)在制作条件百分比列联表时,一般应将自变量放在表的最上端横行位置上。因变量放在表的最左一列。计算百分比通常是按照自变量的方向,因为研究的目的是要了解自变量对因变量的影响,因此应计算在自变量不同取值情况下因变量的变化情况如何。
(B)在制作列联表时,应在表的最后一行汇出自变量各类数值的个案总数,并以括号括起来。

<3>列联表的作用:(A)具有对变量进行描述的作用。(B)可对不同类别进行比较。(C)是对变量关系的一种解释性分析。
<4>列联表应用:可用于各种测量层次的变量,在用于定序变量时,变量应按取值的大小顺序排列。用于定距尺度的变量时,需要事先进行分组,然后以组的首尾相接顺序排列。
<5>列联表的优点:直观、资料丰富,不仅可以看到关系的有无、大小,而且还可以了解这种关系得详细结构。

(2)消减误差比例:是指一种对变量间关系的测定,简称PRE。假设在不知道x的情况下,对y进行预测的全部误差是E1,在知道x的情况下,由x预测或解释y的总误差为E2,则由x预测或解释掉y的误差为E1-E2,消减误差比例PRE=(E1-E2)/E1。PRE越大,表示以x预测或解释y时所减少的误差越多,即x与y的关系越强。换言之,PRE的值表示的是用一个社会现象(x)来解释另一个社会现象(y)时,能够消除百分之几的错误,即x对y的解释力有多大。PRE的值在0与1之间,当E2=0时,PRE=1,说明x与y完全相关,x能百分之百解释y的变化;若E2=E1,则PRE=0
,说明x与y之间没有关系,x对y无解释力。
(3)相关分析(复旦96<名>:相关关系;南大99<名>:相关系数;南大95<名>:相关分析
):相关,就是指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个变量的值也相应地发生变化。相关分析就是以一个统计指标是变量与变量间的关系,这个统计值称为相关系数。通常大多数相关系数取值在0与之间,0代表无相关,代表完全相关,相关系数越大,表示相关程度越强。<1>注意:(A)虽然相关系数可以描述变量之间关系的有无、大小和方向,但相关系数多大时才能断定两个变量有必然的、规律性的联系,是很难说的,在统计学中,需要大到0.7以上,但社会现象间很少有这样密切的联系,所以研究人员一般要结合定性分析来断定是无内在的、本质的联系。
(B)数据所显示出的相关(或无关)关系,实际上也可能并不反映变量间存在有意义的关系。
<2>定类变量==定类变量:(A)Lambda系数:(a)对称形式,用表示,即用于测量的两个变量间的关系是对等的,即无自变量与因变量之分。(b)非对称形式,用表示,几所测量的两个变量间有自变量与因变量之分,x为自变量,y为因变量。

文本框:

文本框:

其中, =Y变量众数的频次;=Y变量每个取值之下的X变量的众数的频次;=Y变量每个取值之下的X变量的众数的频次;为X变量的每个取值之下的Y变量众数的频次;N=
调查对象总数。Lambda的取值在0-1之间。Lambda系数具有消减误差比例的含义。

(B)Tau-y系数,简称系数,它是测量变量间非对称关系的,其中y为因变量,x为自变量。系数也具有消减误差比例的含义。通常都用经过简化的公式:计算,其中(j=1,2¼r)为的边缘分布次数,为(i=1,2¼c)的边缘分布次数;为同属于和的个案总数。的取值在0-1之间。通常值比值更好,但值较值易于计算。此外,二者都是测量变量间非对称关系的,因此与、与的意义是不同的。

<3>定序变量---定序变量:(A)Gamma系数:一般用G表示,它适用于分析两个变量间的对等关系,即两个变量无所谓自变量与因变量之分。G系数具有消减误差比例的含义。

其值在-1到+1之间,既表示相关程度,也表示相关方向。式中同序对是指某个案在两个变量上的相对等级是相同的,异序对是指某对个案在两个变量的相对等级上是相反的。

G系数是分析两个等级序列的关系的,故又称等级相关系数,在社会研究中,它所涉及的往往是研究对象本身的的某两种特征间的等级关系。
在等级分布表中,有时两个个案分数相同,分不出高低,这是一般用两级的平均值作为这两个个案的等级。

表示仅在变量x上同等级的对数,表示仅在变量y上同等级的对数,表示在两个变量上都同级的对数。、、叫做同分对,G系数不考虑同分对,而只考虑同序对与异序对。

大规模调查中资料的等级分布往往是用列联表的形式给出的,这时,同序对数量等于表内每个频次乘以其右下方全部频次之和,然后加总。而异序对数量则等于表内每个频次乘以其左下方全部频次之和,然后加总。

(B)系数,与G系数一样,系数也是等级相关系数,其值也在-1到+1之间,也具有消减误差比例的意义。不同于G系数的是,系数测量的两个变量间的关系是非对称性的,即所测两个变量有自变量x与因变量y之分,因此,其计算公式:

当资料是以次数列联表形式给出时,同序对与异序对的数量计算方法同G系数,等于列联表中的每个频次乘以它有面的所有同行频次之和,然后加总。

(C)斯皮尔曼等级相关系数(Spearman),一般用表示。与G系数和系数不同,斯皮尔曼相关系数不失考虑个案对在两个变量上的相对等级,而是考虑单个个案在两个变量上的等级差异,它在计算每个个案在两个变量上的等级时,不仅要做高低的比较,还要考虑等级的差异是多少。

以表示第i个调查对象在两个变量上的等级差异,为它在x变量上的等级值,为它在y变量上的等级值,N表示全部调查对象总数,则,取值在-1到+1之间。

斯皮尔曼等级相关是以没有相同等级为前提的,如果某些个案在同一变量的等级是相同的,且相同等级不太多时,可取其平均值。

<4>定距变量---定距变量:最常用的是皮尔森相关系数:用r表示,

其中,是变量x的平均数,为x变量的第I个观察值;是y变量的第I个观察值。r值在-1到+1之间。

r系数要求调查对象的成对资料N50而且两个变量的分布应近似于正态分布。r系数是测量的两个变量间对等关系的,并且,r的平方值具有消减误差比例的含义。在实际计算时,一般采用下属经过简化的公式:

变量x与变量y间存在线性关系这一假设,是r系数的前提,如果两个变量间的关系不符合线性相关的假设,用r相关系数进行分析就会犯错误。

分析两变量间非线性关系的相关比例测量法:测量一个定类变量与一个定距变量相关程度的,即因变量(定距变量)在自变量(定类变量)各值上的差异情况。两定距变量是非线性关系时,可将一个变量看作是定类变量,采取比例相关测量法分析,由于定类变量不具有数量大小的概念,故不存在是否线性相关的问题,因此两个非线性相关的变量关系分析可用相关比例测量法来测量。

<5>定类变量----定距变量:两个变量中,因变量为定距变量时,采用相关比率来测量两者间的相关程度。相关比率,又称eta平方系数,简写为,

其中,是因变量y的平均数,是在每个自变量值()上因变量的平均数。E=,其值在0-1之间。具有消减误差比例的含义。eta平方系数的计算公式可简化为其中是自变量值的个案总数,N是全部调查对象总数。相关比例测量法基本上是用于分析非对称关系的,但要求并不严格。

<6>定类变量----定序变量:(A)用theta系数,简记为,其值在0-1之间。系数是专门用于测量定类变量与定序变量间关系有无和强度的,它测量的是变量间非对称关系,并且不具有消减误差比例的含义。(B)采用测量两个定类变量关系的系数和系数,即将定序变量作为定类变量处理。虽然这样做会损失数据的某些信息,如等级差别,但方便了统计分析工作,因此在社会研究时大多数人都采用这两个指标分析一个定类变量与一个定序变量的关系。

<7>定序变量---定距变量:(A)将定序变量看作是定类变量,采用相关比例测量法。(B)将定序变量看作是定距变量,采用r相关系数。严格地说,低测量层次变量不能使用高测量层次的统计指标,但在有些情况下,由于这种提高测量层次的方法给研究结果的解释带来的危害程度不大,大部分社会学家还是接受了这种做法。

(4)一元方差分析:是关于一个定类变量和一个定距变量关系的分析。二元方差分析是对于两个定类变量与一个定距变量的关系的分析。依此类推
,n元方差分析是指n个定类变量与一个定距变量关系的分析,二元以上的方差分析都叫做多元方差分析。方差分析是由对变量间相关关系的分析,到建立描述变量间因果关系得一般线性模型的过渡,后者是大多数多变量分析方法的核心思想。

<1>总离差平方和:TSS=。表示全体观测值对总平均数(推测值)的离差平方和。

<2>组内离差平方和(人大99<名>:残差):RSS=,表示各观测值队本组平均数的离差平方和,它不是由自变量而是由其他未知因素引起的。又称剩余平方和。

<3>组间离差平方和:

BSS=TSS-RSS=,表示各组的平均数与总平均数的离差的平方和。它是由于自变量值的不同引起的差异。

<4>其中分别是BSS与RSS相应的自由度,,(m为变量x值的类别数,N为观测总数)。即,F越大就表示x与y越可能相关。
由此可见,方差分析的基本思想就是把推测的全部误差(TSS)分为两部分;可被自变量x消减的部分(BSS)和剩余部分(RSS),然后从这两部分的相互比较中看x与y是否相关。如果两个变量一个定序一个定距,当把其中的定序变量看作为定类变量时,也可以使用方差分析,实际上许多社会调研人员都是这么做的。

(5)一元回归分析:是对相关的两个变量间关系的具体形态的一种深入分析。它不仅分析两个变量关系的有无、大小和方向,而且要了解两个变量具体是以什么方式发生关系的。回归分析是一种因果分析,它是根据两变量间关系的具体形态,选择一个合适的数学模型,用来近似的表达变量间平均变化关系,这个数学模型就是回归模型。一般用于分析定距变量间的关系,它除了具有描述和说明这种关系的功能外,还具有预测的功能,这也是相关分析所不及的。

<1>一元回归模型:对于已知相关的两个变量x与y,架设他们之间是一种线性关系,则对这一关系可以用一元线性方程y=a+bx表示,其中的a和b是待定系数。这个方程叫做回归方程,b称为回归系数,a称为截距,即x=0时,y的值。a与b的计算公式:

<2>散点图与回归直线: 为了直观的看出x与y的关系形态,往往先作关于所调查的数据的散点图,即在直角坐标系中,将由每一横坐标与相应的纵坐标(i=1,2,---n)所确定的点标示出来。x与y间存在一种线性关系时,虽然有多条直线来近似的刻画这种关系,但其中只有一条直线的代表性最好,这条直线就是回归直线。回归直线的方程就是回归方程,回归方程中的a就是回归直线的y轴的截距,回归系数b就是回归直线的斜率,b值具有描述自变量对因变量的影响的大小和方向的作用。

<3>回归系数与r相关系数:回归系数与r相关系数都是描述两个定距变量间的线性关系的指标。r相关系数十一种对对等关系测量法,它反映的是两个变量有无关系,关系的强弱,但它不能给出一个变量x有的变化时,y的变化具体有多大。b值可以做到这种区分,不过b值却无法反映两个变量间关系的强弱。此外,b与r值不同的是,b值所描述的是一种因果关系,而相关关系只是因果关系的必要条件。尽管有上述不同,但回归分析与相关分析之间有着密切的关系,实际上r值所要表示的,就是以回归方程作为预测工具时所能减少的误差比例,r值越大,就表示回归方程的预测能力越强,即散点图中的点越靠近回归直线。因此,我们用作为决定系数,在社会研究中往往要先计算r值,然后再决定是否用回归分析进行预测。

<4>回归分析的作用:回归分析模型是一种因果关系模型,因为增加了因果关系,因此与相关分析相比,它的作用也大于相关分析。除了具有与相关分析同样的简化资料的功能,还增加了预测的功能,即当得到了两个变量x与y的回归方程后,就可以从自变量的值经回归方程计算出y的预测值。

但应当注意的是,应用回归方程来预测因果变量时,一般不应使用超出资料所包括范围的自变量的数值,因为回归线段以外未观察到的点可能出现非线性的趋势。此外,预测的回归方程式只能反映一定时期内事物之间的相互关系,随着时间的推移,这种关系会起变化,因此回归模型也要作相应的修改,如果这时还使用原来的模型作预测就会得到错误的结论。回归分析在应用时有许多假设前提,例如其关系是线性的,自变量无测量误差等等。

118、 单变量与双变量的统计推论:
(1)统计推论的一般概念:统计推论分两类<1>参数估计(复旦97<简>:什么叫统计推论?其特点是什么):就是根据一个随机样本的统计值,来估计总体的参数值。

<2>假设检验:是首先对总体的情况作出假设,然后抽选出一个随机样本,以这一样本的统计值来检验原先的假设是否正确。社会调查研究中大多采用假设检验的统计推论方法。(2)参数估计:分为:

<1>点估计(复旦97<简>:进行总体参数的点估计时,衡量估计值的好坏标准有哪几条):就是从一个适当的样本统计值来估计总体的未知参数值。缺点是无法了解这种估计和推测的可信程度如何,区间估计可以弥补这一缺陷。<2>区间估计(浙大2001<名>;南大2000<名>):就是通过样本统计值来推测总体未知参数的可能范围。这一可能范围的大小,取决于我们在估计时所要求的可信度(即置信水平)的高低,对于同一样本,如果要求这种估计的可信程度越高,则总体参数的可能范围越大,反之越小,这一可能的范围称为置信区间(南大2000<名>),显然,置信水平与置信区间成正比。

(A)区间估计的一般程序:(a)确定置信水平。(b)计算标准误差。(c)根据样本统计值和标准误差确定置信区间。
(B)平均数的区间估计:
(a)当总体方差已知的时候,根据抽样分布理论,满足标准正态分布N(0,1),式中n为样本容量,M为待估总体平均数。区间为待估平均数M、置信水平为1-的双侧置信区间。在置信水平为95%时,总体平均数的置信区间为:。(b)当总体方差未知时,分两种情况:a:当时,总体平均数的双侧置信区间为:。值需要查t分布表。

b:当时,总体平均数的双侧置信区间为:。从上面的公式可知,置信区间与样本大小成反比。只要将样本加大,就可以提高估计的精确程度。
(C)方差的区间估计:(a)当样本时,由抽样分布理论可知,满足自由度为n-1的分布。对于给定置信水平1-,区间即待估总体方差的双侧置信区间,的值可由分布表查出。(b)当样本时,总体方差在置信水平1-下的双侧置信区间为。由总体平均数与方差的讨论可知,总体参数的区间估计方法的选择除考虑参数的类型以外,还应考虑样本的规模。在大样本的情况下,常采用正态分布,而在小样本时,则要采用其他类型的分布。

(D)总体成数的区间估计:当样本规模时,总体成数的双侧区间估计是:
,其中=1-置信水平,值由查正态分布表得到;为样本成数;P为总体中某类所占百分比,当总体成数未知时用样本成数代替。有时,我们还要对两个总体均值差或成数差进行估计。这时,若两个样本都是大样本(n1>100,n2>100),则两个总体均值差的双侧置信区间为:

文本框:

成数差的双侧置信区间为:

文本框:

*

在未知时用代替。在两个总体成数未知时,用对应的样本成数代替。

(E)r相关系数的区间估计,在置信水平1-的要求下,总体r相关系数的置信区间可由如下方法求出:首先将样本相关系数带入公式:=1.151log中求出值,则总体值得置信区间为,由上式=1.151log,将两值对应的两个r值求出,这两个r值即为相关系数的置信区间端点值。

(3)假设检验:<1>定义:如果经验资料是由抽样调查获得的,由资料计算出的结果还不能马上验证原有理论假设是否为真,而要首先对这一结果的显著性进行检验,即检验这结果是否对总体具有显著的代表性,这种与抽样调查结合在一起的显著性检验称为统计假设检验,简称假设检验。

<2>当样本资料与原假设不符,有两种可能:(A)原假设错误。(B)样本缺乏代表性。因此,如果不对样本的代表性进行检验,剔除因样本代表性所产生的结果与假设不符的情况,而否证原理论假设,就有可能抛弃正确理论假设的错误的危险。同理,在样本结果与原假设相符的情况下,有可能犯以假当真的错误
<3>假设检验的一般概念:
(A)原假设与备择假设。原假设又称虚无假设,一般用表示,它常常是根据已有的资料或根据周密考虑后确定的。但直接用于假设检验的不是原假设,而是所谓的备择假设,又称研究假设,备择假设就是与原假设相反的假设,用表示,它是当原假设被推翻时需要接受的假设。假设检验依据的是小概率原理,就是说小概率事件被认为是在一次观察中不可能出现的事件,因此,如果再一次观察中出现了小概率事件就应当否定此事件是小概率的说法。假设检验的逻辑就是求出是正确的可能性,如果能证明这种可能性极小,就应否定,接受。

(B)显著性水平与否定域(接受域):显著性水平(人大99<名>:显著度;南大99<名>):是指假设成立的标准,即小概率的值,用表示。显著性水平意味着总体参数值与样本统计值具有同等特性的概率为,抽样误差不超过。在进行研究时,通常是先决定显著性水平的大小,若样本统计值达到这一水平,则可确认样本具有较好的代表性,原假设可以成立。拒绝域:就是在显著性水平下,拒绝原假设的区间,它位于抽样分布的一端或两端的小区域内,根据小概率原理,当由样本算出的统计值落入此区域内时,则原假设被否定。反之接受域就是接受的区间,它位于抽样分布的中间区域内,若由样本算出的统计值落入此区域内,则接受。(C)双边检验与单边检验:拒绝域位于抽样分布两端的检验即双边检验。当拒绝域只集中在抽样分布的右端,则叫作右侧单边检验,如果是在左边就叫做左侧单边检验。一般来说,双边检验较单边检验更难否定,因此在提出备择假设时,最好说明方向。
<4>假设检验的步骤:
(A)建立原假设与备择假设。
(B)根据总体的分布形态和变量的测量层次以及样本的规模等,选择能反映的统计量和确立成立条件下的这一统计量的分布。(C)根据问题的需要,规定适当的显著性水平,并据此确立拒绝域或接受域。
(D)根据样本统计量的观测值进行判断,若其落入拒绝域,则拒绝原假设,接受备择假设,反之接受原假设。

<5>弃真与纳伪:在进行判断时,无论是作出拒绝或接受假设的判断,都不会百分之百的正确,都会有一定错误。(A)判断的第一类错误是弃真的错误:即原假设反映了客观世界的真实情况,但却在检验中被作为错误的看法而加以拒绝。犯弃真错误的概率为。
(B)假设检验的第二类错误是纳伪的错误:即原假设不是真的却被作为真的加以接受。
显然当拒绝时,犯弃真错误的可能性是很小的,而在接受拒绝时,犯纳伪的错误的可能性却很大。由此可知,和在假设检验中的作用是不等的。一般选择的是常规的已存的现象,没有充分的根据是无法否定的,而要把研究的看法或猜想作为备择假设,因为一旦备择假设被接受,那么它被否定的概率是很小的。由于社会研究一般是证实假设,即希望否定原假设,因此特别注意弃真的错误。弃真与纳伪这两种错误是相互对立的,即在一定条件下,弃真的错误增大时,纳伪的错误就会减少,反之也一样,完全消除两者的矛盾是不可能的,为了同时减少犯这两种错误的概率,一般采取增大样本容量的方法。

<6>假设检验的类型:(A)参数检验:要求总体必须具备某些条件。如分布,变量层次等。参数检验的优点:当总体充分满足所需求的前提条件时,在做假设检验时可以非常准确,但在社会研究中往往很难判断总体是否合乎要求。(B)非参数检验:不要求总体具备特殊条件,且适用于各种层次的变量,它不是检验总体的某些参数,如平均数、方差等,而是检验总体某些有关的性质。非参数检验的优点:适用范围广、计算简单,当样本容量增大时,其推论准确度可以增加。近年来,非参数检验获得了越来越广泛的应用。

(C)选用何种检验方法要考虑:(a)样本的个数与类型。如单一样本还是配对样本。(b)样本的规模。一般大于100个元素的样本为大样本,小于或等于100的样本为小样本(c)变量的测量尺度。

<7>参数检验:是对于总体参数的检验,当总体的分布形式已知,而且中的某些参数,如平均数、方差等为未知时,可以先对这些参数作出假设,然后从总体中抽出一个随机样本,根据对样本的观察资料对假设的真伪作出判断。常用的三种参数检验方法:

(A)Z检验:要求:(a)样本必须是随机抽取的。(b)变量必须是定距层次的变量。(c)总体应呈正态分布,不过当样本容量相当大时(n>100),这一要求可以放松。
可以用于以下参数的检验:
(a)大样本的总体均值检验:这时用于检验原假设的统计量(又称检验值)是。

(b)大样本的总体成数检验:这时用于检验原假设的统计量是,其中为样本成数值,为假设的总体成数值。(c)大样本的总体均值差检验:当甲总体的样本规模与乙总体的样本规模均大于100时,其平均数的差异可由Z检验值来检验,,分别为样本的平均数和方差,分别为的平均数和方差。原假设为:,备择假设为:(或,或)。

(d)大样本的总体成数差检验:在甲总体的样本容量与乙总体的样本容量均大于100时,其成数差异可以由Z进行检验,
,分别为样本与样本的成数。相应的原假设为:,备择假设为:(或,或)。
(e)G相关系数、系数的检验:G系数描述的是两个定序变量的相关程度与方向,若样本中G不等于零,我们就要检验在总体中G是否也不为零,即变量间的关系是真的。因此,原假设为:G=0,备择假设为,检验统计量,为同序对,为异序对,n为样本大小,G是样本的Gamma值。由于系数与G系数的计算公式中都是以同序对及异序对的差作为分子的,故均可通过=S的检验来推断总体的情况。

(B)t检验:要求:(a)被检验总体成正态分布。(b)样本必须是随机抽取的。(c)变量应为定距尺度的变量。一般说来,t检验多用于小样本。
可以用于t检验的参数有:

(a)小样本的总体均值检验:原假设为:,备择假设为:(或,或),检验统计量。
(b)小样本的总体均值差检验:统计量为:,而原假设为:。

(c)配对样本的比较:原假设为:。统计量为:,其中m为配对数目,;为d的平均数,为d的标准差。

(C)F检验:要求:(a)样本随机抽取。(b)有一个变量是定距变量。(c)要求各自总体均为正态分布并具有相等的方差。,E是样本的相关比率系数,n为样本的规模,k是分组数。
F检验一般用于:

(a)方差分析的检验:这时原假设一般形式为:(即各类间平均数相等)。备择假设为:有一个以上的类别平均数不同。检验的统计量为:,BSS为组间平方和,RSS为组内平方和。(b)对两个总体或多个总体的差异作检验:当样本超过2个时,一般采用F检验,这时原假设形式为:。

(c)r相关系数与回归系数的检验:计算相同系数r与回归系数b的公式具有相同的分子,因此对r的检验亦即对b的检验。此时,原假设与备择假设的形式一般为::总体中r=0,b=0;:总体中,检验统计量,n为样本大小,r为样本相关系数。这个检验统计量是以变量x和y成线性关系为前提的,两个变量若是非线性关系,这一方法就不适用了。
判断两变量在总体中是否有线性关系的方法:一般可用F检验值进行检验,此时:

:x与y在总体中是线性关系,即r=E

:x与y在总体中是非线性关系,即,检验统计量,k为x变量值的类别数,E为样本相关比率系数,r为样本线性相关系数。

<8>非参数检验(复旦97<简>:什么叫做非参数检验?
其适用范围和优缺点):(A)检验是目前统计中应用最广泛的非参数检验法,要求:(a)两个变量均为定类变量。(b)样本必须随机抽取。

(B)检验一般用于:

(a)列联表的检验:列联表通过将两变量交互分类,旨在发现其间是否存在某种联系,因此在对列联表进行检验时,原假设应为:变量x与变量y无关;备择假设应为:变量x与变量y相关。检验统计量:。公式中,为期望频次,可由边缘分布求得:。在查
分布表求临界值时,需要用到自由度的概念,统计量的自由度为:df=(r-1)(c-1)。当算出的值大于某一显著性水平下的临界值时,则原假设在这一显著性水平下被拒绝。在用值对列联表进行检验时,每一格值的要保持一定数目之上,若其中有的格值太小则有可能引起判断失误。一般要求在r*c的表中的格数不应超过20%,也有人认为所有格值不应小于10

(b)二分变量的相关测量,所谓二分变量就是取值只有两类的定类变量。对于2*2的列联表,可用值来测定变量间的相关,较为常用的有:第一,系数,(n为样本大小),其值在0-1之间。系数也可用于r*c列联表,但这时值会超过1,为克服这一缺点,设计出了V系数。第二:V系数,,其中n是样本的大小,m是表的行数r与列数c中的较小数,即m=min(r.c),V值由0-1。显然,在2*2表时,V=。第三,C系数,,其值最小为零,表示两变量完全无关,但其上限是可变的,最大不超过0.707,即使两变量完全相关,亦无法达到1。

(c)正态总体方差检验:这时原假设为:,检验统计量为,自由度df=n-1。

检验是检验两变量间在总体中关系的有无,而不是关系的强弱程度,因此显著的话能说明相关关系存在,但并不能说明这种相关关系在实际中是否重要。的统计显著性一方面受相关关系强弱的影响,另一方面也受到样本规模的影响,同样的相关强度,样本规模不同,就会具有不同的显著性水平,即使是一个很弱的相关,但只要样本足够大,也会具有统计显著性。因此,在大样本统计检验显著时,还需要进一步确定相关强度的高低,以确定这种相关有无实际意义。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十六章:变量分析的逻辑和策略

第十六章:变量分析的逻辑和策略

119、 分析的逻辑是指进行分析时所遵循的逻辑方法和推理过程,分析的策略指的是分析程序的设计及分析的技巧等。
掌握变量分析的逻辑与策略不仅能使资料分析更深入、更全面而且还能澄清和防止某些逻辑错误,是理论解释更符合实际,或发现新的理论和问题。

统计调查的变量分析最早是由法国社会学家杜尔克姆运用到社会研究中来的,以后经斯多弗、拉扎斯菲尔德、罗森伯格等人的发展与完善,已经形成了一套较系统的统计调查的资料分析模式----详析模式。

120、 变量关系的类别:
(1)变量间的关系:统计相关或统计无关。两个从统计上看无关或弱相关的变量,实际上可能的确无关,但也可能有关系,两变量间的这种统计上无关而实际上相关的情况,称为虚假无关。而两个从统计上看具有相关关系的变量,它们之间的真实关系有可能是:实际上无关、实际上相关、实际上具有因果关系。(2)统计相关的不同类型:

<1>统计相关,实际无关。这种情况称为对称关系或虚假关系,即从统计上看有关系的两个变量实际上相互独立、互不影响,并无有意义的联系。对称关系用符号表示为:。<2>统计相关,实际也相关。这种情况称为相互关系,所谓相互关系是指统计上相关的两变量实质上也是有关系的,这种关系是一种交互影响的关系,在这种关系中,两个变量相互作用、相互加强。有时,我们虽然明知有因果关系存在,却难于指出何者为因、何者为果,谁影响了谁,实际上是互相影响,互为因果。相互关系在调查中极为常见,符号表示为:

<3>实际的因果关系:这种情况是指统计上相关的两个变量之间实际上存在因果关系。因果关系是变量分析中所要探讨的最重要的课题。社会研究中所说的因果关系是指在两个变量中,一个变量的变化伴有另一变量的变化,即一个变量影响另一个变量,但是反过来不成立。在因果关系中,能够影响其他变量发生变化的变量称为自变量,依赖于其他变量,但其本身不能影响其他变量的称为因变量,后者通常是我们希望解释说明的变量。因果关系用符号表示为:。

判断因果关系的原则:<1>时间的先后。<2>变量的不变性与可变性。时间的因素固然重要,但并不是决定关系方向的不变的标准。在社会研究中常将一些具有固定性、持久性的变量作为自变量,如性别、年龄、民族等。社会研究中还有一些主要的变量,它们之具有相对持久性,如社会地位、居住地以及社会阶层等就属于这种变量。这类变量比行为、态度等变量更为固定持久,因而往往被当作自变量。<3>需要指出的是,这里所讲的因果关系,也称为非对称关系(即),它是指在特定条件下的两变量关系中,一个变量影响另一个变量,反过来,后者对前者没有影响。这种非对称关系于自然科学所讲的因果关系有一定区别,后者的定义要更严格一些。

121、 详析模式(北大93<名>;北大2001<论>:试举例说明详析模式的分析方法;北大2002<论>:试论述详析模式的方法和主要作用):

(1)两变量的交互分类:多数研究是从变量间关系的假设开始的。对两变量间关系进行描述的最基本的方法是交互分类法,又称列联表。

(2)引入检验因素。(A)检验两个变量间关系的最重要、最系统的方法是引入第三个变量,然后检查引入第三个变量后自变量与因变量原有关系得变化情况,由此澄清与深化对原关系的认识,并解释两变量的真实关系。这种引入第三变量对两变量关系进行检验,以解释或确定这种关系的过程叫做分析的详析化(浙大2000、2001<名>;南大2000<名>),被引入的变量叫做检验因素或控制变量。

(B)分表法:(a)首先描述变量X与Y的关系,这时的关系称为原关系。(b)依据理论或经验选择检验因素。(c)将检验因素分成不同层次或不同类别,然后在每一类别中做X与Y的分列联表,分表中X与Y的关系称为部分关系。(d)对各分表中X与Y的关系(部分关系)进行考察:(甲)若X与Y的原关系在各分表中消失了,证明原关系主要是由检验因素引起的;(乙)若X与Y的原关系在各分表中仍然存在(即各分表中X与Y的关系与原表相近),说明X与Y的关系不受检验因素的影响;(丙)若X与Y的原关系在各分表中存在但较原关系减弱,证明X与Y间的关系部分收到检验因素的影响。(3)详析模式的主要作用:<1>详析模式的一个主要作用是使调查研究可分享实验设计的一些优点。它是一种近似的实验设计。在详析模式中,控制的项目越多,则两个群体出了一个变量不同外,其他可能越接近相同。这样详析模式就使得调查近似于事后实验设计,从而成为社会科学中最有利的证明模式之一。<2>可以充分利用统计资料,并将研究引向深入,一方面能对变量关系作出描述;另一方面通过引入第三变量,他还可以澄清事实真相,包括两变量间关系的真伪、这一关系存在的条件和存在的原因等等,从而使变量间的关系更具体、更精确可靠。分析的目的在于解释,详析模式在解释上的贡献很大,不仅能证实解释,也能排除错误的解释,并能获得新的解释。因此它是建立理论和开发资料的有力工具。<3>在详析模式中,部分关系与原关系进行比较时,可出现三种情况:(A)关系相同。(B)关系减小或消失。(C)关系分列。即一些部分关系与原关系相似或加强,而另一些部分关系则有所减弱或完全消失。(A)(B)是一般关系分析的主题,(C)是条件关系分析的主题。

122、 变量关系的检验:
(1)虚假关系的检验(北大97<论>:试比较详析模式中,条件关系分析与变量关系检验的异同。北大2002<名>):两变量间的虚假关系是指两变量表面是一个非对称关系,但实际上是一个对称关系,两变量间并无有意义的或内在联系,他们之所以有关系是因为此两变量恰巧与其他某一变量相关联。造成两变量虚假关系的这"某一变量"就叫做外在变量。它与自变量及因变量的关系用图来表示就是:。所以,若某一变量为外在变量,则将其控制之后,自变量与因变量的关系应当消失。因此,根据理论或经验选定可能成为外在变量的变量作为检验因素,使用分表法将检验因素控制,就可以判断一个关系是否虚假。引入外在变量的最重要贡献是能够防止做出错误的解释。

举例:1845-1945年医学统计表明,在过去一个世纪中,精神病患者的比例大为增加。对于这一关系,不难做出下述解释:在过去一个世纪中,生活环境的迅速改变造成了严重的社会紧张,可能是这种社会紧张导致了精神病患者的增加。但是,引入年龄这一变量加以检验,发现二者虚假相关。进一步的解释:年纪大的人中老年性痴呆症增加,这种病是生理衰退而不是精神紧张造成的。医学进步使得人的寿命延长,也增加了老年人在人口中的比重,因此产生大量老年性痴呆患者。

上述例子说明,一个看起来精密的理论架构,就因为没有考虑到外在变量,事实上却是错误的。

引入外在变量的做法,能增进研究者对于这两变量间具有内在关系的信心,但不能完全断定这一关系是真的。因为它也许还受其他外在变量的影响。

(2)变量关系的具体化:社会学常常有些极为笼统的命题,它们的涵盖能力很大,但却无助于增进对问题的了解。为了使变量间这种笼统的关系具体化,找出一个复杂且涵括极广的自变量中对因变量起主要作用的因素,往往采用引入检验因素的办法。作为检验因素的就是自变量中被理论或经验推测为对因变量器主要作用的那个因素。能使变量件关系具体化的变量称为内含变量。

举例:杜尔克姆研究婚姻中哪个因素影响自杀率,包括性的满足、夫妻感情、不孤独等影响已婚者的自杀率。在这种情形中,两变量的关系是建立在涵括的概念上,但实际上这一关系确是由概念所包含的某个因素引起的,是总体"代表"了局部。用图示表示就是:。与此相反,还有另外一种情形存在,即关系是由某个因素引起的,但实际起作用的却是涵盖这个因素的更宽的概念,是局部代表总体。

(3)追寻关系产生的原因:在实际中常常碰到这样一种情况:变量X与Y之间的关系是另一变量A的"媒介"作用的结果,即X导致A,而A又导致Y,X通过A的作用产生与Y的关系,用图表示就是:。变量A对X与Y之间关系的建立起了中介作用,故称为中介变量。如果能证实X确经A影响Y,就可以说:X与Y关系之所以如此,是因为A的作用的结果。因此,将中介变量作为检验因素引入到两变量之间这一检验模式,可以说明自变量是如何影响Y的,即对变量关系发生的过程进行注释。指出中介变量有助于更进一步了解两个变量间的关系,如果不考虑这种中介因素,我们就会止于事实,而缺乏完整深入的了解。

(4)寻找因果次序:前导变量的引入可以说是源于社会学研究中对因果次序的探寻。,这里,A因素就是前导变量。前导变量的引入步实施自变量与因变量之间的关系消失,而是使它得到澄清。

举例:父亲的教育水平影响儿子的教育水平从而影响投票率。

检验一个变量是否为前导变量的具体做法是:注意检验这个变量能否满足下述三个统计上的条件,若能满足,则是前导变量,否则不是:<1>三个变量:前导变量、自变量、因变量,必须两两相关。<2>控制前导变量后,自变量与因变量的关系应不消失。<3>控制自变量后,前导变量与因变量间的关系应当消失。

(5)防止将真关系误判为假关系:两变量间真实关系不能表现是由于第三个变量的闯入抑制、取消或削弱了这一真实关系。这种使真实关系隐而不彰的或减弱的变量就叫做抑制变量。

举例:年龄抑制工人会龄与种族态度的关系。控制年龄后,会龄与种族态度的相关性表现出来。

一个抑制性变量在某种意义上是与外在变量相对应的。后者用于检验假设是否被当作真,他从假设两变量具有真相关开始,继而引入检验因素,此因素对原来的两个变量来说是外在的,假如发现原来的关系消失了,则称原关系是虚假的。而前者则用于检验镇是否被当作假,它从两个变量间无关系开始,然后引入检验因素,这个因素对原来的两个变量来说也是外在的,假如在每一个分表中出现了关系,则称原来的无相关是虚假的。

正像外在变量可以判断关系为假而无法断言关系为真一样,抑制变量可以判断关系为真却不能断定关系为假。但是外在变量虽不能判断两关系为真,却可以通过对多个外在变量的检验,加强它是真关系的信心。同样,抑制变量虽然不能判断两变量关系为假,但却可以通过对多个抑制变量的检验,加强它是假关系得信心。

(6)恢复变量间关系的真貌:歪曲变量是使两变量间真是关系扭曲、变形的变量,它既可以将真扭曲为假,也可以将假变为真,甚至完全改变一个关系的真实方向。因此,对歪曲变量的检验,能够将两变量间真是关系袒露出来,从而使研究者避免抛弃正确的假设或接受错误的假设。

123、 条件关系的分析:在利用分表发对分表中的关系与原关系进行比较时,我们发现这些分表中的关系或减弱、消失;或维持原状;或从无相关到有相关、弱相关到强相关;或与原关系的下相关方向相反。在这些情形中,我们假定所有分表中关系的大小与方向是相似的。但是,在有些情况下,各分表中的关系可能并不一致,即有的分标关系强、有的弱,有的分表是正相关,有的是负相关。在前一种情况下,由于所有分表中自变量与因变量的关系都相同(或相似),因此可以说这一关系是普遍的、无条件的。而在后一种情形中,自变量与因变量的关系因表而异,也就是说这一关系是有条件的,因此,我们称其为条件关系。这里所说的条件,可以是检验因素的不同分类、不同层次、不同阶段,以及任何具有分类意义的东西。

条件关系在社会学分析研究中作用很大,不仅可以帮助解释,对理论的建立做出贡献,还能说明、澄清两变量间的关系,促进对事物的了解;而且他对科学的主要目标之一:预测,也有重要贡献;它使得调查资料的分析更丰富、更深入、更正确。

(1)帮助解释:<1>促进修正原解释或发现新解释。<2>支持或强化原解释。<3>帮助选择正确的解释。对同一个现象,人们常常做出各种不同的解释,这些解释似乎都同样令人信服,都同样切合结果,使人难辨真伪。条件关系的检验往往能帮助分析者摆脱这种困境,选择恰当、合理的解释。<4>帮助发现隐而不彰的事实。在虚假无关中,由于各个分表中的关系方向相反,因而可以用两种方式进行解释。第一,分别解释,也就是对正关系与负关系各自做出解释。第二,整合的解释,即将两种对立的发现融合起来,只给出一个搞抽象层次的解释。<6>帮助了解事物发展趋势或过程。具体做法就是将时间作为检验因素。在横剖研究中调查资料大多是于某一时点或某一段时间收集到的,将他们用于社会动态研究颇受限制,但如果善于运用条件关系,就能在相当程度上解决这一困难。

(2)对关系进行说明、澄清及描述:所谓说明一个关系,就是将分表里具有特殊意义的关系指出来,并且指明这种特殊的意义。<1>清除原关系中的干扰因素。<2>明确指出加强或抑制原关系的一些条件。<3>可以说明两变量关系成立的必要条件。一般说来,所有的关系都是条件关系,即每一种关系都是在某种条件之下才成立。但通常研究中并不特别指出关系成立所应具备的条件,因为一般情况下他们的存在是内含的、公认的。然而在某些情况下,若能说明一个关系的同时,指出这种关系成立所必需的条件,则会增加人们对研究对象的深入了解,也使分析更加完整,条件关系可以完成这一使命。<4>条件关系可澄清自变量与因变量的本质。为进行实证的社会研究,必须将概念操作化,变成具体的指标或指数,然而这些指数与指标往往并不能精确代表概念,因此在解释指标时,常常超过或达不到这个指数或指标的范围,从而做出错误的解释。条件关系有时可以帮助分析者澄清调查资料所表现的指数的意义。<5>条件关系还可以使描述性的说明更精确。

124、 联合作用的检查:将第三个变量作为一个自变量,以了解它与原来的自变量以怎样的互动方式对因变量产生作用。这种作用就是联合作用。它包括四种类型:

(1)独立作用:如果将两个变量X与Y间的不对称关系用表示,引入第三个变量A,将其视为自变量并假设A与Y也存在着非对称关系,则变量间的关系就变成。X与A对Y的作用可分为:
<1>两个自变量在不受对方作用的下对Y的独立作用。<2>X与A对Y的共同作用。<3>X与A形成新的变量后对Y的作用。

独立作用又分为两种情况:第一,两自变量之间彼此无关,各自独立的对因变量起作用。
第二,两自变量彼此密切相关地对因变量发生作用,每一自变量在一定程度上反映着另一自变量。

(2)相对作用:假定每个自变量军对因变量有独立的影响,那么何者大?这就是所谓相对作用的问题。相对作用研究在社会学研究中有着极为重要的作用,许多理论问题可以从检验相对作用的大小获得解决。如:是教育还是经济对个人的生育行为影响大?

(3)累积作用:是指两个自变量对因变量Y的共同作用,这种共同作用并不一定是两个自变量各自影响力的单纯相加,决定其强度的因素很多,但其中以两自变量间的相关程度为最重要。累积作用的大小主要决定因素是两自变量间的相关程度。

(4)类型作用:有时两个自变量或其中某一自变量与因变量并不相关,然后当它们融合在一起时,却能够产生另外独特的作用,这种情形相当于两个自变量融合之后形成一个新的自变量,它是超于组成它的两个单个自变量之上一个新的实体为与原自变量区别,我们称这种变量为"类型"。"类型"与各个自变量的关系就像整体与部分的关系部分组成整体,但整体性质不等于个部分之和。

按自变量的融合方式,"类型"可分为四种:<1>特殊类型:指新生成的自变量的涵意不同于原来两个自变量的涵意。<2>修正类型:指新合成的自变量修改了原自变量的本质与特性。<3>一致---不一致类型:指新自变量由两个性质一致或两个性质不一致的自变量合成。<4>相对的类型:指通过两个自变量相互地位的比较所产生的新变量。

由以上介绍可见,详析过程式统计分析与理论分析密切结合的过程研究者不仅要运用缜密的逻辑推理,而且要运用理论的洞察力和想象力对调查资料中所反映的客观事实或现象间关系做出理论解释。因此,在现代社会调查中调查研究人员不仅要努力掌握先进的统计技术,而且更重要的是要掌握科学的思维方式和推理方法,提高对社会现象的分析能力和洞察力。

125、 调查分析的策略: (1)详析的程序:

<1>确定两变量间关系的类型。若两者相关关系较显著就要进一步分析它们之间的是对称关系、还是相互关系或因果关系,如果是相互关系,我们则要进一步检查其相互影响,比较两者谁是更具持久性和固定性的变量,以尽可能决定影响的主要方向。如果是因果关系,则要确定谁是自变量,谁是因变量。

<2>确定关系的真伪。分两种情况:(A)两变量统计相关:应考虑这种关系是否有内在的或有意义的关系是否受到某外在变量影响的结果。(B)两变量统计无关或相关不显著:要看其关系是否被抑制变量所抑制,特别是在理论和实际观察都表明他们有可能有关系时。当量变量间的原关系的方向与我们所了解的和理论所提供的方向相反时,就要考虑是否歪曲变量在起作用。

<3>将量变量间的关系具体化。确定两变量关系为真之后,则可检查内含变量,以使这一关系更具体。

<4>寻找变量间的因果链。进行中介变量的检验,目的是对这一关系做出说明。有时,我们可以进一步通过追寻前导变量来扩大因果链条。

<5>检查是否存在条件关系。许多有价值的资料都是由这一步骤获得的。
<6>进行联合作用的考察。进一步考察两两个变量是否存在独立作用。如果两变量彼此独立起作用时,就要进一步考察两者何者为大,此外还要考察累积作用。最后可检查两自变量是否可以建立一个新的变量类型。

需要特别指出的是:在调查分析中,两变量关系只是代表分析的开始,而非结束。实际上在详析的过程中,每一部的分析都会得到一些结果,这些结果会产生一些新的问题,需要进行进一步的分析。分析是一个不断探寻的过程,每一步分析都会产生一个新的问题,而须检验新的资料,进行新的分析,新的资料又产生其他问题,如此循环反复就使得我们对于调查资料的利用更加充分并进而导致对社会现象的认识不断深化。

(2)假设检验与概念追踪:在调查研究中,虽然假设检验具有极大的价值,但它并不是唯一的,有时甚至不是最主要的一种方法。这是因为即使假设是由理论抽离出来的,也能获得资料的支持,但资料并不能证明理论,资料只能给理论以支持,虽然研究的发现与假设所根据的理论一致,但这些发现也可能与其他理论一致。实际上,经验研究远远超出了检验理论的被动功能,它不仅仅是证实或反驳假设。如果能适当的运用其他一些分析的策略与技巧,经验研究在创造、改进、反思和澄清理论上也能发挥积极的作用。许多调查分析采用一种所谓"概念追踪"的分析方法,它是一个理论与资料动态地交互作用的复杂过程。概念追踪与纯粹假设检验模型不同。假设检验是由理论起,理论发展出假设,收集相关资料,然后检验假设一决定其是否获得支持或否定。概念追踪则是在理论与资料间进行互动,它由资料出发,资料常迫使理论家进一步对其加以解释,而这些解释与理论又指引适当的资料以进一步验证理论或使理论更为周密。

(3)偶然重大发现的利用:科学的历史充满了未曾假设的意外发现。实际研究中,这种以偶然或智慧获得发现极为重要,因此对于这种偶然性发现的警觉是研究策略的关键要素。这种意外地发现可以促使产生新的理论或对原有理论作出修正。有时意外发现的贡献不一定是突破性的,但对于资料的意外可能性保持高度警觉,研究这就能够更充分的利用这些资料,并增进对社会学理论与知识的贡献。

(4)证据的分析:任何科学的目的是达到概括论断,即由具体的事物得到一般的原则或模式。概括论断可分为两类:经验的与理论的,前者是指根据一些个案所得到的结果概推到较普遍的总体。而后者是指从各种不同情况中得出一般原则,在这种概括论断中,具体的变量被看作是较抽象的概念的一个指标。
由经验得到概括论断,应进一步加以确证,以增加他的可信度和解释力。对于经验型概括一般是通过复验进行证实的,
复验的主要方法有:

<1>将资料与来自同一或可比总体的其他样本作比较。<2>在不同的总体中作相同的经验性概括论断。<3>配对比较方法。

证实理论性概括论断的基本方法是选择代表同一概念的不同指标。杜尔克姆对自杀的分析提供了整理证据的卓越例子,他将许多经验性概推整合成单一的理论性概推,即高度的社会整合与低自杀率相关。将相同命题的证据累积起来就使其论点特别有说服力。需要指出的是,在验证理论性概推时,对于同一个研究与理论命题相关的一切资料都需要加以检查,而不能任意进行选择。

证据分析对于理论性概推的主要贡献主要有以下几点:<1>可以支持对结果的解释,由此可以产生更强有力和更有包容力的理论概推。<2>可以对某一理论的解释提出问题,从而使我们注意寻找更符合事实的其他解释。<3>可使在对原有结果的不同解释间作出正确的解释。<4>可在同一研究中进行验证,经验的概推除"配对比较"外,不可能在同一研究中对自身的结果进行验证。<5>有时能使我们对理论概推比经验概推在统计上更有信心。

(5)事后解释:是先有资料,然后再找符合它的解释。因此事后解释只是一种可信性的解释,而无法达到"证据确凿"的解释(高度肯定),即这种解释知识与一套资料相符而已。

事后解释的三大缺陷:<1>伸缩性过大,即对一种调查结果,可有多种解释。<2>不能将其完全抛弃。<3>无法以来外在的确证。事后解释因为是有了资料后才加以解释的因此无法肯定这一解释的正确性我们无法再检查资料以获得确证。

对于上述三大缺点,我们可以通过详析程序和证据分析程序部分加以克服。这两个程序都是由解释抽取出推论,然后将其付诸验证。因此,事后解释并非分析的结束而只是它的开始。社会调查研究中不得不使用事后解释,但在使用这种方法时,必须注意他所具有的局限性,必须运用上述的程序对他们进行处理。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十七章:多元分析概论

第十七章:多元分析概论

126、 多元分析的一般概念:(1)详析模式与多元分析:控制多个变量的方法与控制一个变量的方法一样,也可采用分表法,只是分表的层次更多而已。实际上,当变量数目超过4个时,由于表的层次过多、过大,使用这一方法是很困难的,特别是当要从一组因素去确定一定数目的变量,而且希望分析这些变量之间的关系时,困难就更大。为解决这一困难,所用办法是将上述的逻辑程序倒转过来,即"不摸索着去推断数据的结构性质",而是先提出某一结构的假设,然后考察这个结构是否真正符合数据。

(2)多元分析的类型和应用:<1>类型:(A)美国库利和柯尼斯按变量的组数和群体数分为下述四类:因素分析,复相关、偏相关和典型相关;多因方差分析;判别分析和聚类分析。(B)英国统计学家根据研究目的将多元分析方法分为两大类:相依性分析和互相依性分析。回归分析、判别分析、典型相关分析均属于相依性分析,他们的共同特点是分析所涉及的变量是不平等的,即有自变量与因变量之分。相依分析的目的在于分析多个变量对某个或某些变量的共同影响或相对效应。互相依性分析所涉及的变量是平等的,分析的目的是变量之间的相互关系,以简化这种相互关系。因素分析、聚类分析等均属于互相依性分析。

每一种多元分析方法都是建立在一些列假设前提的基础之上的,这些假设既包括这一方法所涉及的变量的测量层次,而且也包括这些变量间相互关系的性质,以及资料的不同来源等。因此,在选择一种多元分析方法时,应首先考察这一方法所要求的前提条件是否得到满足,若某些条件未获得满足,就要想办法进行某种统计处理,例如定类变量,可先将其变为虚拟变量后再引入回归模型。

<2>优点和局限:多元分析较之于单变量和双变量分析能更真实反映复杂的社会现象之间相互联系与相互依存的关系,但其局限是:(A)大多数多元分析方法都是在分析前先形成一个假设,然后再探寻与资料的符合程度,因此多元分析大多是与事先的理论研究密切联系在一起的,这就要求研究者具备很好的专业训练。此外,选择何种理论假设模型是由研究者决定的,这就是它很难避免研究者主观因素的影响。

(B)多元分析是一种高级分析手段,一般要求变量具有较高的测量层次,在社会研究中这种要求往往很难达到。为此研究人员利用许多统计手段将这些低层次变量转化为定距变量处理,从而使多元分析的影哟国内范围得到一定程度的扩大

(C)多元分析一般要求每一项记录来自同一时点和同一单位,这在大规模的社会调查研究中也是难于保证的,这就为进行同一时点上地区差异的分析和同一单位的历史变化的分析带来了困难。

(D)多元分析包括了高深的数学问题并涉及大量的数字处理与运算,随着计算机技术的发展和统计软件包的问世,这方面的困难有了很大克服。但当变量的数目太多,或设备缺乏以及受过专业训练的统计人员不足时多元分析方法实际应用仍受到很大限制。

(E)多元分析常碰到一个问题是对于结果的解释。由于分析中变量的选择,使用的分析方法是因研究者而异的,而且由于多个变量间相互作用的复杂性等,使得对于分析结果的解释要较之于双变量和单变量分析更为困难。

127、 相依性分析:

(1)多元相关分析:<1>偏相关:是指用一个统计值来测量当控制了其他变量的影响后,某一变量与另一变量间关系的有无和大小。根据控制的变量的数目,可以将相关分为:一阶段相关、二阶段相关、三阶段相关等等。
偏相关分析的要求:所有变量为定距变量,测量偏相关关系的统计值称为偏相关系数,其值由-1到+1。偏相关系数用符号表示,在r下标点前面的是欲测偏相关的两个变量的名称,点后面是控制变量的个数与名称。例如,表示控制变量Z后,变量X与Y的偏相关。为了简便起见,我们常把变量编号表示成如的形式,这是偏相关系数中的变量符号仅用变量的顺序号表示即可,例如用表示控制后,变量的偏相关。

一阶相关的偏相关系数:,式中的分别表示两个变量的全相关,它就是测量两个定距变量相关关系的皮尔森相关系数。实际上它是偏相关系数的一个特例,即控制变量个数为零时的偏相关,故又称零阶相关。一阶相关的偏相关系数的计算是建立在零阶相关基础上的,这是与偏相关分析的原理分不开的。偏相关分析的目的是排除其他变量的影响,以测量两个变量间的"净关系",式中是为排除其他变量的影响时变量对的全作用,但这种作用中有一部分可能是另一个变量的作用所致,分别表示对与对的影响力,则()就是从对的总作用中剔除所造成的影响后的净作用。同理,二阶相关的公式:。三阶相关的公式:

偏相关系数也可用于详析分析,具体做法:

(A)计算x与y的全相关系数 (B)引入检验变量A,计算x与y的偏相关系数。

(C)比较与,若=,说明x与y的关系不受变量A的影响;若=0,说明x与y的关系完全由A引起;若,说明x与y间的关系部分由A引起的。

分表法与偏相关系数法比较:(A)相同点:都是利用统计控制区除其他变量的影响,以揭示两变量统计关系的真伪,进行更深入的因果分析。(B)不同点:分表法适应于各种类型变量,除可对变量关系进行检验外,还可进行条件关系分析和联合作用分析。缺点是当类别很多、表很大时,这种直观分析方法困哪较大,而且为了保证分表中每个单元有足够的案例,需要的样本规模也较大。偏相关系数在这两个方面优于分表法,缺点是不宜于条件关系和联合作用的分析,应用范围受到限制。

若计算两个定序变量的偏相关系数,则采用Gamma系数。以一阶相关为例,具体做法:依据变量A的值将样本分组,然后分组计算个组中的同序对数和异序对数,则偏相关Gamma系数为:,其中控制变量A可以是定序变量,也可以是定类变量。当控制变量为两个或更多个时,计算偏相关系数的公式是相同的

当变量x与y均为定类变量(或一个为定类变量、一个为定序变量)时,应当采用偏(或偏系数)。具体做法是:根据控制变量的值将样本分组,以每组个案数与样本所含个案总数的比例为权数,计算各个分组的相关系数值的加权平均数,即:

其中是每组Lambda值,是每组个案数,N为样本个案总数。

<2>复相关:不是在对某一变量的众多因素中区别出某个变量的单独作用,而是用一个统计值来测量多个变量对一个变量的共同作用。复相关系数用符号:表示,在r下标的点前面是被作用变量的名称,点后面的是作用变量的个数与名称。复相关系数值在0到1之间,其平方值称为决定系数,具有消减误差比例的含义。其原理是线引入变量,以其来尽量解释y,然后再引入,以其尽量解释所剩余的误差,然后再引入依此类推,则所代表的是对y的最大解释,其平方根,即复相关系数,就是各个x与y的最大相关。

复相关也要求所有变量均为定距变量,其相关系数的计算也是以皮尔森相关系数为基础的。两变量()与某一变量(y)的复相关系数为:,将偏相关系数的值按上面所讲的公式带入本式,可得:其中为变量两两全相关系数。同理可得三个变量()与某一变量y的复相关系数计算公式:。即每高一阶的复相关系数可以低一阶复相关系数为基础计算出来。

当变量不全为定距变量时,要进行复相关分析,必须先将定序或定类变量转换为一组虚拟变量。转换的方法:如果是一个二分变量,则只要将赋予其中一值
1分,另一值0分,这一定序或定类变量就转变为定距变量了。统计学上将这种由非定距变量通过赋值0与1两值而变为定距变量称为"虚拟变量"。虚拟变量因为是定距变量,因而可以运用复相关分析。

<3>典型相关:是一种分析两组变量之间的相关关系的方法,它所测量的是两组变量的最大相关。其基本原理是利用标准化直线方程分别将每组变量组合为一个典型变量,然后计算这两个典型变量的相关。例如有5个x变量与3个典型变量,其对应的典型变量是:其中表示变量的贡献;表示变量对其典型变量的贡献。

建构典型变量的准则是使两者间的相关系数最大,称为第一典型相关系数。因此,典型相关就是两组变量的线性组合的最大相关。应当指出的是,因为每个变量组都有多个变量,第一典型变量不能完全解释所有误差,故而还应做第二次组合,这次组合的准则是:(A)第二对典型变量的相关也是最强的。(B)第二个典型变量与第一个典型变量无关,即。由此可得第二个典型相关。同理可得第三对典型变量和第三个典型相关。

典型相关要求所有变量均为定距变量,典型相关系数值在0到1之间,其平方值具有消减误差比例的含义。显然,当两组变量中某一组变量的个数为1时,典型相关就是复相关。

当资料是由概率抽样调查获得的,则无论是偏相关系数、还是复相关系数或是典型相关系数均要进行假设检验。

(2)多元方差分析:是对多个定类变量与一个定距变量关系的分析,他是由相关分析到因果分析的一个过渡。多元方差分析与一元方差分析的原理一样,都是将总方差分为两部分:消减方差和剩余方差,通过计算F值和相关系数E的值来检验和测量定类变量对定距变量的作用。不同的是,多元方差分析定类变量的数目增多,因此分析内容较多。

(3)多元因果分析:通常采用建立因果模型的方法,所谓建立因果模型就是利用统计手段将变量间的因果关系用一个或一组数学方程式表达出来。在社会研究中因果模型受到高度重视,主要原因在于它与实际估计模式参数的方法论结为一体,从而为人们提供一种以高度可读性因果图表去表述理论的手段。因果模型所用技术一般具有某种可对理论进行检验的、精确严格的假设式演绎方法。最著名的因果模型是多元线性回归分析模型。此外还有路经分析模型和对数线性分析模型等。在这些模型中因果关系一般是某一特定时间内个体单位数兴建的一种非对称关系,而不是一定时间内有序时间的相互关系。

<1>多元线性回归:它是社会研究中多个变量之间数量关系最简单的表达方式,是研究两个或多个自变量与一个因变量之间的线性关系的方法。所谓线性关系是指定量表达式的各项之间是可加的,所以这种表达式又叫做线性可加模型。其中:为y轴的截距。为当保持不变时,变化一个单位,的变化量。其他类推。称为偏回归系数。为当一定取值时,随机变量y的平均数。

多元线性回归出要求自变量间的关系是线性可加的之外,还要求所有变量均为定距变量。和相关分析不同,不得将一组虚拟变量均引入回归方程,必须放弃其中一个虚拟变量,否则回归系数无解。

根据抽样数据建立的多元线性回归,必须经过F检验,以确认回归直线以及每一个自变量偏回归系数的建立。由于抽样误差的可能性不会大于给定的显著性水平,从而以最大的限度保证了所建多元直线方程和偏回归系数的可靠性。

在多元直线回归中,我们要计算复相关系数,即全部自变量与因变量的相关程度。决定系数表示使用所确立的多元线性回归方程解释y时,所能减少的误差的比例,其值越大,表示多元回归对y的解释力越强。

决定系数是鉴别多元线性回归方程品质的一个非常重要的指标,如果决定系数过小,表示在所使用的回归方程中很可能遗漏了某些重要因素。在此情况下,不仅表示所选择的自变量意义不大,而且很可能破坏了使用多元线性回归的假定,从而使所求得的偏回归系数有误。但也不能由此采用相反的做法,即引进的自变量多多益善。实际上如果引进了许多与y无关的变量或彼此间相关性很强的自变量,都会引起所求回归方程偏回归系数的失真或甚至无解。为了判别在多元线性回归中应引进哪些自变量,那些自变量更重要,从而应先引入方程,常采用逐步回归的方法。但是任何一种统计技术或计算机程序都是由人去操作运用的,他们不能代替人的思考。只有当对现象的本质和内部联系有了一定的认识之后,才能考虑某种确定的统计工具。否则,轻率的选择某种统计工具,或者干脆靠计算技术出来代替分析,所的结论都是不可靠的,甚至是危险的。

多元线性回归除了适用于多个自变量的情况外,还适用于虽然自变量只有一个,但它与因变量的关系却是非线性的。例如:即x与y的关系是一个多项式的关系。实际上,只要将、当作不同变量,就可以将上述多项式回归转化为k元线性回归。

回归分析不仅在横剖因果研究中得到广泛应用,同样在纵贯的时间系列分析中也有广泛的应用。把回归分析运用于社会分析时,还要注意因果联系中的滞后效应。

<2>逐步回归:它不是首先建假想模型,不是一次将我们认为对因变量有影响的因素作为自变量引入回归方程,而是逐步引入,若引入的自变量对因变量有显著影响,就将其保留;反之则将其去掉。这样,最后得到的回归方程之中只包含那些对因变量作用显著的自变量,而未引入回归方程的其余因素,增加任何一个对回归效果都没有显著的改进。

逐步回归的具体步骤是:

(A)确定有可能影响因变量y的自变量,假定在某项研究中我们确定了5个自变量。(B)计算每个自变量与y的皮尔森相关系数,然后从中选出与y相关性最强的自变量引入方程,假定最大,则应被引入回归方程:即(C)逐一考虑其余变量与已被选入回归方程的变量对y的共同作用,即计算复相关系数,并从中选出相关最强的自变量进入回归方程,假若最大,则应被引入,得到二元线性回归方程:。(D)同第三步一样,逐一考虑其余变量与被选入变量对y的共同作用,再从中选出复相关最强的自变量进入回归方程,依此类推。在每引入一个自变量后,都须进行F检验,以确定引入后回归方程对于y的解释是否显著增加,若达到研究所要求的显著度,则保留该步中引入的变量,否则将其舍弃。通过逐个引入自变量注册检验最后所得到的回归方程包含的都是对因变量作用显著的自变量,这些自变量的重要性与其被引入的次序相同,即最先引入的变量最重要,其次被引入的第二重要。显然,逐步回归中进入回归方程的自变量多个数多少与研究所要求的显著性水平有关。

逐步回归不仅可以从众多的自变量中找出一些最重要的自变量,从而使研究得以简化,而且当个自变量之间相关程度较高时,使用一般线性回归方程将会出现系数失真或无解情况,逐步回归通过自动的放弃一些变量,从而避免了上述问题。逐步回归可与一般回归混合使用。

<3>路径分析:一般回归分析和逐步回归分析都是研究多因一果型关系,路径分析则是对多层次因果关系的分析方法。

与一般回归分析不同,路径分析不使用一个而是用一组线性回归方程刻画多个变量之间的关系,对于各因变量的分析不仅要分析其受直接作用力的大小,也要分析其受间接作用力的大小。此外,路径分析也不同于逐步回归分析,它不是寻找一个有效的因果模型,而是以一个有效的因果模型为出发点,这一因果模型其实是一个内容复杂的假设,然后用资料验证这一假设。

<4>对数线性分析:由L.古德曼(Goodman)所首创,多用于自变量与因变量均为定类变量的多元因果分析。分析时先将数据制成列联表,再将列联表中所有格值分别取对数,这也也是本法称作对数线性分析的缘故。因为取了对数,各自变量对格值的影响就可以看成是线性可加的了,然后以各种模型与调查结果进行拟合检验,以确定最佳的模型分析。

对数分析不仅可对因变量每一自变量间的直接关系及美对自变量间的关系进行分析,更重要的是可对三变量或多个变量之间的关系,即对变量间的多种交互作用进行分析。

(4)判别分析:目的就是描述由几个已知类别得来的对象的差异性,试着寻找一"判别物",依其将这些群体分离。在判别分析中,作为判别物的是由若干判别因子组成的线性判别函数:其中称为判别系数,表示各个判别变量的贡献,它是由过去的资料求得的。

判别分析中,判别变量均要求为定距变量。

128、 互相依性分析:目的是研究多个变量之间的相互关系,从中找出一个简单的结构。常用的方法有:(1)聚类分析:是一种分类技术,它是依据研究者的理论或对变量的实际相关情况将变量分类,然后测量这一分类方式是否有效。分类是人类认识世界最基础的手段之一,但在古老的分类学中,人们主要是依靠经验进行分类,聚类分析则是依靠科学的定量方法进行分类,因而更精确可靠。

在社会研究中,一个概念往往要通过一组指标(或变量)来进行测量,但这些变量往往并不是互不相关的,有些变量甚至呈现出很高的相关性,因此可通过聚类分析将变量聚合为若干类,从而使我们能更清晰地了解问题。聚类分析适合于各种测量层次的变量。

根据聚类的准则,可分为两类:

<1>距离法:通过变量间的距离量度变量的相似性,距离越短,相似性越佳,越可合并为一类。在距离法中,变量被看作多维空间的一个点,则两变量的欧氏距离为:其中表示变量之距离,表示第K个个案在上的观测值,为第K个个案在上的观测值,n为个案数。

根据计算的距离,通常采用谱系聚类法将变量间的关系理顺成谱。其基本思想是先把P个变量各自看成一类,然后选择距离最小的合并为一新类;再计算新类和其他类的距离,然后将距离最近的合并为新的一类;这样每次减少一类,直到所有变量成为一类为止。

<2>相关系数法:是通过变量间的相关系数来量度聚类中变量的相似性的,相关系数越大,相似性越佳,越可合并为一类。相关系数不限于适用于定距变量的皮尔森相关系数r,如果是定类变量,可采用系数或系数等。相关系数求出后,仍采用谱系聚类法进行聚类,但与距离法不同的是首先将相关系数最大的合并为一类,然后再逐步合并,直到所有变量成为一类的谱系图。

谱系图作出后,应将变量分为几类为宜,一般用归类系数进行判断:归类系数应大于1。通常要求归类系数,作为分类的标准。对于所分类别还应作出社会学的解释,这样聚类的结果才有意义。

以上介绍了变量群的聚类分析,它又称为R型聚类分析。但如果研究个案群的归类,则称为Q型聚类分析。

(2)因素分析:也是旨在简化大量变量之间的关系的方法,但它不是像聚类分析那样,将这众多的变量归成少数几类而是从众多变量的相关变量中抽取若干共同因子。

(3)最小空间分析:是一种较新但极有发展潜力的分析方法,可适用于各种尺度的变量,最小空间分析以相关系数为基础,通过绘图的方法来简化多个变量之间的相互关系。多个变量之间的相互关系,可用一维空间来表示,也可用二维空间或多维空间表示,空间越大,情况越复杂,最小空间分析就是要找出一个最小而又最能代表实际情况的空间达到简化变量间关系得目的。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十四章:资料整理

第十四章:资料整理

109、 资料分析(复旦96<简>:理性分析与统计分析有什么关系与区别):资料分析不仅决定着收集到的资料是否有价值,而且能够很好的检验假设和理论,或者适当地回答所研究的问题,还能够以可以理解和令人信服的形式描述研究成果。通过分析,研究者可以将认识从具体提高到抽象、从个别提高到一般,并可从中发现新问题、提出新假设,将研究引向深入。在某种意义上来说,分析的水平决定着整个研究的水平。(1)社会统计学:是有关社会资料收集、整理、分析和推论的一整套方法,它不仅包含全部抽样理论、统计检验理论和大部分的社会测量法,而且使分析技术获得极大的发展,主要是多元统计方法的发展,如路径分析、因素分析等。

110、 资料整理:就是对收集到的原始资料进行检查、分类和简化,使之系统化、条理化,以为进一步分析提供条件的过程。因此,资料整理既是资料收集工作的继续,又是资料分析的前提。

111、 定性资料的整理:
(1)资料的审查:目的是消除原始资料中的虚假、差错、短缺、余冗等现象,以保证资料真实、可信、有效、完整、合格,从而为进一步整理分析打下基础。对定性资料的审查主要集中在真实性、准确性和适用性上。<1>真实性审查:也称信度审查,即看资料是否真实可靠的反映了调查对象的客观情况。方法:(A)根据已有的经验和常识进行判断。(B)根据材料的内在逻辑进行核查。(C)利用资料间的比较进行审核。(D)根据资料的来源进行判断。
<2>准确性审查:也就是效度检查,一方面是审查收集到的资料符合原设计要求及对于分析所研究的问题有效用的程度。另一方面是审查资料对于事实的描述是否准确,特别是有关的事件、人物、时间、地点、数字等要准确无误,切忌事实资料含混不清,模棱两可,数据资料笼统模糊。<3>适用性审查,也就是考察资料是否适合分析与解释。主要包括:资料的分量是否合适、资料的深度与广度如何、资料是否集中紧凑是否完整等。<4>对于文献资料的分析评价,首先是进行所谓的"外在批判",即审查:是在什么地方、什么时间、什么人、为什么目的、用什么方法编写这些文献的。<5>还要进行"内在的批判",即了解资料的编写者表达的什么内容,在什么条件下编写这些资料,内在批判要注意:(A)对作者适用的词,特别是多义词,价值语进行反复的推敲。(B)在文笔的表现上特别要区分"事实"和"对事实的解释与推论"。(C)要进行多方面的研究,看作者是否真实的反映了客观事实,资料的叙述是否正确,有无夸张扭曲,或偏执于一家之言;叙述是否准确,叙述者写作上的表现能力如何等。<6>实地审查:是在搜集资料的过程中进行的,边搜集边审查。<7>系统审查:是在资料收集完毕后集中进行的审查。<8>测不准效应:指由于观察者的参与,改变了被观察对象的自然状态,被观察者或单位可能做出种种假象来掩饰事实的本来面目,使真实状态的测定不可能了。
<9>棱镜效应:指社会现象的感知和解释都要通过观察者这面棱镜,通过它的价值标准和以往的经验再折射出来,从而使观察资料不准确。

(2)资料的分类:分类是将资料分门别类,使繁杂的资料条理化系统化,为找出规律性的联系提供依据。<1>确定分类标准:分类的关键在于选择和确定分类标准。分类标准的选择往往是基于某种假设或理论,本身就是对所研究问题的一种分析和认识。分类标准可分为:(A)品质标准:就是反映事物属性差异的标准。例如性别、民族、企业所有制等。
(B)数量标准:就是反映事物数量差异的标准。例如以人口作为划分大中小城市的标准。<2>确定分类标准的原则:(A)有效性原则:(a)这一分类方式对于研究目的是有效地。(b)这一分类能有效的反映现实社会现象。(c)为此,分类必须服从于研究目的,必须能反映现象的本质特征。(B)互斥性原则:指分类标准应当互斥,以使同一条资料只能归于一类。(C)完备性原则:指分类标准的确定应当使每一份资料都有所归属。(D)各类别必须处在同一分类层次。

<3>资料分类的方法:(A)前分类:指收集资料前就已定下分类标准,然后按分类指标收集和整理资料。(B)后分类:指在资料收集完成后,在根据资料的性质、内容和特征分类。定量资料一般采用前分类,定性资料一般采用后分类。

<4>分类的功用:<1>指出社会现象或社会单位的类型。<2>反映总体的内部结构。<3>分析社会现象之间的依存关系。

(3)资料的汇总和编辑:基本要求:<1>完整和系统;<2>简明集中;<3>拉扎斯菲尔德提出以下操作步骤:(A)定义对个案进行分类的标准。(B)决定在各个个案记录的指标中登载于这一分类标准上的项目或与这一分类有关的项目。(C)根据各指标在标准上的位置,给予数值和符号。(D)为了决定表示各个案位置的最终指数,要汇总各个案记录的分数。

112、 定量资料的整理:
(1)资料的审查:<1>完整性审查:(A)资料总体的完整性。(B)每份资料的完整性。<2>统一性审查:首先是检查所有问卷、报表登记填报方法是否统一;其次要检查对同一指标的数字所使用的量度单位是否一致,以及不同表格对同一指标的计算方法是否统一等。对于统计资料的统一性审查包括:(A)审查指标的定义和分组的标准是否与自己研究的分类相一致。(B)审查指标统计总体范围是否一致。
<3>合格性审查:(A)提供资料者的身份是否符合所规定的调查对象的身份。(B)所提供的资料是否符合填报要求。(C)所提供的资料是否正确无误。方法:(a)判断检验。就是根据已知情况判断资料是否真实正确。(b)逻辑检验。即从资料的逻辑关系来检验其是否正确真实。(c)计算检验。通过各种数字运算来检验各项数字的正确性。<4>整个审查要经历三阶段:(A)由调查员进行审查。(B)有现场专职的检查员进行检查。(C)调查结束后由调查组织机关的检查员进行检查,重点是检查回答登记错误,计算错误及调查员是否对英调查对象均进行了调查,有无作弊等。

(2)资料的分类和编码:<1>编码(复旦98<名>):就是将文字资料转化为数字形式的过程。编码的目的使用一组变量表示各项调查问题,用每一变量的不同取值表示对这一问题的不同回答,从而使文字资料转化为数字形式。<2>编码步骤:(A)对回答进行分类。(B)建立回答类别与变量数值之间的对应关系。(C)注意:(a)对于开放性问题,因实现不能预料到答案的情况,故无法在设计问卷时事先分类,这时,编码就要从对问题的回答进行分类开始。(b)一般的讲,开始时分类可细一些,当分析不要求过细的分类时可以将某些类别进行合并。分类的多少还要考虑统计分析方面的问题。(c)任何调查都不免有一些回答这对一个问题不做任何回答的情况,为此对问卷中的每个提问要增加一个无回答编码。对无回答编码的原则是明确区分无回答与其他回答,通常的习惯是用9或几个9来代表无回答。对无回答的项目,不能一概简单地认为是缺失数值或回答率低。统计缺失数据时,应结合回答人的情况分析。如行政人员不回答"技术职称"是正常的。

<3>编码项目:问卷编号、问卷所属区域或部门、其他要进行统计的分类标准。
<4>编码方法:(A)预编码:方法是在设计问卷时对回答的每一个种类都指定好其编码值,并印在问卷上。预编码主要限于回答类别事先已知的问题,这些问题主要是封闭性问题,或回答已经是数字而不需要做转换的问题。优点:处理资料时比较简单,省时省力。缺点:无法用于开放性回答,因为我们无法事先知道回答的种类。(B)后编码(南大2000<名>):是指对问卷的编码过程是在问卷回收之后进行的,而不是与问卷设计同时进行的,多用于对开放性问题的编码。比较费时费力。(C)边缘编码:实际上是一种预编码方法,它与一般预编码的不同之处在于,这种方法不仅指定了编码值,而且给出了每个项目记录回答的空间,现在应用得最多。边缘编码是在问卷上每个调查项目旁边的空白处标明填写编码的位置。问卷回收后,将每份问卷上的回答变成指定位置上的编码。(D)编码簿:用以指示每个编码的意义和变量的位置。作用是建立变量和调查内容、变量值与回答类别的一一对应关系。它可以(a)作为编码工作的指南。(b)使研究者在分析过程中便于查找变量及各种编码所代表的意义。(E)编码簿的主要项目:(a)问题号码。是在调查表或问卷上的问题的题号,有了题号就可以知道这一题目在资料卡片上的哪几列。(b)变量号码。有了变量号码,研究者可以知道变量的代号,方便分析计划的拟定,在分析时直接饮用变量号码而不必提及变量名称。(c)项目名称。又称变量名称,用概括性语言表明项目的含义。(d)编码的内容说明。即给出每一项目问题答案的分类以及分配给每一类别的数字。(e)列序号。即每一项目应当占哪几列。

(3)资料的登录:<1>个案登录:即将各个调查对象的全部数据资料以编码的形式记录在一张张卡片上,即建立个案档案。<2>总体登录:即将所有调查对象的全部数据记录在一张资料卡片上,这种方法适用于为电子计算机处理作准备。

(4)资料的汇总:就是根据研究目的,对分类后的各种数据进行计算和加总,汇集到有关的表格之中,以集中系统地反映调查资料总体内部的数量情况。汇总的目的:<1>初步了解数据的分布情况。<2>为编制次数分布表作准备。<3>为深入的统计分析作准备。<4>便于保存调查资料。

113、 计算机处理资料的一般过程。(1)输入前的准备:<1>资料的审查。<2>资料的分类与编码。<3>登录,即将问卷中的回答转录到资料卡片上。一般将编码、登录与数据输入过程结合起来,为此,越来越多地采用也边编码的方式。(2)输入数据:指通过对计算机输入设备的操作,将资料卡片中的资料送入计算机贮存起来,以备调用。输入方式:<1>键盘输入;<2>卡片输入;<3>光电输入。(3)资料的净化(复旦98<简>:对录入的数据进行检查的主要方法):<1>幅度检查(北大99<名>):使用一个自编的简单程序或者已有的统计软件可以将某一变量的分布显示出来,这样就可以检查出一部分错误。例如,变量性别的取值只有两个-----1(男)、2(女),因此,5和8是违规数字。这样,我们首先了解到,性别这个变量的数据有错误。然后,我们可以变出一个程序列出含有性别变量的违规值的学生的编号,通过核对问卷,就可以知道这些违规值是如何出现的,以及如何修正了。<2>逻辑检查:利用变量之间的逻辑关系来净化资料。(4)数据的处理。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十三章:文献法

第十三章:文献法

103、 文献法(南大2000<简>:通过分析历史文献,可以建立社会骚乱、经济衰滞、政治腐败之间的关系。请给出一例):在严格意义上文献法并不是一种资料收集方法,而是一种研究方式---------即既包括资料的收集方法也包括对这些资料的分析方法。它不是直接从研究对象,即人那里获取研究所需要的资料,而是去收集和分析现存的、以文字形式为主的文献资料。

104、 文献的类别及来源:(1)文献:指的是包含我们希望加以研究的现象的任何信息形式。(2)类别:根据文献具体来源的不同,分为个人文献(主要指个人的日记、信件、回忆录及自传等)、官方文献(主要指政府机构和有关组织的记录、报告、统计、计划、信函等)及大众传播媒介(主要指报刊、电影、电视等)三大类。也可以分为原始文献(或第一手文献。指的是有亲身经历某一事件或行为的人所写的资料)和第二手文献(文献学上称二次文献。是利用别人的原始文献所编写或产生出的新的文献资料)两大类。
(3)利用官方统计资料应注意:<1>应该对统计资料的内容、对象、范围、特点等等都具有清楚明确的认识。<2>对于各种统计指标、比率和数字的实际含义、他们的计算方法等等应十分清楚,不能含糊。否则就会出现错用资料的情况。

(4)历史文献:往往是指那些再形成的时间上举目前较远并且文献的作者以及所记述的时间和运动的当事人都已去世的资料。在通常情况下,历史文献更多的为历史学家所运用。

105、 第二手分析:(1)定义:也称二手分析,指的是对那些由其他人原先为别的目的收集和分析过的资料所进行的新的分析。<1>一种是从别人为研究某一问题而收集的资料中,分析与该问题所不同的新的问题。即把同一种资料(已有的,别人的研究所收集的资料)用于对不同的问题的分析和研究中。<2>另一种类型则是用新的方法和技术去分析别人的资料,以对别人的研究结果进行检验。即用不同的分析方法处理同一种资料,看看是否能得出同样的结论。(2)第二手分析的步骤:<1>选择研究主题:适用于第二手分析的主题可以使相当大的,它有时仅仅只能采用那种在一个国家规模上所得到的数据资料。通常,在研究设计中,要留有一定余地,以便一旦发现相关的资料中并不具备你所想要得各种特征时,就可以稍微修改你的研究设计,以保证与可用资料的一致性。在主题与资料的关系上,第二手分析往往要求主题去适应资料,而不是相反。这主要是因为数据资料是已定的,无法变动的,研究者只能在处理和分析资料的方法上、技术上动脑筋。而研究主题则是可以随时调整的。<2>寻找合适的资料。最好的途径是阅读一份相关的研究。当发现一组对你似乎十分有吸引力的数据资料时,你可以仔细地阅读论文的资料部分对资料的内容、收集方法等等的描述。如果是在一本著作中发现这组资料的,那么,书中一般都有介绍资料的收集方法和过程的专门章节。此外,在书后的附录中,还可以找到诸如问卷、指数计算方法等详细的信息。<3>对资料的再创造。首先,必须从资料中寻找或重新定义所要研究的变量。其次,应该仔细地研究这些变量。最后,你也可以掷去样本中的一部分作为分析的对象。<4>分析资料。第二手分析的最主要也是最大量的工作,就是对资料的重新分析。

(3)第二手分析的优点:<1>省时省钱又省力。<2>特别适合于比较研究和趋势研究。(4)第二手分析的缺点:其缺点主要在于资料的准确性和适用性。某个研究者为其特殊的目的所收集的数据资料不一定与另一研究者的研究旨趣相符;而二手分析研究这所需要的资料有可能完全搞不到。实际上,这样的资料对于第二手分析研究人员来说,效度是较低的。即原始问题所测量的并不是二手分析研究这所希望测量的变量。

106、 内容分析(人大97<名>;南大97<名>):是这样一种研究技术,它对各种信息交流形式的明显内容进行客观的、系统的和定量的描述。所谓"各种信息交流形式"指的是各种书面材料、宣传品和艺术品。所谓"明显的"是指这些形式外在的东西。"进行客观的、系统的"描述,意味着内容分析是一种规范的方法。它要求研究这根据预先决定的计划,采取一定的规则,按照一定的步骤来进行。而"定量的"描述则说明内容分析方法的基本性质。它意味着,在内容分析中,其主要目标通常是决定内容中某一项目的频数,或者决定某一类别在整个内容中所占的比例等。此外,还对这些定量的结果进行分析。
(1)内容分析的步骤:<1>抽样:通过抽取有代表性的样本的方法,来达到研究全部对象的目的。<1>编录:即根据特定的概念框架,对信息-----无论是口头的、文字的、画面的或是其他形式的------作分类记录。与编录有关的问题有两个:(A)选择编录单位:即选择具体的观察和点算单位。要注意把它与分析单位加以区别。(B)制定一份编录单:编录单是对文献材料进行观察和记录的工具,在某种程度上,它同结构式观察所用的记录但十分相似。它的形成和结构将主要依赖于编录单位的选择。一旦选定了编录单位,研究这就要为他们制定和赋予数值。分类的基本要求是要满足互斥性和穷尽性。

(2)内容分析的类型(?北大2000<简>:简述比较研究法的主要类型):<1>计词法:是内容分析中最简单、最常用的方法。这种方法是,首先确定与研究问题有关的关键词(记录单位),然后统计这些关键词在各个样本(分析单位)中出现的频数和百分比,最后进行比较。<2>概念组分析:有时,使用主题作为记录单位不易划定主题的界限。此时,可以利用概念组分析。它是将与研究内容有关的关键词分成小组。每组代表一个概念,同时也是理论假设中的一个变量。这种方法记录的单位仍然是单词,但分析时的变量却是概念组。
<1>语义强度分析:首先是给出词汇的"强度权",已显示他们在使用时的差别。强度权是由词汇的语义所决定的,如"爱"比"喜欢"的加权数高。(3)内容分析的优点:<1>省钱省时。<2>保险系数大。<3>允许我们研究在一个长时期中所发生的过程。<4>是一种非干扰性的研究方法,不会打扰我们的研究对象,不会对这些研究对象发生影响。(4)内容分析的缺点:<1>只局限于对记录下来的信息进行分析和研究。<2>资料的效度也存在一定的问题。

107、 现存统计资料分析:(1)步骤:<1>选择合适的资料。许多研究常常要求大量的聚集资料与此相适应。<2>处理资料。我们通常所能做的,是比较那些基于较小的单位。<3>说明资料来源。以使得这种资料能够被理解。否则别人就会对你的证据的可靠性和准确性产生怀疑。(2)效度和信度:逻辑推理和重复验证这两条科学的原则,对于保证现存统计资料分析的消毒来说是极其重要的。现存统计资料的信度在很大程度上依赖于统计资料本身的质量。

108、 文献法(南大98<简>:文献分析法与闻讯方法相比有那些突出的特点):(1)文献法的优点:<1>具有无反应性的优点。<2>费用较低。<3>可以研究那些无法接触的研究对象。<4>适于作纵贯分析。(2)文献法的缺点:<1>许多文献的质量往往难以保证。<2>资料不易获得。<3>许多文献资料由于缺乏标准化的形式,因而难于编录和分析。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十二章:实验法

第十二章:实验法

89、 社会科学研究现象之间相互关系的方法有两种:实验法和相关分析法。后者主要限于对过去的统计资料进行处理,它一般对研究环境很少控制。实验法则是在研究现场中进行,资料搜集与研究过程同步,它对研究环境实行一定的控制,因此实验不仅可以根据原因去预测结果,而且还可以通过控制原因去发现预期的结果。(1)实验法的主要特征就是控制情景和变量来研究社会行为和社会现象的变化,以建立变量间的因果关系。(2)实验分类:<1>实验室实验:它限于在有专门设备的实验室中进行,并对实验的条件、控制以及实验设计都有严格的规定。<2>实地试验:它一般在实际场所中进行,它的实验设计并不很严格。

90、 实验法的基本原理:实验研究的目的是建立变量间的因果关系。实验法的基本原理:首先以一个理论假设为起点,这个假设一种因果关系的陈述,它假定某些自变量会导致某些因变量的变化。然后进行如下操作:(1)在实验开始时对因变量进行测试;(2)引入自变量,让它发挥作用或影响;(3)在实验结束前在测量因变量;(4)比较前测与后测的差异值就可以检验假设。如果没有差异,就说明自变量对因变量没有影响,从而推翻假设。如果有差异,则可证实原假设,即自变量对因变量有影响。为了排除其他因素的影响,通常将受试者分为两个组:实验组与控制组。这两个组是随机选派的,他们的所有特征和条件都相同,只不过在实验中,实验组收到自变量的影响;而控制组为受到这种影响。分两个组进行试验的目的是要考察自变量x引起的变化E。因为即使不引入自变量,由于某些其他外部因素的影响,在一定时间后(几小时、几天或一年)后测的数值也肯定不会与前测的数值相等。外部因素的影响由U表示。实验组所收的影响,实际上是有两部分组成的:一部分是由于外部的因素,另一部分是由于新引入的自变量,即de=U+E。由于实验组和控制组的构成是采取随机分派的原则进行的,因此实验组所受到的外部因素的影响与控制组所受的影响相等(即都等于U)。这样,实验组真正受到的自变量的影响E应该为:E=de-U。

91、 实验的主要组成部分:(1)自变量与因变量:自变量是实验中的刺激因素,是有待检验的、引起因变量变化的原因。因此,自变量应该是能够引起某种变化的。同时,必须经过严格定义和操作化,这样,才便于在实验中进行测量。因变量是一种应该有自变量所引起的状况,它是研究的关键点,是要被解释的现象。这种因变量应该在状况上与实验前有所变化,也应该在接受自变量刺激的对象和未接受这种刺激的对象之间有所不同。实验者应该尽量让自变量处于一种自然的状态中被观察和测量。(2)实验组和控制组(北大2004<名>;南开2000、2001<名>;南大2000<名>):在实验中,我们把接受自变量刺激的一组对象叫做实验组;而把不接受自变量刺激的一组叫做控制组。设置控制组的主要目的,是为了将研究本身对实验对象的影响,与实验刺激的影响区分开来。为了达到这一目的,就要求在实验开始前,实验组与控制组成员的各方面条件和状况都相差无几,即基本上不存在大的差别。(3)前测与后测:在实施实验刺激以前对实验对象进行的测量称为前测。而在实施实验刺激后对他们的测量成为后测。

92、 实验的基本程序:(1)准备阶段:<1>确定研究问题和研究目的;<2>提出理论假设和工作假设;<3>进行实验设计。(2)实施阶段:<4>选取实验对象;<5>实施实验;(3)资料处理阶段:<6>整理分析资料;<7>撰写研究报告。

93、 实验的三项基本内容:(1)变量的选择和分类:在用实验法研究某个问题时,首先要把与研究课题有关的各种因素挑选出来,然后分析这些因素之间的关系,建立因果模型(2)变量的控制:对自变量的控制就是要有计划地、系统地安排实验刺激的情景和程度,是其作用于因变量。控制外部影响的方法:<1>随机法:这是最常用的方法,在理论上也是最有效的控制影响变量的方法。<2>配对法:这种控制变量的方法是找出两个各种条件都完全相同的人,对其中一人分派到实验组,另一人分派到控制组。<3>排除法:在实验之前把其他影响因素排除在外。<4>纳入法:把其他主要的影响变量也当作自变量引入到实验中,同时对几个自变量进行操作、测量和检验。(3)变量的测量。

94、 简单实验设计:是对单项假设进行验证,即考察一个自变量与一个因变量之间的因果关系。此外,它只分为一个实验组和一个控制组,或仅有一个实验组。
多组实验设计则有三个以上的组,它可以考察多个自变量于因变量之间的关系。
简单实验设计的几种模式:
(1)单组前后测实验设计:没有控制组。这种设计一般在研究人员能够确定外部因素不会对实验产生影响即U=0的情况下采用。否则,它无法区分因变量的改变有多少是自变量引起的,有多少是其他武官变量引起的。

(2)典型实验设计(北大98<名>;南大96<简>:一控制组实验设计方法):两组前后测实验设计。主要优点:<1>比较实验组和控制组前测与后测的差异值,不仅可以确定自变量的影响,而且还可以排除外部因素的影响。<2>可以排除前测造成的某些干扰因素。
主要缺点:受试者经过一次前测,所以可能会对自变量的引入产生敏感,这样,虽然不会影响内在效度,但会影响和降低实验的外在效度。在前测会引起受试者敏感的情况下,应考虑采用无前测的实验设计。

(3)两组无前测实验设计:这一设计中,实验对象一般是随机抽取和随机分派的。在实验组引入自变量之后,同时在两个组测量因变量。

(4)简单实验设计的特点:只考虑一个因变量与一个自变量的关系,因而操作容易,简单易行,可以检验和建立明确的因果关系。但是,他将现实生活中错综复杂的关系简化为单一的因果关系,这就大大降低了实验结论的概括能力和外在效度。因为现实事物往往是"多因多果"的。另一个缺点:他将所有的其他影响因素都作为无关变量加以控制和排除,忽视了各种因素间交互作用的效用,因而降低了实验的内在效度。

95、 交互作用效应:是指实验刺激(自变量)的影响(用E表示),外部因素的影响(U)与前测干扰因素的影响(P)三者之间相互作用所产生的影响。实验刺激与前测干扰的交互作用用表示;实验刺激与外部因素的交互作用表示;前测与外部因素的共同作用用表示;这三类因素的共同交互作用效应用表示。单组前后测实验设计由于假定前测和外部因素影响很小,且将这些因素的交互作用忽略不计,因此他的测量结果误差较大,效度较低。典型实验设计通过控制组排出了前测和外部因素的影响,只有一些交互作用效应影响它的实验效度。两组前后测实验设计由于无前测,因此效度最高。但事物前测也有一定局限性,它无法比较不同时间的变化,而且无法检验在实验开始时两个组的特征值是否相等。

96、 多组实验设计:(1)所罗门四组设计:这种设计精确测量干扰因素和交互作用效应的影响,它综合了典型设计和无前测设计的优点:该设计可以测量自变量、外部变量和测量干扰这三类因素各自对因变量的影响。所罗门四组实验设计的实验效度较高,可以区分出外部因素和测量干扰的影响。缺点:<1>设置四个组,必然要增加受试者人数,从而增加了实验的困难;<2>所的结果必须经过复杂的统计检验。<3>它只能判断其他外部因素对因变量有否影响,但无法确定哪些变量与因变量间还存在着因果关系。

97、 多因素设计:可以检验多个自变量对因变量的影响。这种设计是典型设计的扩充,它有三个实验组,各个组的自变量强度有明显差异。多因素设计的另一形式是考察两个以上的自变量对因变量的影响以及自变量之间交互作用对因变量的影响。一般也称为因子设计。它假定外部因素的影响等于零。因子设计为消除前测引起的敏感影响并减少工作量,一般都运用无前测的设计。有两个自变量,每个自变量有两个值,分为四个组,这样的通常称为(2*2)因子设计。因子设计可以同时包括多个自变量,每个自变量也可以有多个取值。但是,随着自变量的增加,实验组的数目也要相应增加。

98、 重复测量设计:不是对不同组的受试者施以不同的实验刺激,而是对每个组都给以不同的试验刺激。实验效果不是以不同组的观测值差异值来表示,而是通过每个组对不同刺激的差异来反映。它是一种轮换的方法,即每个组都先后接受不同的测量,然后通过比较每一组不同测量的平均值就可以检验不同刺激造成的不同差异。优点是:(1)不用随机抽取实验组和控制组,而只需选取几组实验对象让他们参加各种项目的测验,因此,不必担心组间特征之随机误差的影响。(2)只需较少的受试者就可以达到实验目的。(3)它的实验假设可以有多个,即一个实验可以同时检验几个假设。重复测量的局限是:对有些易于引起受试者敏感或产生较大交互作用效应的实验变量不能进行重复测量。这种设计一般在无法进行随机抽样而只能进行整群选择时采用。

99、 拉丁方格设计:也是一种多因素设计,但是与因子设计不同,它不是考察多个自变量与因变量的关系,而是考察多个自变量的引入顺序对因变量的影响。这种设计可以引入多个不同自变量,这些自变量只有一个取值。实验组的数目取决于引入的自变量,有多少个自变量就分派多少个实验组。每个实验组都依次引入各个自变量,但引入的顺序各不相同。一般来说,拉丁方格设计无法测量出交互作用效应,它只能检验实验顺序对因变量的影响,并判断自变量之间是否存在交互作用。拉丁方格设计的缺点是:(1)它必须保证各组成员的特征相同,不会影响实验结果。(2)各种自变量是共同发挥作用的,因此,无法区分每一个自变量对因变量的单独影响。这种设计一般在特殊场合才采用,即检验自变量的组合方式对因变量的影响或找出最佳组合方式时才采用。

100、 准实验法(北大96<简>:准实验与实验室实验有何区别?准实验的主要设计方法是什么?):就是没有严格的进行指派和严格控制实验刺激的实验方法。它通常不是在纯粹的实验室环境中,而是在研究现场进行,他们常常依据现场的条件和可能性来设计实验方案,并对纯粹的实验设计加以简化。
(1)准实验法的特点:<1>它的实验假设并不一定是因果关系的假设,也可能是相关关系的假设。
<2>它很少采用严格的随机抽样。<3>它通常缺乏前测和控制组。
(2)有人认为,这种实验没有严格执行实验方法的准则,因此,它不是科学的实验。但更多社会工作者认为:<1>科学并不是一春试验为起点和目的的,科学的发展必须利用现实所能提供的手段和技术,而不能等待完美的方法产生以后再进行研究。<2>同时,实验设计本身也是一个从无到完美的不断发展过程。而目前,社会科学的实验已基本具备了科学方式所要求的条件。尽管它并不总是能检验或建立因果关系,但这种"准实验"至少是能检验相关关系并能发现新的事实的。

(3)相关设计:通常指交互分类设计,这是社会学研究中最常用的分析方法之一。它的形式近似于两组无前测设计。但是,试验组和控制组不是随机分派,而是根据试验变量的要求选取的。
相关设计缺点:<1>由于对个试验对象没采取控制,所以无法排除其他变量的影响,因而,他的内在效度较低。<2>相关设计的另一缺点是缺少前测,无法进行时间序列的比较。解决这一缺陷的一种方法是,增加一个事后回溯设计,即在引入试验刺激并加以后测之后,在询问被试者过去的状况。以此与因变量的后测值比较。

(4)时间序列设计(北大2002<名>):也称趋势研究,一般用于研究较长时期内人们的态度和价值观念的变化。是对相关设计的扩充,它也是一种交互分类设计,不过,它的前测和后测包括多个时点,由此组成一个较长时间序列的观测值,从这些因变量的变化趋势中可以发现自变量的影响程度和影响过程。
时间序列设计有多个观察点,而且在每一时点都对试验组和控制组加以测量,因此,从它的差异可以发现因变量的变化趋势,由此可以预测未来的发展变化,并在实际发展过程中检验这种预测。

时间序列设计的缺点:(1)无法判定所假设的自变量是否对因变量由主要影响,因为在很长的时期内,会有许多其他因素导致因变量的变化。(2)测量态度和价值观的变化是很困难的,由于趋势研究是要不断的观测社会发展变化和新的社会现象,它很难利用现有的量表和标准问卷,因此无法确定测量工具的效度。

(5)非等组前后测设计:这种设计的形式与典型设计相似,但是,它的试验组与控制组是不等同的。其优点:<1>不仅可以得到后测的差异,而且还可以知道前测的差异。<2>可以得到更多的信息。
其缺点是:由于两组是不等同的,因此无法推论x与y的因果关系,因为y的变化很有可能是不同的试验对象所固有的,没有控制实验对象的固有特征就不能检验出x的真正影响,最多只能说明所假设的自变量与因变量之间存在着相关关系。

(6)现场试验设计:准实验一般都是在自然环境中进行的,研究人员虽然不能对自然场所的变量加以严密的控制,而且很难采用随机抽样方法是试验组和控制组完全保持一致,但他们可以结合研究目的对试验变量和现场环境加以一定的控制,这种实验也称为实地实验或现场试验。
其特点是:隐蔽性、真实性和概括性都较高。因此,具有较高的实用性。
其缺点:对实验变量和外部变量缺乏严格的控制。为了弥补这一缺陷,应当尽可能的在相似状况下重复同一项实验,以提高实验的效度和信度。

(7)准实验与纯实验在原理上没有严格的区别,准试验只是由于现场和研究条件的局限不得不将纯试验设计加以简化。当然,当条件许可时,应尽可能采取交严格的试验设计,以提高实验的效度。但是,目前社会学试验大部分还不具备采用严格设计的条件,他们通常只能成为准试验,而在纯试验设计或实验室研究中,大多是研究社会心理学和教育学的课题。准实验和纯实验均有其优缺点和局限性。此外,在多种形式的实验设计之间,也没有绝对的优劣之分,他们都适用于某些特定的研究目的和研究领域,研究人员应依据研究目的之要求来选择最适当的实验设计。

101、 实验的信度和效度:(1)信度:与其他搜集资料的方法相比,实验法的信度和内在效度较高。对信度的检查一般是通过重复试验的方法,观测实验的前测和后测也可以检验信度。另一种方法是在多组设计的情况下,通过各个组在同一次试验中的差异来检验信度。(2)效度:实验目的是检验变量间的因果关系,并使实验结果具有概括性。但这两个目的是很难同时达到的,要精确测量自变量的影响,就要严格控制情景和外部变量,但这会使实验环境人工化并缺乏代表性,从而降低外在效度,而如果提高情景的真实性和样本的异质性以使实验能概括广泛的现象,则很难控制其他外部因素的影响,因而降低了内在效度。大部分试验设计都面临着这两种困境,若提高内在效度则有可能降低外在效度,或者相反。这也是纯试验与准试验的不同之处,前者内在效度较高,外在效度较低,后者则相反。
影响外在效度的因素主要是:<1>实验情景的人工化;<2>实验样本缺乏代表性。
影响内在效度的因素主要是:<1>社会现象和社会行为的因果关系很复杂,影响因素很多,对这些变量很难实施控制。<2>对社会因素很难明确界定和测量。

为了提高内在效度,我们可以从以下方面来考虑各种危害实验内在效度的问题,并尽可能减少和控制他们的潜在影响。<1>有关实验对象方面的问题:(A)对象选择:即用来进行比较的两个群体之间是否本身存在差异。(B)对象的丧失:即是否所有的对象都一直在研究中。(C)实验与控制组的竞争。<2>有关试验程序的问题:(A)测量的影响。(B)器械操作。(C)实验处理的模仿。<3>有关时间的问题:(A)成熟的影响。(B)历史的影响。

102、 实验法的优点和缺点:(1)实验法的优点:<1>能够确立因果关系。<2>花费较少。<3>易于重复。<4>控制能力强。(2)实验法的缺点:<1>缺乏"现实性"。实验室中的社会过程往往也不能代表现实世界中的社会过程。<2>样本的缺陷。实验结论所依据的那些实验现象与现实世界中的人们往往大不相同。<3>实验人员的影响。<4>伦理及法律上的限制(人大97<简>:简述实验方法中的社会伦理问题):由于社会研究的对象是人,因而实验所能操纵的自变量常常受到现实生活中伦理或法律的限制。比如,我们不能为了进行有关人口密度和侵犯行为间关系的实验,而让众多的实验对象长时间禁闭在拥挤的室内,也不可能让他们之间发生各种暴力侵犯的行为。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第十一章:观察法

第十一章:观察法

81、 观察的类型:(1)按场所:<1>实验室观察。<2>实地观察。(2)按观察者角色:<1>局外观察。<2>参与观察。(3)按观察程序不同:<1>结构式观察。<2>非结构式观察。事先并不专注于某些特定的行为和特征,在观察过程中也不知是期待这种行为的出现。他们只是当行为发生时进行全面的观察并记录下来。因此,非结构是观察的资料通常不能像结构是观察所的资料那样进行定量处理。(4)按观察对象分:<1>直接观察。即对那些正在发生、发展和变化着的人们的行为所进行的观察。即研究者当时亲眼目睹人们的行为举止。目睹正在发生的各种事件和过程。<2>间接观察。

82、 实验室观察:常常是为了了解人们某些具体的、细微的行为特征,这些行为特征则是作为命题中概念(或变量)的指标被观察的。常常采用结构式观察的形式。也可以是无结构的,它预先不建立一套分类系统;而是涉及一种情景让观察者自由活动,通常是设计一些游戏,然后观察者在观察孔或单向镜后面进行观察,并采用投入理解发分析游戏过程中的一系列行为。这种观察在于详细地了解行为的过程和特征,理解被观察者的行为动机和价值规范。

83、 局外观察(南开2000<名>:非介入收集资料方法):由于社会研究的对象是有思想、有感情的人,所以许多研究方法都不可避免地会引起研究对象的各种反应,从而影响到研究结果的客观性和准确性。为了克服这种现象,十分重要的一点就是要使被研究的人意识不到他们正在被研究,同时又要保证他们在一种极其自然的、不受研究人员干扰环境中行动。局外观察就是观察者置身于所观察的现象之外,冷眼旁观研究对象的活动和表现。

84、 结构式观察:事先要对观察的范畴详细分类,对各项内容的观察和记录方法逐一规定。常将注意力
集中到若干具体的、明确的、许多还是可以计数的行为和特征上。这样,结构式观察的结果通常可以象问卷调查的结果那样进行定量的处理和分析。
(1)观察的范畴和分类。(2)观察的记录和分析。结构式观察预先都制定专门的观察卡片,卡片上明确列出各种观察范畴和分类,观察者只需在相应的格内标记,而不作出自己的评价。观察卡片设计的原则:简单、易行、可靠、准确。

85、 参与观察(北大93、94<名>;北大2000<论>:试举例说明参与观察的实施过程和方法论意义):指观察者亲自投身到所观察的社会现象和社会生活中去,在自身成为社会生活中各种活动的一员的同时所进行的观察。(1)特点、应用及目的:多采用无结构式观察。是人类学和民族志最常用的研究方法。它们的研究对象多是原始社区或特殊的文化与亚文化群体。近几十年,人类学和社会学也将这种方法运用到对现代社会某些特定群体和社区的研究中。

全面深入地描述某一特定的文化现象。它预先并没有什么具体的理论假设,也很难通过其他方法获得所需要的资料,因此需要在研究领域内部进行长期观察,从大量现象中概括出研究对象的主要特征。研究目的和特点决定了观察者要有较高的参与程度。在实地研究中,研究人员努力忘却他们自己的文化,试图在当地的文化环境中再社会化。

(2)参与观察的类型(南大94<简>:使用观察法时调查者可以哪些角色出现):<1>完全的观察者:即局外观察者。<2>作为参与者的观察者:研究者的身份是被所研究和观察的群体知道的,即人们都知道他是一个研究人员。它是以这种公开的身份参与到被研究群体或社区中进行观察的。<3>作为观察者的参与者:他要求观察者既能够成为群体的一员,又能在不暴露研究者身份的情况下询问问题。这是一种要求研究者采取虚伪的角色的情形。<4>完全的参与者。实际上就是间谍的类型。在整个观察的过程中,被观察群体的成员都相信他就是这一群体中的一个普通成员,一点也不知道他是一个观察者。(3)参与观察法的优点:研究者生活在所研究的对象群体及社区中间,对许多现象都能够得到生动具体的感性认识。同时,他还能公开询问想了解的任何问题,可收集到许多采用其他方法难以得到的资料。(4)参与观察法的不足:被观察的人们会十分现实的感觉到他们正在被观察,从而有可能改变他们的行为方式。也就是说,参与观察者在客观上必然会影响到被观察对象的行为。(5)参与观察的主要问题:<1>进入现场。<2>观察内容。<3>观察的时间地点。<4>与被观察者的关系(人大96<简>:简述在观察中如何控制观察者与被观察者的社会距离)。观察者首先要确定自己担任哪种角色,然后根据这种角色的要求确定与被观察者的关系。在实地参与观察中,与被观察者建立良好关系是顺利开展研究的一个必要条件。观察者应当遵守当地的风俗习惯,学习他们的语言、参与他们的活动。要使被观察的群体或社区接受,建立相互信任的关系,可采取不同的策略:(A)一种是要表现出谦虚、谨慎的态度,使被观察者认为你不会危害他们的生活。(B)借助上级机关和领导人的支持,显示出自己的重要地位,是当地的人认识到你的研究的重要性
。(C)取得当地关键人物的支持,是他们意识到你的研究也与他们的某些利益相一致。 <5>观察的准确性。

(6)无结构参与观察中的理论指导:<1>在进入现场前要查阅理论文献,了解前人的研究和理论观点,从而选取一定的研究角度和观察角度。<2>在观察过程中要注意所观察到的事实是否验证或推翻了过去的理论。<3>通过对观察资料的分析建立新的理论。

86、 间接观察(北大92、97、2000<名>;复旦96<名>):其对象通常不是正在活动着的人们,不是人们当时的行为和表现,也不是正在发生的事件和活动,而主要是人们行为以后、事件发生以后所留下的各种痕迹。
(1)物质痕迹观察:是指人们的行为所留下的迹象。<1>腐损测量:腐损是指人们在活动时有选择性的使用某类物体所造成的腐蚀和腐损。<2>累积物测量:对人们遗留下来的物质进行观察,来推测人们的行为特征。
(2)行为标志观察:这种观察是通过一些表面的或无意识的现象来推测人们的行为方式和价值观。它假定,这些现象是人们行为或态度的间接反映。

(3)间接观察的优点:对被观察者没有任何影响,不会使他们产生反应,因此可以收集到真实行为的资料。

(4)间接观察的缺点:很难对效度进行检验,无法知道所观察的标志和迹象是否真正反映了所要调查的行为或现象,即使能够反映的话,也很难断定这种行为-指标的关系是否具有普遍性。所以间接观察一般都作为辅助手段,用以对其他方法进行补充和检验。

87、 观察的信度和效度:(1)观察的步骤:准备阶段:<1>确定研究目的;<2>制定观察计划;<3>理论准备和物质准备;
实施阶段:<4>进入观察现场(或实验室);<5>与观察对象交往(或与被试者交谈);<6>进行观察(或测量),作出现场记录;
资料处理阶段:<7>整理和分析观测记录,进行统计分类,得出观察结论;提出理论解释。<8>撰写调查报告。
(2)观察的效度:
在观察的准备阶段: <1>要选择适当的观察方法,然后根据这种方法,对研究者角色的规定来确定观察方案。<2>在观察地点的选择上应考虑他是否适合研究目的。<3>对观察对象的选择也要考虑研究目的和观察者角色的影响。<4>对内在理论效度影响较大的理论准备过程,即观察范畴的选择和操作化。

在观察的实施阶段,影响内在经验效度的因素较多,主要来源于:<1>被观察者的反应。<2>观察者本人的价值观和期望的影响。<3>观察者本人感官和记忆力的影响。

结构式观察只要在各个阶段上注意消除干扰因素的影响,就可以达到较高的内在效度。无结构的观察和间接观察的内在效度不易检验,但它们的外在效度较高,而且具有其他方法所不及的优点。

(3)观察的信度(北大95<问>:以无结构观察法为例说明实地研究中误差的主要来源及其防范措施):

观察的信度包括三种类型:<1>不同观察者的相关度;<2>稳定系数,计统一观察者在不同时间观察的符合度;<3>信度系数:即不同观察者在不同时间内观察的符合度。

无结构观察的信度很难信赖,也很难检验,除非对一切都进行录像。因为无结构观察主要依靠具体观察者的感官和主观描述,这种主观描述不是以数量表示的,也不是标准化的,很难相互对比。观察的信度是随时间递增的,而且有较多记录的行为类别其信度也较高。
提高观察信度的方式:<1>通过在不同时间的重复观察;<2>增加观察者的人数。但前一种方法更为可信一些。

88、 观察法的作用和特点:
(1)观察法的作用:观察法可以提供有关社会行为的详细的、第一手的资料,可以对社会情景有直接的感性认识。观察法还用来搜集用其他方法很难获取的信息。特别是当研究者与被研究者无法进行语言交往或处于不同文化背景的情况下,常采用观察法。观察也是提出理论假设的基础。

(2)观察法的优点:<1>它可以当时当地观察到现象或行为的发生,从而掌握第一手资料;<2>观察一般是在自然环境中进行的,因此,它对研究对象得扰动较小,从而可以得到自然条件下真实行为的资料。<3>观察法特别适用研究无语言文字沟通的调查对象。<4>可以弥补其他方法的缺陷。社会调查中,经常遇到调查对象不愿接受访谈,拒绝回答以及不交回调查问卷的情况。此外,即使回答或填写问题,也有可能有意歪曲真实情况或因记忆不清等愿意产生较大的误差。采用观察法可以避免上述局限性。

(3)观察法的特点:<1>观察的直接性和自然性;<2>观察者本人的主观意识和价值取向更多介入到观察对象和观测资料中;<3>观察具有广泛性,观察法使用的场合更多,观察者的范围更广,甚至未经多少专业训练的人也可以采用这种方法。

(4)观察法的缺点:<1>难以控制环境变量和时间变量,很难进行数量分析和统计判断;<2>观察资料会受到观察者的价值观和感情因素的影响。<3>通过记录而得到的大量观察资料很难整理分析。<4>在实际研究中,要做到科学的观察是非常困难的。这主要在于社会过程与自然过程有某些本质区别:(A)社会过程受大量偶然因素的影响,很少会出现完全相同的社会现象。因而很少显示出严格的规律性,只有通过多次,详细的观察才能得到比较可靠的资料。(B)对社会过程的观察和理解要受观察者本人的价值观,情感因素和知识结构的影响。(C)观察者的在场会影响研究对象的习惯行为和行动的正常进程。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第九章:访问法

第九章:访问法

67、
结构式访问(北大2004<名>;南大95<名>:标准化访谈):(1)结构式访问又称标准化访问,它是一种对访问过程高度控制的访问。这种访问的对象必须按照统一的标准和方法选取,一般采用概率抽样。访问的过程也是高度标准化,即对所有被访问者提出的问题,提问的次序和方式,以及对被访问者回答的记录方式等是完全统一的。为了使这种统一性得到保证,通常采用实现统一设计、有一定结构的问卷进行访问。访问中所有调查员都必须严格按问卷上的问题发问,不能随意对问题作解释,当被调查者表示不明白时,只能重复一边问题或按统一的口径进行解释。通常这种类型的访问都有一份访问指南,其中对问卷中有可能发生误解问题的地方都有说明,这些说明规定了访问者对这些问题解释的口径。
(2)结构式访问的优点:<1>访问结果便于量化,可作统计分析,它是统计调查的一种。<2>能够控制调查过程,从而可以最大限度的降低来自被调查者方面的误差,提高调查结果的可靠程度。<3>与自填问卷相比,回收率高,而且回收了的问卷的应答率也高。<4>应用范围更广范,可以问一些比较复杂的问题,并可选择性地对某些特定问题作深入调查,因而大大扩大了应用范围。<5>能在回答问题之外,对被访问者的态度行为进行观察,结构式访问能获得自填问卷无法获得的有关访问对象的许多非语言信息。

(3)结构式访问的缺点:<1>与自填问卷相比,费用高,时间长,因而往往使调查的规模受到限制。<2>对于敏感性、尖锐性或有关个人隐私的问题,它的效度不及前者。<3>对访问员的要求更高。<4>由于结构式访问采用统一的问卷和表格进行调查,这种统一的问卷和表格显然无法包括时间的全部,故而只能选区几个方面调查,这就是这种类型的访问很难触及到社会生活的深层及其变化过程,难于综合性的多层次的把握问题,使研究流于表面化。对某些统计结果,由于不知道有关的社会背景情况,而无法进行恰当深入的解释。

68、 无结构式访问:又称非标准化访问,它是一种被控制或无控制的访问。事先不预定问卷、表格和提问的标准程序,只给调查者一个题目,有调查者与被调查者就这个题目自由交谈,调查对象可以随便得谈出自己的意见和感受,而无需顾及调查者的需要,调查者事先虽有一个粗线条的问题大纲或几个要点,但所提问题是在访问过程中边谈边形成,随时提出的。

(1)无结构式访问优点:<1>弹性大,能充分发挥访问者与被访问者的积极性。<2>访问者能对问题作全面、深入得了解。<3>能获得有关研究对象生活与行动与其中的环境的生动地感觉。

(2)无结构式访问缺点:<1>比较费时,其规模受限制。<2>对访问员素质要求更高。<3>结果难与定量分析。
(3)重点访问:又称集中访问,是集中于某一经验及其影响的访问。
具体做法:<1>选择一定的情境,并把调查对象安排到这一预先设置好的情境中去,或者是选择那些曾经经历过这种情境的人做访问对象。<2>然后对他们进行访问,调查他们在情境当中的主观经验,即个人对情境的认识与解释,这种主观经验及时重点访问的重点所在。重点访问的假设:透过某种刺激,可是调查对象在情境上产生特殊的反应。研究中从这些反应获得信息,再加以解释。

重点访问严格地说应当是半结构的,而不是完全无结构的,因为访问问题及时措辞没有事先确定,但问题的内容是事先确定了的。
应用:<1>重点访问在分析特殊经验所引起的态度变迁上,效果较大,因此常常被社会心理学家用来研究大众传播的效果。<2>由于重者访问总是以一个预先的假设为基础的,因此还常常被用于正是以前有关人类情境行为假说的正确程度。

特点:由于这种类型的访问中往往收集到的是许多不可比较的材料,因而分析解释工作难度较大。此外这一方法的运用需要高度的技巧与想象力。

(4)深度访问(北大92<名>;北大97<名>;人大97<简>:简述深入访谈的基本类型;浙大99、2000<名>):又称临床式访问,它是为搜集个人特定经验的过程及其动机和情感资料所作的访问。对个人生活是的访问是个人生活史研究中获得资料的主要方法之一。生活史研究是一种对人们的生活经历进行详细了解和分析的研究方法,它采用访问、观察或由被研究者自己写自传等方式,对某一社区或某一群体中的全部或部分个体的生活经历进行详细地了解,如实记录下研究对象生活经历中各方面的情况,然后将不同个体的生活史进行统一的整理和归纳,找出共同点和不同点,并找出其中典型的个案作为描述和解释的例证,以此来反映这一群体的社会生活状况以及他们的心理、思想、态度和观念等。

深度访问特点:<1>与重点访问相似,也是一种半结构式访问,它选区研究问题的某些方面向研究对象提问题,访问是机动的或结构松散的,但重点与焦点是有的。<2>允许在访问中对以外的因素充分探索和深究,研究人员可能由此而获得某种重大发现,这种偶然重大发现往往带来研究问题的突破。

(5)客观陈述法(北大98<名>):又称非引导式访问,最大特点是让调查对象对他自己和他周围的社会先做一番考察,在客观的陈述出来,即调查者鼓励调查对象把自己的信仰、价值观念、行为以及他所生活的社会环境客观地加以描述。

(6)座谈会:也就是调查会,是一种无结构式集体访问,即将调查对象集中起来进行共同讨论。

座谈会特点:访谈过程不仅是调查者与被调查者的社会互动过程,也是调查对象之间的社会互动过程。要求调查者有更熟练的访谈技巧及组织会议的能力。容易产生一种"团体压力",是个人顺从多数人的意见,而不敢表示异见。因此,对一些敏感的问题,不宜采用这种方法。与个别访问相比,更难做深入细致的研究。

座谈会应用:这一方法常被用于验证或调查集体行为与群体关系的倾向,以及心理治疗和企业及组织诊断。典型调查业常用这种方法。
座谈会要求:根据长期实践经验,调查会人数以5-7人为宜,最多不要超过十人。参加调查会的人员一般应具有代表性,了解情况,敢于发言,并且最好是相互信任,有共同语言的人。访谈前应将访问的具体内容、要求和到会人员的名单告诉参加调查会的全体调查对象。正式访问前,访问者应做好充分的准备、拟定好访问提纲。

座谈会的两种方式:<1>头脑风暴法(复旦96、97<名>):即会议主持者不说明会议的明确目的,而只就某一方面的总议题,请到会者自由发表意见,会议主持者不发表意见,更不对别人的意见内容提出评论。<2>反向头脑风暴法:即会议首先列出某方面的问题,参加这不仅自己发表意见,而且必须针对别人的意见展开批评与评价,以寻求解决问题的途径。注意事项:调查会上要避免让某些权威人士的发言左右其他人的发言,或受调查会主持人的意见左右,而要使各种意见都能得到充分发言。

(7)无结构式访问与个案研究(北大92、2003<名>;北大93<简>:是说明个案研究、社区研究与问卷调查的主要区别;北大94<论>:是比较问卷调查与个案研究的特点及优缺点):<1>主要特点:处理问题深入全面细致。是一种从整体上处理问题的方法,也就是从事务的多个方面和整体情况,从各个层次间生动联系以及从历史发展状况把握问题。
<2>将个人作为个案研究单位时,研究资料的来源有:(A)个人文献资料;(B)访问资料;(C)观察所的资料。

<3>个案研究的形式:(A)描述和解释个案,提供有关当前的状况和它不断运行的动力的信息。这种分析可称作列举性分析。他是利用一般规律或规则进行特殊个案的分析,机用一个以及的概括作出一个特殊的分析。(B)通过对单个个案的分析,发展出经验的概括或理论,不是以个案去发现它作为一个系统的有关的一切,尔是把它作为理论建构的经验基础,使用特殊个案发展一般陈述。
<4>应用:(A)作为和社会状况及文化背景相关的东西,要进行具体详细地研究时。(B)要研究某个对象、某人、某种状况的自然发展或生活史时。(C)如果不能确保整个社会状况或有关因素的复合关联的事实,技术社会过程的分析就不能进行时。(D)要研究个人生活及社会需求、冬季或者生动的存在、文化背景下的群体行为时。

<5>特点与作用:(A)能从个案的详细描述和分析中,发现影响事物的主要因素及其作用,从而导致假设的形成,并找出群体或类型的详细资料。(B)很多场合下,个案研究亦被认为是完成一个正式研究的必要的结束手续,即研究的结果可用个案研究印证是否正确。(C)它的最大优点是对于个案的社会背景进行深入全面地把握。

69、 访问的程序与技巧(南开2000<简>:访问时应特别注意那三个环节的问题):(1)访问准备。(2)进入访问。(3)访问的控制:<1>提问控制:(A)题目转换;(B)对问题的追问;(C)合适的发问与插话;(D)提问注意事项。<2>表情与动作控制。(4)结束访问。(5)访问纪录。

70、 访问员的挑选与训练(复旦96<简>:挑选访问员的标准是什么):(1)特殊条件:<1>性别;<2>年龄;<3>教育;<4>地区。(2)一般条件:<1>诚实与精确;<2>兴趣与能力;<3>勤奋负责;<4>谦虚耐心。

71、 访问法的特点(南大96<简>:试述访谈法的特点):

优点:(1)它是一种面对面的社会交往过程,访问者与被访者的相互作用,相互影响贯穿调查过程的始终,并对调查结果产生影响。因此,能获得自填问卷无法获得的有关访问对象的许多非语言信息。(2)访问具有很强烈的个人色彩,即它在很大程度上取决于访问者个人的人际交往能力,访问技巧的熟练程度以及对访谈过程的有效控制。因此更复杂而难于掌握。(3)与其他调查方法相比,访问可以获得的资料更丰富,实行起来也更灵活、弹性更大,应用范围更广泛,且有利于对问题进行更深入的探索。(4)环境可控是访问法的另一大优点。(5)访问法还可以充分发挥研究人员的主动性和创造性,训练和培养他们的想象力、人际交往能力以及对事物的洞察力,激发他们对问题的新的认识和解决问题的新思路。

缺点:(1)无法做到完全客观;(2)对敏感型问题、尖锐问题和隐秘问题,被访问者一般不愿当面回答,或者不做真实回答,一般不宜用访问法。(3)无法用语言表达的经验情感过程,以及许多人的互动资料、心理经验、身体的动作以及场所和速度的变化等社会测量的资料都不宜或无法用访问法获取。(4)与其他访调查方法相比,费用较高,费时较长,需要的人力较多。

72、 量表与测验法(北大94<简>:试比较问卷和量表的异同;北大96<简>:试说明调查量表、社会计量法、民意测验的特点及各自的运用范围):??

73、 量表的概念(浙大2001<名>;南大2000<名>):

(1)量表与维度:维度属于理论范畴,它表示现象的某一层次或某一方面,或者说,它在抽象层次上表示从某一角度看待现象时的某种连续统一体。维度与理论分量的概念常常被看作是同义的。与维度不同,量表与指标都是用来捕获和再现理论维度的经验工具,即对理论维度的一种代表。可以说,量表和指标是用在经验层次上对现象的连续统一体的测量。(2)量表与指标(北大2004<简>:指标和量表的主要不同点):<1>社会研究中,量表的概念最经常地用来表示包括着判断或主观判断的测量。在社会科学中,某些测量仪器也不称作量表,因为他们也不包括判断。<2>量表通常是由多项测量内容综合而成的。每一项内容都可看作是经验变量的一个指标或指示标志。而一个量表就可有两个或更多个指标所构成。因此,我们也可以把量表视为衡量概念(或变量)的综合指标,它不同于一个单项指标。
(3)量表和指数:在社会研究中,两者区分不严格,但不完全相同。指数也可由一组指标综合而成。这组指标分别对一个复杂概念的不同部分进行测量,然后对这组指标的树枝进行累加或其他运算就可综合为一个指数。而这主要区别:量表必须由一套问卷问题所构成。指数则可以依据其他的资料。一般来说,指数是由几个数量指标的运算综合而成的。而量表则由对一组问题的回答"计分"综合而成的,他常用于测量人们的态度。

(4)量表作用:相当于一把尺子,作用在于精确度量一个较抽象的或综合性较强的概念,特别是度量态度和观念的不同程度或差异。(5)量表缺点:设计比较复杂,测量的信度和效度还不太高。

74、 量表的类型(北大2002<简>:为什么要区分调查量表和测验量表):量表可分为调查量表和测验量表。它们分别用于问卷调查和测验中。在问卷调查中,使用量表的主要目的是要精确了解总体的状况。它的分析重点是群体而不是个人。而在测验中通常是要精确的观测个人的某一特征,他的分析重点是个人,因此量表设计要严格、精确且具有较高的信度和效度,这就需要设计大量题目。与此相反,问卷调查中的量表题目较少,效度不要求很高。研究目的不同,量表的设计也不同;对于目前尚不能精确量度的事物,可以通过大量题目,也可以通过大量样本的主观判断来间接的近似的反映。

75、 总加量表(北大93<详>:试说明总加量表的制作程序,并设计一个量表(包含5个语句)来测量"十四大"以后群众的政治态度):目前使用最广泛的总加量表是利克特量表,它是由美国社会心理学家利克特于1932年在原有的总加量表基础上改进而成的。该量表由一组陈述组成,每一陈述有"非常同意"、"同意"、"不一定"、"不同意"、"非常不同意"五种回答,分别记为1,2,3,4,5,每个被调查者的态度总分就是他对各道题的回答所的分数的加总,这一总分可说明他的态度强弱或她在这一量表上的不同状态。(1)总加量表的制作程序:<1>根据所要测量的内容或变量收集大量与这一内容有关的问题,然后初步筛选出一组问题作为量表草案。<2>确定问题的类别和计分标准。<3>试调查。从调查对象中找一些人尝试回答量表草案,以便发现量表设计中有什么问题,是否会引起误解。更重要的是检查每道题的分辨能力。分辨能力是指一个题目是否能区别出人们的不同态度或不同程度。<4>计算个题目的分辨力,删去分辨力不高的题目,保留分辨力较高的题目组成正式量表。利克特量表检查分辨力的方式是:将试调查中的分最高的25%的人与得分最低的25%的人进行比较,然后计算出每道题的分辨力。

(2)利克特量表的优点:<1>容易设计;<2>使用范围比其他量表要广,可以用来测量其他一些量表所不能测量的某些多维度的复杂概念或态度。<3>通常情况下,利克特量表比同样长度的量表具有更高的信度。<4>利克特量表的五种答案形式使回答者能够很方便的标出自己的位置

(3)利克特量表的缺点:<1>相同的态度的分着具有十分不同的态度形态。因为利克特量表是一个项目总加的分代表一个人的赞成程度,它可大致上区分个体间谁的态度高,谁的低,但无法进一步描述他们的态度结构差异。

76、 累积量表(南大95、96<名>:累积量表法;南大98<名>:古特曼量表):累积量表又称格特曼量表,它是格特曼(L.Guttman)1944年设计使用的。它也是目前使用较为普遍的一种量表。格特曼量表是单维的,即量表自身结构中存在着某种由强变弱或由弱变强的逻辑。因此也不会像利克特量表那样形成分数相同而态度结构形态不同的现象,它的每一个量表总分,都只有一种特定的回答组合与之对应。(1)社会距离量表:又称鲍格达斯量表,它是美国社会心理学家鲍格达斯于1925年创用的。这种量表过去一直广泛用于测量人们对种族群体的态度,现在,它也被用来测量人们对职业、社会阶层、宗教群体等事物的态度。鲍格达斯量表由一组表示不同社会距离或社会交往程度的陈述组成。它要求被调查者根据自己的看法对这些陈述表态。在这一组问题中,实际上蕴含着一种超强的逻辑结构。除了某些例外情况外,量表本身的逻辑结构使我们能够得出这样的结论:即当一个人拒绝了量表中一项关系,那么它也必将拒绝这一关系后面所有更强的关系。鲍格达斯量表测量所得到的结果,既可以用来比较具有不同特征的人们对某一群体的社会距离的大小,也可以用来比较具有相同特征的人们对不同群体的社会距离的大小。特别是将结果绘成统计图后,更便于进行分析。

(2)累积量表的制作:<1>研究人员围绕它所希望测量的某一事物或概念编制一组陈述,这些陈述应该是单维的,即具有某种趋强结构。<2>然后用一个小样本对这些陈述进行检验。<3>将检验的结果,按最赞成的陈述道最不赞成的回答者,从上到下排列<4>然后从中去掉那些不能很好区分赞成的回答者与最不赞成的回答着的陈述。<5>按公式:(再现系数=1-误差系数/回答总数)计算出再现系数。如果再现系数大于或等于0.90,我们就称该量表是单维度的。每个人的态度的分就是他回答赞成的项目总数。

(3)格特曼量表的优点:可以直接根据被测者所同意的陈述的数目及他的量表分数,来决定他对这一概念或事物的赞成程度,这也正是格特曼量表的最大优点。

(4)格特曼量表的缺点:<1>我们对一组陈述具有单维性的假设是有局限性的,这种单维性往往只是某一部分人的态度模式,一组特定的陈述可能在某一群体中表现出单维模式。同样,在一个时期中是单维的模式,但到了另一个时期却不一定还是单维的。<2>单维的领域往往难于找到。

77、 语义差异量表(北大99<名>;南大99<名>):是用一组意义相反的陈述或形容词构成一份评价量表,以用来测量人们对某一特定概念或事物的不同意识和感受。

78、 测验(北大2000<简>:
试述测验法与民意测验的异同):测验是以间接的方式收集个人的态度、人格结构和心理行为等方面资料的方法。它是一种标准化了的程序,在这个程序里,受测人对一组预先设计好了的刺激做出反应,这些反应能够使得测验者能够以一个数或一组数来描写受测者,并有这个数或一组数推论受测者拥有这个测验所想测量的心理行为的状况。(1)测验方式:<1>直接测量:对于行为的测量,通常是直接测量。<2>间接测量:对于心理特征,测验是通过对反应的测量而间接的测定与其对应的心理特性。测验通过刺激-反应的联结关系将个体内在的人格、心理与外在的行为联系起来,从而达到通过对外在行为的观察测量而推论它所联结的内在人格、心理特征的目的。测验中,作为刺激的,可以是:一个或一组量表,一件工作,一个模糊不清的信号等。(2)能力测验:<1>一般智力测验;<2>特殊能力测验;(3)成就测验:目的在于测量某个人对某项工作已经知道多少货能够完成某种程度。主要测量:<1>工作知识或见闻;<2>工作技能;<3>还可通过对他人施测,以了解他的工作效绩。(4)人格与兴趣测验:<1>自陈式测验;<2>投射测验。

79、 社会计量法(北大96<问>:试说明调查量表、社会计量法、民意测验的特点及各自的适用范围;北大99<简>:简述社会计量法的特点和分析方法;复旦96<名>;人大2001<名>;浙大99、2001<名>):
(1)社会计量法:也称社会交往计量,是评量某一群体、组织中的人际吸引或拒斥关系的工具,或更进一步说是:用以决定个人在群体与组织中被接受的程度,发现群体内人与人之间的现存关系,并解释组织本身的结构特征的工具。社会计量法是美国心理学家莫雷诺等人1930年所创用的,主要用于小整群体的人际关系与群体结构的研究。

(2)社会计量法常用的方法:<1>准绳法。采用问卷收集资料,对群体实施整体调查。在设计问卷时要确定以什么为准绳来测量所要了解的人们之间的关系。准绳通常是一个问题,回答这可以在群体内选择若干人来回答这一问题。准绳的选择关键是要准确反映出所要测量的关系;其次要具体而切实,易于被调查者了解和回答,切忌空泛模糊,一般情况下不使用消极的准绳。<2>量表法。即使用量表,让回答者对群体中每个成员的素质、个性或有关行为作出评判。<3>群体偏好记录法。即直接要求回答这对群体内每个成员表示"喜欢""不喜欢"或"关心""不关心"等态度。
<4>"猜是谁"技术。即给出一些表述,要求回答者找出群体中最符合这些表述的人。 (3)社会计量法的分析技术:

<1>社会矩阵法:是一个n*n方形表格,n是被测群体人数,左方的一列数字为选择者的代号,上方的一行数字为被选择者的代号,表中的1、2、3表示第一、第二、第三选择,表的底部数字为每人所获选择的总数。为了解选择的分布、互选数量及小整群体成分,可将社会矩阵转化成各种统计表,获得更多有意义的资料。<2>社群图法:社群图(北大98<名>;南大96<简>:同心圆式社会关系图制作方法;南大2000<简>:社会关系图是怎样形成的):是以图形综合群体成员间的选择,图中每一个圆圈中的数字表示一个工人,它们之间发生选择用箭头连接,箭头指向被选择者,如果是互选则用双箭头。绘图时应当注意通常是将受选数最多的放在中间位置,次多者置于他的周围,受选数极少或无人选择者置于最外围。此外在绘图时还应尽量避免线条交叉。
社群图分析:(A)孤独者数量;所谓孤独者指的是既不选择他人又不为他人所选的人。(B)意见领袖的数量。在群体中被10%以上成员提名的人被称为意见领袖。如社群图中缺乏意见领袖,且图又显得散乱时,表明群体结构松散。(C)对偶数量。一对互选的成员称作一个对偶。愈是团结的群体,其对偶数也愈多。(D)串联的数量。这是指3人以上的连锁关系。串联是群体团结的要素,串联数愈多,愈长,群体关系就越紧密。如果社群图中互选的对偶数多而且有较多的长而重叠的串联时,显示群体或组织有相当完整的结构与良好的沟通网络,成员之间相互比较了解且关系融洽。(E)小群体的数量。小团体由3个以上成员组成,每个人至少选择一个小团体中的成员,并至少被一次,小团体构成一种封闭的连锁关系。在一个群体或组织中的这些小团体为非正式团体,多由兴趣、爱好、工作等原因形成。如果社群图中这种非正式小团体明显存在并且小团体之间又很少沟通时,则群体容易产生摩擦。(F)主要联络点与次要联络点的数量。在群体中那种当他一旦离开将会使群体至少分成两个小群体的人,成为主要联络点。那种当他连同另一个人同时离开将会使群体至少分成两个小群体的人称为次要联络点。如果社群图中孤立者和联络点多,则会增加群体内信息、意见与情感沟通的困难。

指数分析:即通过社会计量指数分析个人在群体中的地位,比较同一群体内不同情境下每个人的社会地位,且对不同群体的特征进行比较。

常用到的指数有:(A)社会地位指数:表明个人在群体中受重视的程度;(B)首选地位指数:表明个人在群体内所受支持的程度。(C)高和低选择者:受选择数在平均选择数一个标准差以上者,低选择者是在其以下者。(D)吸引率:表明群体内吸引作用发生的程度;(E)团结指数:表明群体的团结程度。(F)调和指数:表明团体中调和的程度。(G)内群亲近率和外群亲近率。前者显示群体成员对本群体向心的程度;后者显示成员的离心程度。

社会计量法的作用:运用社群图和指数分析,我们可以直观地得到群体性质的概貌,即有关群体的下列信息:(A)群体的结构类型;(B)群体内信息沟通方式;(C)群体的内聚力;(D)群体内人际关系;(E)群体中的领袖人物;(F)群体间的关系。

(4)社会计量法的应用:<1>领导才能的评价与干部选拔;<2>工作分配;<3>士气的考察;<4>组织诊断和治疗;<5>评价。

80、 民意测验(北大93、94、2004<名>;北大96<问>:试说明调查量表、社会计量法、民意测验的特点及各自的适用范围;北大2001<简>:试述测验法与民意测验的异同):也称民意调查、舆论调查,是一种了解公众对某些政治、经济、社会问题的意见和态度的调查方法,其目的在于通过对大量样本的问卷调查来精确反映社会舆论或一般民意动向。

(1)民意测验的作用:<1>客观及时地反映社会舆论和大众心理的一般状况和变化情况。<2>为制定或评价政策、措施提供依据。<3>对大众心理进行分析和预测。

(2)民意测验的程序:<1>确定调查课题;<2>确定调查对象和抽样方案;<3>设计调查问卷;<4>发放和回收问卷;<5>对调查资料进行统计分析。

(3)民意测验的优缺点:<1>盖洛普认为,只要采用科学的抽样方法,那么当样本数量达到一定规模后,就能较好的反映总体,这时样本在增加样本并不能提高多少精确度。对美国一亿人的民意测验,抽取1500-2000人的样本就可以达到足够的精确度。<2>其次,他指出:"通过近五十年的民意测验,我们发现,公众的集体判断是极为可靠的,特别是在那些他们熟悉的问题上。公众实际上常常比它们选出的领导人更早的接受创新和社会变革。"
缺点:<3>由于民意测验是用简化的方式来了解公众的一般态度,他对不同含义、不同程度的意见、态度都用是或否、赞成或反对者两种答案来概括,因此它很难做出深入地分析和理论解释。<4>民意测验只限于询问一些公众熟悉、易于回答的问题,它获得的信息较为表面化、简单化、缺乏深度。此外,对于公众不熟悉或缺乏了解到问题,回答的信度和效度有可能较低。

优点:<5>能迅速的了解群众对某些问题的看法,及时反映社会舆论的变化情况;<6>调查结果能推论总体的一般状况,具有较高的代表性。<7>只需抽取较少比重的样本就能了解总体和全局的情况。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第八章:问卷法

第八章:问卷法

61、
问卷的基本结构:(1)封面信(南大98<名>):即一封致被调查者的短信,其作用在于向被调查者介绍和说明调查者的身份、调查目的等内容。内容:<1>调查的主办单位或个人的身份;<2>调查的内容和范围;<3>调查的目的;<4>调查对象的选取方法。(2)指导语(南大97<名>:问卷指导语):即用来教被调查者如何正确填答问卷,教访问员如何正确完成问卷调查工作的一组陈述。卷头指导语:一般以"填表说明"的形式出现在封面信之后,正式调查问题之前。作用:对填表的要求、方法、注意事项等做一个总的说明。卷中指导语:一般是针对某些较特殊的问题所作出的特定指示。总之,问卷中每一个可能使回答者不清楚、不明白、难理解的地方,一切有可能成为回答者填答问卷的障碍的地方,都需要给于某种指导,而对于编写指导语来说,最主要的标准,就是简明易懂。
(3)问题和答案:开放式问题:就是不为回答者提供具体的答案,而由回答者自由回答的问题。优点:允许回答者充分自由的按自己的方式发表意见,不受限制,因而,回答往往是最自然的。所得资料也往往比封闭式问题丰富生动。缺点:<1>要求回答者有较高的知识水平和文字表达能力,限制了调查的范围和对象。<2>要求回答者花费较多的时间和精力。<3>得到的资料难于处理,尤其难于定量的分析和处理。封闭式问题:就是在提出问题的同时,还给出若干个可能的答案,供回答者根据自己的实际情况从中选择一个作为回答。
优点:<1>回答方便,对文字表达能力无特殊要求。<2>回答者花费时间精力较少。<3>所得资料集中,便于进行统计处理和定量分析。缺点:<1>所得资料失去了开放式问题的那种自发性和表现力。<2>回答中的偏误难以发现。

问卷内容三个基本方面:<1>有关行为方面的问题;<2>有关态度或看法方面的问题;<3>有关回答者个人背景的问题。
(4)其他资料:如问卷的名称、编号、问卷发放及回收日期、调查员、审核员姓名、被调查者住址、问题的预编码等。

62、 问卷设计的基本原则(人大2000<简>:简述问卷设计的原则和基本步骤):
(1)把为被调查者着想作为问卷设计的出发点。主要错误有:<1>问卷设计得很长,问题太多,需要填答的量太大。<2>问卷中要求被调查者进行难度较大的回忆和计算。
(2)对阻碍问卷调查的因素有明确地认识。问卷调查实质上是调查者与被调查者之间的一种社会互动过程。
有以下障碍:<1>主观障碍:即由被调查者心理上和思想上对问卷产生各种不良反应所形成的障碍。包括:(A)畏难情绪;(B)顾虑重重;(C)漫不经心;(D)毫无兴趣;

<2>客观障碍:指被调查者受自身的能力、条件等方面的限制所形成的障碍。包括:(A)阅读能力的限制;(B)理解能力的限制;(C)表达能力的限制;(D)记忆能力的限制;(E)计算能力的限制。

(3)从多个不同角度来考虑问卷的设计工作:<1>调查目的的影响;<2>调查内容的影响;<3>样本性质的影响;<4>资料处理分析方法的影响;<5>问卷使用方式的影响;<6>调查经费和时间的影响。

63、 问卷设计的主要步骤:
(1)探索性工作:最常见的方式,是问卷设计着亲自进行一定时间的非结构式访问。(2)设计问卷初稿:<1>卡片法:(A)根据设计者在探索性工作中的记录、印象或认识,把每一个问题及答案单独写在一张卡片上。(B)按照卡片上问题的主题内容,把问题卡片分成若干堆。(C)在每一堆中,按日常询问的习惯与逻辑,排出问题的先后顺序。(D)根据问卷的逻辑结构排出各堆的前后顺序,是全部卡片连成一份完整的问卷。(E)从回答者阅读和填答问卷是否方便,是否会造成对回答者心理的影响等不同角度,反复检查问题的前后连贯性及逻辑性,对不当之处逐一调整,并可补充一些新的问题卡片。(F)把调整好的问题依次写在纸上,形成问卷初稿。
缺点:在第一阶段些具体问题时,由于缺乏总的结构,所以常常漏写某些方面的问题。

<2>框图法(北大2000<名>):(A)根据研究假设和所需资料的逻辑结构,在纸上画出整个问卷的各个部分及前后顺序框图。(B)从回答者回答是否方便,是否会形成心理压力,问题内容前后是否符合逻辑等方便反复考虑这些部分的前后顺序。(C)具体的写出每一部分中的问题及答案,并安排好它们在该部分中的顺序和形式。(D)最后对全部问题的形式、前后顺序等方面从总体上进行修订和调整,然后将结果抄写在另一纸上,形成问题初稿。

缺点:修改调整问题不如前者方便。
<3>两种方法的区别:前者是从问题开始,由部分到整体,后者相反,先从总体结构开始,由部分到具体问题。

(3)试用和修改:<1>客观检验法:将设计好的问卷初稿打印几十份,然后在正式调查的总体中选择一个小样本来试用。检查项目:(A)回收率;(B)有效回收率:即除掉各种废卷后的回收率;(C)对未回答的问题的分析;(D)对填答错误的分析。

<2>主观评价法:将设计好的问卷初稿抄写或复印若干份,分别送给该研究领域的专家、学者、研究者的同行以及典型的被调查者等,请他们根据自己的经验和认识,从各个不同的角度和不同的方面直接对问卷进行评论,指出各种缺陷和错误。

64、
问卷设计的具体方法(北大92<设>:某项问卷调查要了解群众对"社会治安状况"、"物质生活状况"和"经济发展前景"的看法、意见或态度。试针对这三个方面,各设计两项问题(一项是封闭式,一项是开放式);北大96<设>:试设计一份简单的问卷,并说明你的研究目的,研究假设,主要变量和设计问卷的框图;北大99<设>:试设计一份调查问卷(8-12个问题),并说明你的研究目的,研究假设和问卷设计的框图(变量关系图)):
(1)问题的形式:
<1>填空式:这种形式常用于那些对回答者来说既容易回答,又方便填写的问题(通常只须填写数字)。<2>是否式:即答案只有肯定和否定两种,回答着根据自己情况选择其一。弱点:得到的信息量太少,类别太粗,不能了解和分析回答者中客观存在的不同层次。
<3>多项选择式:即给出的答案至少在两个以上,回答者选择其一。<4>矩阵式:当询问若干个具有相同答案形式的问题时,可以将其设计成矩阵形式。优点是:节省空间,问卷显得紧凑。也节省了回答者阅读和填答时间。
<5>表格式:和矩阵式十分相似。除了具有矩阵式特点外,还显得更为整齐醒目。注意不宜多用,以免呆板单调。

(2)答案的设计要求:<1>保证答案具有穷进行和互斥性。<2>根据研究的需要来确定变量的测量层次。<3>当有些问题的答案如果要将他们全部列出,即使不是不可能也是十分困难的,可以采取列几个主要答案,然后加上一项其他。如果问卷回收后选择"其他"一类的回答者非常多,那就说明所列举的那几类还不恰当,还有更重要的类别没有单列出来。
(3)问题的语言和提问方式(南大95<简>:设计问卷是怎样艺术地提出问题。):规则:<1>尽量用简单的语言;<2>问题要尽量简短;<3>避免双重含义问题;<4>问题不要带倾向性。人们对问题的回答在一定程度上很受问题措辞所表现出来的倾向性,也称诱发性的影响。<5>不用否定式提问。<6>不问回答者不知道的问题。<7>不直接问敏感性问题。<8>问题的参考框架要明确。参照框架:是指问题相对于什么背景而言,在什么范围内或对什么方面而言。

(4)问题的数目和顺序:问卷不宜太长,问题不宜太多,一般以回答者能在30分钟内完成为宜。

安排问题顺序的规则(南大2000<简>:在问卷中,问题的排列应遵循怎样的原则):<1>被调查者熟悉的、简单易懂的问题放在前面,比较生疏、比较难回答的问题放在后面。<2>把能引起被调查者兴趣的问题放在前面,把容易引起被调查者紧张和顾虑的问题放在后面。<3>把开放式问题放在问卷的结尾部分。<4>先问行为方面的问题,再问态度方面的问题,最后问个人的背景资料。<5>按一定的逻辑顺序排列问题。

(5)相倚问题:在问卷中,有些问题只是用于样本中的一部分调查对象,而且某个调查对象是否回答这一问题,常常要依据他对前面某个问题的回答结果而定。这样的问题,称之为相倚问题,而前面的那个问题则叫做过滤问题或筛选问题。

65、 问卷设计的常见错误(北大95<简>
简述问卷设计中常见的错误,为避免这些错误,问卷设计是应遵循何种原则):(1)问题含糊:即问题的含义不清楚,不明确或有歧异。(2)概念抽象。(3)问题带有倾向性。(4)问题提法不妥。(5)双重含义问题。(6)问题与答案不协调。(7)答案设计不合理。(8)语言中的毛病。(9)其他方面的问题:表格设计过于复杂、问题太多、不正确等;封面信介绍不够、过于简单、或过于罗嗦、不简明扼要;校对检查不够,出现一些印刷错误等。

66、
问卷法的特点及运用(北大93<简>:试说明个案研究、社区研究与问卷调查的主要区别。北大94<论>:试比较问卷调查与个案研究的特点及优缺点):

(1)问卷法的优点:<1>节省时间、经费和人力。<2>具有很好的匿名性。<3>可以避免偏见、减少调查误差。<4>便于定量处理和分析。(2)问卷法的缺点:<1>对被调查者的文化水平有一定要求。<2>回答率往往难以保证。<3>不能保证填答问卷的环境和填答的质量。(3)问卷法的应用:在实际社会研究中,问卷法作为一种主要的资料收集方法,常常与大规模的抽样调查以及资料的定量分析相联系。可以说,抽样-问卷-定量分析三者的结合体,是现代社会学定量研究中最常见,也是最重要的一种方式。问卷法要求被调查对象有一定文化水平。其适用范围还受到调查对象总体构成情况的影响,在成分单一的总体中比在成分混杂的总体中适用。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第七章:抽样

第七章:抽样

54、
抽样与抽样调查(北大2004<简>:抽样调查的基本原理):抽样调查:从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。这种从总体中选出一部分的过程就是抽样,所选出的这部分代表称为样本(人大2000<名>)。(1)与整体调查相比,抽样调查的优越性:<1>调查费用较低;<2>速度快;<3>应用范围广;<4>可获得内容丰富的资料;<5>准确度高。(2)抽样成功的依据(假设):<1>部分是包含于整体之中的;<2>部分与整体有同样的特征、现象、关系及过程;<3>部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。

55、
抽样术语:(1)个体与抽样单位(人大97<名>:抽样单元):个体是收集信息的基本单位,即分析单位。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位往往是多层次的。(2)研究总体和调查总体(复旦97<名>:研究圈;人大2000<名>:总体):研究总体是在理论上明确界定的个体的集合体,它必须受几个方面的限定:内容、单位、范围、时间。实际上,样本式从调查总体而不是研究总体中抽取的。调查总体是研究者从中实际抽取调查样本的个体的集合体。它往往是对研究总体的进一步界定,即对时间、范围作更进一步规定。(3)抽样框(北大2002<名>;复旦97<名>;南开2000<名>;南大99<名>):又称抽样范畴,是从中抽取样本的抽样单位名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。(4)参数值与统计值(人大97<名>:参数、估计量;):参数值是关于总体中某一变量的综合描述。统计值则是关于调查样本中某一变量的综合描述。抽样调查的重要内容之一就是通过样本的统计值推算总体的参数值,从而达到由部分认识总体的目的。(5)抽样误差(北大99<名>;复旦96<名>):总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏差,这种偏差就是抽样误差。(6)置信水平与置信区间:置信水平是指总体参数值落在样本统计值某以正负区间内的概率。而置信区间是指在某以置信水平下,样本统计值与总体参数值的误差范围。

56、
抽样的基本程序:(1)界定研究总体和调查总体。对研究总体的界定过程也就是对他的基本构成单位,所包含的内容以及空间与时间的范围等作出规定的过程,同时也是确定调查对象,及它的内涵、外延及数量的过程。(2)确定抽样单位,编制抽样框。即将总体案抽样单位划分为各部分,这些部分必须互不重叠且能合成总体,然后毫无遗漏的编号排列成表,每个抽样单位唯一的与表上的一个号码相对应。抽样框是概率抽样一个最基本的要求,它的质量关系着抽样的质量。(3)设计和抽取样本。包括确定样本所包含个体的数目,选择抽样的具体方法。(4)评估样本于对总体进行估计。样本对于总体的代表性问题始终是抽样中关注的中心问题。

57、
样本准确性与精确性(北大95<问>:抽样调查中的误差份哪两类?其来源是什么?如何减少两类误差?北大2002<简>:简述影响调查样本代表性的主要因素):
(1)样本准确性:指样本没有偏差。偏差也称系统误差,其来源主要有:<1>抽样程序的缺点,即未能遵守随机原则;<2>无回答,无回答是样本偏差的主要来源之一。事实上,一个包含比初始选定的单位少于80%的样本几乎肯定是有偏差的,在这种情况下应通过二访、三访或其他手段提高回答率。(2)样本精确性:指抽样误差的大小。抽样误差是抽样这种方法所固有的误差,是随机误差。抽样误差可以定量进行估计,因此研究人员对于抽样误差的估计具有很大的主动性。(3)样本评估:样本评估分两阶段,正式调查前和结束后,后者是计算抽样误差并由样本统计值推论总体参数值等。在确定了样本规模和抽样方法抽出样本后,应先对抽出的样本进行评估,目的是初步检查样本对于总体的代表性,以剔出那些偏差太大的样本,重新抽样。评估可以采取收集若干容易得到的资料,例如年龄、性别、文化程度等作为样本于总体之间的比较的方法。一般地说,比较的变量越多,杨本越可靠。

58、
概率抽样(北大93<简>:试说明概率(随机)抽样得主要方法;人大97<简>:简述概率抽样的随机化原则;吉大2000<简>:简述概率抽样的类型及特点):(1)概率抽样:是总体中每一个体都有一个已知不为零的被选机会进入样本。概率抽样分为等概率抽样(随机抽样)和不等概率抽样。(2)简单随机抽样(纯随机抽样):是一种特殊的等概率抽样方法,总体中每一个体均有同等被选机会,而且样本中每一个体是被单独得选出的。他是一种元素抽样。分重复抽样和不重复抽样。(3)随机数字表(南开2000<简>:利用随机数表抽样的基本程序是什么?
):随机数字表是由数字0-9组成的表,由电子计算机编制而成。下面举例说明如何用随机数字表进行抽样:假定研究总体N=528,即总体中有528个个体,我们欲抽选一个由10个个体组成的样本,因为N是个三位数,因此首先从表中的50列数字中随机抽取三列,例如我们选中了第25-27列,然后由上到下从这三列中选出头10个001-528之间的不同的数,当然,不一定非要从这三列的第一行数字开始,可以从任意行开始,直到抽够10个数字为止。如果从这三列抽出的符合要求的数字不足时,就要另外随机抽取三列,从中继续抽取。如果N是四位数,则抽样时首先从表中的50列中抽取四列,再依上法抽出样本。(4)分层抽样(北大96<简>:说明分层抽样与定额抽样的特点及区别;北大97<简>:分层抽样与整群抽样的分类原则有何不同?为什么?北大98<简>:分层抽样与配额抽样有何异同?浙大99、2000<名>;南大2000<名>):分层抽样就是先将总添一种或几种特征分为几个子总体(类、群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本。<1>分层抽样的优点:(A)当一个总体其内部分层明显时,分层抽样能够克服简单随机抽样的缺点。由于它是按群体的特征分布从不同层获得尽可能均衡的样本数,使样本与总体更相似。(B)分层抽样可以提高总体参数估计的精确度。由于它可以将一个内部差异很大的总体分成一些内部比较相似的子总体,从而每一个子总体内抽出一个小样本就能较好的代表总体。(C)有些研究不仅要了解总体的情形,而且还要了解某些类别的情形,分层抽样可以同时满足这两个要求,因为我们可以将每一类看作一个总体。(D)便于行政管理。

(5)系统抽样(或等距抽样,机械抽样)(复旦98<名>;南大94<简>:等距抽样的基本步骤;南大<简>:等距随机抽样的抽样方法):<1>系统抽样是简单随机抽样的一个变种,具体做法是:(A)将总体的所有个体前后排列起来。(B)计算抽样距离。抽样距离K=N/n(N为总体包含个体数;n为样本所含个体数);(C)在头K个个体中,用完全随机的方式抽取一个个体,设其所在的位置的序号是k。(D)自k开始,每隔K个个体抽取一个个体,即陆续抽取的个体所在位置序号为k,k+K,k+2K…k+(n-1)K。

<2>系统抽样的优点:(A)与简单随机抽样相比,更易实施,工作量较少;(B)样本在总体中的分布更平均,故而抽样误差小于或至少等于简单随机抽样,即较其更精确。(C)系统抽样可看成是分层抽样,它等于将总体分为几层,每K
个分子为一层,也就是说可以看作是每层只抽一个个体的分层抽样。两者不同的是,系统抽样的样本个体在每一层的相对应位置上,二分层抽样则是由每层随机抽取的。系统抽样在总体中分布更均匀,精确度叫分层抽样更好。<3>系统抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,就会使系统抽样产生很大误差,降低样本的代表性。
<4>系统抽样适用于同质性较高的群体。当总体内不同类别之间所含个体的数目相差过于悬殊时,采用此法样本的代表性可能较差。这种情况一般使用分层抽样。
(6)整群抽样(聚类抽样)(北大94<简>:试述分层抽样、整群抽样的抽样误差的来源,及他们对这两种抽样分层原则的影响):整群抽样是将总体按某种标准划分为一些子群体,每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群众所有个体合起来作为总体的样本。<1>整群抽样与分层抽样异同:(A)它们在第一步都是根据某种标准将总体分为一些小群(B)但两者的抽样方式不同。分层抽样中所有子群均要抽取一个子样本,作为总体样本的一部分,即总体样本在各层中均有分布。而整群抽样则不然,它是抽取若个子群并将抽出子群的全部个体和起来作为样本,因此,总体样本分布在部分子群众。(C)由于抽样方式的不同,导致两者间划分子群的原则也不同。在分层抽样中,层的划分依据的是层之间异质性高,层内则尽可能同质的原则。整群抽样因仅抽取某几个子群作为整体的代表,如果子群间差异显著,且每个子群内同质性很高,那么这种情况下抽取的几个子群显然无法代表总体。因此,整群抽样得分群原则应与分层抽样不同,它是使得群体间异质性低,群内异质性高,因此,分层抽样适用于界质分明的群体,而整群抽样适用于界质不清的总体。<2>整群抽样的优点:(A)它可以通过转换抽样单位扩大抽样的应用范围;(B)它可以节省人财物力;(C)许多调查往往很难得到总体的所有个体的可靠名单,有时即使可以得到,所需费用也十分昂贵,这就限制了抽样的应用范围。这种情况下,使用整群抽样获得抽样框就容易得多。(D)整群抽样通过将抽样单位由个人转换成群体,使由简单随机抽样和分层抽样所不能进行的抽样调查成为可能
,扩大了抽样的应用范围。<3>整群抽样的缺点:(A)样本分布不均匀,样本的代表性较差,与其他抽样方法相比,相同样本数,抽样误差较大;(B)分析整群样本的资料,如抽样误差,统计推断,假设检验要比前面几种抽样方法复杂;<4>分类:分为等规模整群抽样和不等规模整群抽样,前者总体内所有的群规模都相等,而后者总体内各群大小不一,这种情况下,往往出现样本规模随机变动的问题,为了解决此问题,往往采用子抽样的方法,即从抽出的样本群中再抽一次样,得到所需样本。(7)多阶段抽样(多级抽样):在整群抽样中,当子群数或子群内部个体数目较多,彼此间的差异不太大时,常采用更经济方法,即不将样本子群众的所有个体作为样本,而是再从中用前述各种随机抽样的方法抽取样本,因而最终样本的获得经过两次抽样,我们称其为二阶段整群抽样,同样可做三阶段、四阶段…即多阶段整群抽样。对于群体规模不等的多阶段整群抽样,通常使用概率比例抽样法:是根据每一群的规模分配样本容量。在将总体划分成子群时,每个子群中个体的含量常常不同,在这种情况下,二阶段抽样由于第一次抽取子群大小不同,只有在第二阶段抽样是采取措施,才能使总体中每个分子具有同等进入样本的概率。

多阶段抽样的特点:多阶段抽样通过采用由高级抽样单位过渡到低级抽样单位的方法,解决了低级抽样单位不易获得的抽样框的问题,并且可以使样本的分布较为集中,从而大大降低调查所费人财物力。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同抽样方法,故能综合各种抽样方法的优点,提高样本质量。因此,它特别适用于调查范围大、单位多、情况复杂的调查对象。多阶段抽样由于每阶段抽样都会产生误差,因此经多阶段抽样得到的样本的误差也相应增加,这是它的不足。

59、
非概率抽样(人大96<名>):(1)非概率抽样是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择,因此每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,用这样的样本推论总体是极不可靠的。(2)偶遇抽样(方便抽样):是指研究这将在一定时间、一定环境里所能遇见到或接触到的人均选入样本的方法。优点是方便省力,但样本代表性差,有很大偶然性。
(3)主观抽样(判断抽样,立意抽样)(南大98<名>):主观抽样中的"主观"有两种含义:<1>主观判断的意思,这时,主观抽样又称为立意抽样或判断抽样,即研究者依据主观判断选取可以代表总体的个体作为样本;<2>第二种含义是有目的地选择样本的意思。
(4)定额抽样(配额抽样)(北大96<简>:说明分层抽样与定额抽样的特点及区别;北大98<简>:分层抽样与配额抽样有何异同?北大2003<名>;南大95、96、97、99<名>):它与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分为若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。定额抽样是以代表总体为目的的,因此它必须对总体的性质有充分的了解,定额抽样假定:<1>只要类型划分较细,那么同一类型中的每一个个体都是同质的,因而无需采用随机抽样。<2>只要类型划分合理,而且分配给各类的名额符合总体中各类人员的分布,那么样本就可以准确地反映总体。(5)滚雪球抽样(北大92、93<名>):是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。当调查总体的个体信息不充分时,常采用此种方法。但是,用这种方法抽样最后仍有许多个体无法找到,还有些个体因某些愿意被提供者故意漏掉不提,这两者都可能具有某些值得注意的性质,因而可能产生偏误。(6)空间抽样:是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然是变动的,但在空间上是有限的。空间抽样最重要的是要在同一时间对整个总体进行抽样,以防止它的组成经历太大的变化。

60、
样本容量的确定(北大2002<简>:简述影响调查样本代表性的主要因素;人大2001、浙大1999<简>:简述影响样本容量的因素):(1)样本容量:又称样本大小、样本规模,指的是样本内所含个体数量的多少。(2)影响样本容量的因素:<1>研究的精确度要求:在研究目的是由样本得到对总体的估计时,首先要依研究的目的对这种估计所允许的误差大小做出规定,即确定抽样的精确度。允许误差(精确度)等于抽样误差与概率度t的乘积,t值取决于研究所要求的置信水平。由重复简单随机抽样的误差公式可知,抽样误差与样本大小密切相关,样本越大,越接近总体,抽样误差越小。因此,对样本的精确度要求越高,所允许的误差则越小,样本就应越大,反之亦然。<2>总体性质:在一定精度要求下,总体越大其样本要求亦应越大;总体内部异质性程度越低,所需样本容量越小。<3>分析要求:在确定样本大小时,应估计一下在分析时样本需作哪些分类,并保证每个类别有一个能够统计分析的子样本,相关分析和其后的检验方法要求每个小类的子样本容量不小于10。<4>抽样方法:在选定抽样方法后,须分别考察和计算这一方法所需样本数。<5>无回答;<6>经费。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第六章:测量

第六章:测量

46、
测量的概念:(1)测量(复旦96、97<名>;人大96<名>):对所确定的研究内容或调查指标进行有效的观测与量度。具体地说,是根据一定的规则将数字或符号分派与研究对象的特征(即研究变量)之上,从而使社会现象数量化或类型化。(2)研究变量:是通过对概念的界定和具体化而转化来的,在研究中,它是分析单位所具有的特征或属性。在一具体研究中,每个变量都有特定的测量指标。(3)数字(符号):测量时得到的一定数值可作为某一现象或事件特征的代表符号。(4)分派规则:确定分派数字的规则是测量中最基本、最困难的工作。测量是将各个分析单位与它们的特征或属性用数字分派规则联系起来。所谓规则是指操作的方法或索引,它指导研究人员如何实施测量。(5)有效的测量规则必须满足三个条件(复旦98<名>:测量三要素):<1>准确性:指所分派的数字或符号能真实、可靠、有效地反映调查对象在属性和特征上的差异,用数学概念表述,如果真是状态与符号系统在结构上具有一致的关系,那么两者就具有同构性,同构性越高,所观测的资料就越准确有效;<2>完备性:是指分派规则必须能包括研究变量的各种状态或变异;<3>互斥性:指每一个观测对象(或分析单位)的属性和特征都能以一个而且只能以一个数字或符号来表示。(6)测量的作用:在于作出准确的分类,以便比较研究对象的各种差异,这些差异有些是以等级区分的,有些是以数量区分的。研究对象的差异都是由一定原因造成的。因此通过对差异的比较和分析就能找出现象之间的因果联系。

47、
测量尺度(北大92<简>:举例说明四种测量尺度的特点及区别;北大2001<简>:是举例说明4种测量尺度及其数学性质;复旦98<简>:简述变相的测量层次及其划分意义):(1)定类尺度或名义尺度:测量定类变量的尺度,它是测量尺度中最低的一种,大多数定性测量都适用定类尺度。其严格的区分可分为:<1>标记:可作为一个识别的记号,当数字被用作标记时,它并不表示数量的多少,也不能对它做数量运算;<2>类别:可作为对变量的不同状态的度量,类别区分可说明观测对象的某些本质特征.类别也可用数字表示,这种数字仅用于区分而不能运算。

(2)定序尺度或等级尺度:一个变量如果能够依操作定义所界定的明确特征或属性而排列等级大小、高低、先后的次序,这是就适用于定序尺度进行测量。

定序测量程序:<1>等第顺序法,它要求被试者对一组刺激依某种属性由高到低或由多到少的次序予以排列。<2>配对比较法:要求被试者在一定时间内就所有可能的配对,排列出每对刺激中的大小或多少的顺序。<3>恒常刺激法:这种方法与配对比较法相类似,唯一不同之处是它以一种标准刺激连续地与一组恒常刺激的各个成员相配对地进行比较。<4>连续性类别法:要求被试者把一群刺激分为若干不同的类别,这里的类别已按指定的属性而予以顺序排列。

注意:它们使用的数字仅仅显示等级顺序而已,除此之外,别无其他意义。这些数字并不显示属性的真正量值,并且等级之间的间隔也不一定相等。

(3)定距尺度或等距尺度:具有定类尺度和定序尺度的特征,此外,它还要求尺度上的间距代表所测量的特征的量的间距。即每一等级之间的间距是相等的,它们可以用来加减。但定居尺度上没有绝对的零点,所以不能乘除。
(4)定比尺度或比例尺度:是测量中的最高层次,具有实在意义的真正零点,定比尺度下的数字是可以进行加减乘除的,运算的结果都具有实在的意义。一个变量能否以定比尺度测量,关键在于零点是否是绝对的,最好的检验办法是:零是否可被认为是测量"一无所有"的。(5)四种测量尺度比较(南大2000<简>:定距变量可以变为定序变量吗?反之如何?请举例说明):从数学性质上看,高层次尺度都具有低层次尺度的一切特征,反之则不然。选择测量尺度须注意:<1>社会现象大多只能以定类或定序尺度测量,但有时也可将某些现象近似的视为定距或定比变量,如"智力测验"。这是要注意这种近似计算的合理性和可能出现的偏差。<2>高层次尺度可能获得更多、更精确的信息,但调查和分析的工作量更大,而低层次尺度则相反。因此选择尺度要结合课题要求与研究条件。
<3>用较低尺度收集的资料不能用较高尺度的数学运算来处理,反过来则可以。因此许多研究都是尽量先收集更多、更精确的信息,但在分析时却只作一些简单的运算,这虽然会造成很大的浪费,不过当需要今后作补充分析时,这种策略还是有必要的。<4>一个变量可能适合用各种尺度来测量,选择何种尺度取决于研究所要求的精确度。

48、
概念的具体化与操作化(北大93<简>:是说明概念与假设的操作化过程;北大97<简>:试说明研究课题具体化与操作化的主要内容;北大2000<简>:简述一项调查研究课题的具体化与操作化;南大96<名>:课题操作化;南大95<简>:怎样具体确定测量的尺度;复旦98<简>:课题具体化和操作化的主要内容):因为社会生活中使用的概念通常是模糊的或含义不清的,社会研究如果不对这些概念作出定义和具体化,也就无法对现象进行观察和度量。(1)概念的具体化(浙大2000、2001<简>:试述拉扎斯菲尔德的概念具体化;南大94<简>:如何从概念中引出指示项;北大95<问>:简述概念、变量、调查指标的定义、各自在社会调查中的作用及三者的关系;南大98<简>:对社会学研究概念举例说明概念的来源;复旦96<简>:什么是理论、假设、概念、变量、指标及它们之间的相互关系):<1>概念的形成:概念是在日常生活中通过感性认识和互相交流形成的。是人们对许多现象的复杂而又具体的感受,并以一个名字对这些感受作出整体的、含混的概括。概念是人们思维的产物,它是抽象的,无法直接观察的,因为它本来并不存在,是人们创造了它。<2>概念的界定:使用抽象定义将概念所指的现象于其他现象区分开来。(A)界定的第一步是将概念分解:即从不同角度或维度对概念所表示的现象进行分类,对有些高度抽象的概念要逐步分解;(B)第二步是作出抽象定义:通过分解可大致了解一个概念的基本内容和各种分类,根据分类就可以抽出各种类型的共同属性和特征对概念下定义。在社会研究中,抽象定义的作用是对在何种范围、何种含义上使用这一概念作出精确的说明,因为概念包括许多方面和不同维度。经过严格界定的概念称为变量,变量具体指概念内涵的各种类型或各种状态,它们对应于各种实际存在的事物,因此变量是可以观察和量度的。概念转换为变量形式之后就可以进入科学研究的领域了。<3>选择测量指标:确定如何测量变量,选用那些指标来测量。指标是概念内涵的指示标志,它们直接表示经验层次的现象。指标可以量度现象的不同状态和不同程度。由经验现象的量度就可以说明抽象层次的概念。但指标指标是概念内涵的某一方面或某一部分内容,因此要更有效的测量概念就需要用多个指标。对概念(变量)的具体量度的方案也称为概念的操作定义。<4>编制综合指标:对简单的概念可以用一两个指标来测量,而对复杂的概念,则要用多个指标来测量。<5>概念的具体化过程就是一步步从抽象层次下降到经验层次,使概念具体化为可观测的事物。
(2)操作定义(复旦98<名>;南大98<名>:古典操作定义):就是建立一些具体的程序或指标来说明如何测量一个概念。<1>操作定义的功能:(A)澄清概念在研究中所选用的意义;(B)说明测量变量的操作方法;(C)使一些陈述变量间关系的假说获得验证的机会;(D)使今后同样的研究有所根据,以便比较彼此的结果。(3)测量指标(北大2003<名>;北大93<名>:变量与指标):指标是反映社会现象变异特征的范畴。是对社会范畴的变异方面的规定性加以具体化。它把现象的质的方面与量的方面密切的结合起来,以便精细描述社会现象的某一特征。测量时首先要说明指标,任何一个变量都有许多不同的指标,这是因为测量所依据的事实可以不一样。当一个变量有多个指标时,可以从中挑选若干个来测量变量,挑选指标的原则是方便与适当。各项指标可以分别研究,但有时需要将各项指标综合起来,以提高变量的抽象程度。建立综合指标的方法:类型法、指数法和量表法(4)建立综合指标:<1>类型法:将各指标交互分类,然后建立新的类型,以形成一个新的指标;<2>指数法:是用简明合理的公式综合各指标,以建立一个新的指标。

49、
量度化方法:通过测量而得来的资料可分为三种纬度:(1)物理纬度:可以用客观的标准来测量,而不涉及主观判断。这些量度一般都属于定距或定比尺度。但这种量度只适合于某些社会现象。如事物的状态特征和行为特征。(2)心理物理纬度:包含物理纬度和心理纬度。一般认为,测量心理属性最多可达到定序尺度,而无法使用定距尺度。(3)心理纬度:是利用主观判断所制定的计量标准。缺点是:它们缺乏一套完善的测量理论,即缺乏公理和定理的系统。

50、
观测值的分解:测量理论的基础是数理统计中的误差理论或变异理论。测量理论建立在"任何观测值(测量分数或测量结果)都有误差"这一假设之上。(1)它认为,观测值(X)是有四个部分组成的:<1>真实值T。<2>其他变量的影响值O。<3>系统偏差B。<4>随机误差E。
(测量分数)X=T+O+B+E
(2)随机误差(E)是非系统的变异,它是由于一些无法预料的因素引起的,如被测者的疏忽,粗心等。但是这种影响有正有负,所以要消除或减少随机误差,通常采用多次测量或抽取大量样本的方法,使正负误差相互抵消。(3)系统偏差(B)(南开2001<名>)是有规则的变异,它是由于测量工具、评分标准等直接与测量方法有关的因素引起的。消除或减少系统偏差的方法是采用标准化的测量工具;在测量之前将测量工具与标准尺度相互校对,以修正偏差。但有些系统偏差很难用标准化消除。(4)其他变量的影响(O):也是一种有规则的变异,这种因素不是偶然的,而是内含在测验的题目或量表之中的。这种影响并不能通过多次测验而消除,它是内含在测量指标之中的。消除或减少这种影响主要通过对所研究的变量进行严格的操作化。(5)在评价社会研究中所使用的测量方法时必须考虑以下三个问题:<1>这一测量有没有系统偏差?这种系统偏差会不会影响研究的有效性?一般来说,任何测量都会有一定的系统偏差,因此,测量的主要任务就是使系统偏差控制在最小程度。<2>这一测量是不是可靠的?即随机误差对测量的可靠性有没有影响?假如测量受偶然因素影响很大,观测值就会在较大范围内起伏,在这种情况下,观测是不可靠的,测得得观测值其可信性很低。<3>这一测量是不是有效的?即所测得得数值是否正式向要研究的变量值,其他变量的影响值是否控制为最小?

51、
信度(南大98<名>;北大2004<名>):指测量数据(资料)与结论的可靠性程度,即观测工具能否稳定地测量到它要测量的事项的程度。也就是说信度是指测量的稳定性与一致性而言的。(1)信度系数:信度可以看作系统性变异在观测到的总变异中所占的比率,系统性变异越大,则信度系数越大,表明测量的信度越高;信度也可以看成是在观测到的总变异中,不是因随机误差所造成的变异所占的比率。(2)信度的检查(南开2000<名>):信度通常以相关系数表示。由于测量中误差变异的来源有所不同,故各种信度系数分别说明信度的不同层面而具有不同的意义。在实际应用中,信度系数有如下类型:<1>重测信度:用同一份问卷的问题,对同一群被测者前后调查两次,在根据调查的结果,计算其相关系数,就得到重测信度。这种信度能表示两次调查结果有无变动,反映了测量的稳定程度,故又称作稳定系数。它可以检查出被测者是否能正确理解所提的问题,并作出真实稳定的回答。这是一种测量信度的较好方法,但须注意两次调查相隔的时间要适当,如果时间太短,被测者还记得上次答案,所以测量的是他的记忆,而不是他此时的真实态度。如果间隔时间太长,可能会发生一些变故,影响到被调查者的态度。<2>复本信度:对一项调查的问题,让被调查者接受问卷测量,并同时接受这份问卷的复本的调查,然后根据调查结果计算其相关系数,就得到复本信度。使用复本求取信度可以避免重测信度的缺点,但使用的复本必须是真正的复本,即在题数、形式、内容、难度及鉴别度等方面都与原本一致,仅只在问法与用词方面与原本不同。复本调查可连续或相距一段时间进行,连续实施的复本信度又称等值系数;相聚一段时间实施的复本信度又称稳定与等值系数。<3>折半信度:将调查来的结果,按题目的单、双数分成两半记分,在根据各个人的这两部分的总分,计算其相关系数,就得到折半信度。<4>评分者信度(人大2001<名>):在测量工具标准化程度较低的情况下,不同评分者的判分标准也会影响到测量信度,要计算评分者信度,可计算一个评分者的一组评分与另一个评分者的同一组评分的相关系数。(3)影响信度的因素:在结构化标准化程度较高的测量中,信度主要受随机误差的影响,随机误差越大,信度越低。随机误差的来源主要有:<1>被调查者:如是否耐心、认真、专注、不受情绪波动影响。一般来说,调查时间越长,提出的问题越多、越复杂,信度越低。<2>调查者:是否按规定程序和标准,是否有意或无意的对被调查者施加影响,纪录的认真程度等。<3>测量内容:如提问的措辞含糊不清,不易理解,各种题目内部一致性低,题数少等。<4>测量环境和时间:如研究人员对被调查者有较大"干扰",他人在场的影响,两次测量的时间间隔太长等等。

52、
效度(南大96、97、2000<名>:测量效度;浙大2000<名>:测量的效度):就是正确性程度,即测量工具确能测出其所要测量的特质的程度。效度越高,即表示测量结果越能显示其所要测量的对象的真正特征。测量的效度可以决定所建立的理论解释的正确程度。对效度的检验可以保证不同的研究人员对某一研究变量的意义与内涵有一致的理解。(1)效度的基本原理:从测量分数变异的观点来看,效度就是测量得分的总变异量中,由所要测量的特质所造成的变异量所占的百分比。(2)效度的检查(复旦96、97<简>:效度测定的三种类型是什么?内在联系如何?):<1>内容效度(表面效度)(北大97<名>):考察内容效度旨在系统的检查测量内容的适当性,并依据我们对所研究的概念(变量)的了解去鉴别测量内容是否反映了这一概念的基本内容。内容效度实质上是个判断问题。检查内容效度就是检查有概念到指标的经验推演是否符合逻辑,是否有效。在科学研究中,需要以大多数科学家所接受的概念定义为标准。
<2>准则效度(效标效度)(南大95<名>:标准效度):准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用各种测量工具,其中每种测量方式与效标的一致性称为准则效度。

(A)如果效标或准则是依据将来实际发生的情况而建立的,那么这种准则效度可称为预测效度。预测效度是将已经得到的测量结果与未来实际发生的情况进行比较,以检查两者的一致性。

(B)如果效标识于某种测量方式同时被证明为有效的,则称之为共变效度。共变效度是用来判断其他的测量工具是否可以取代作为效标的测量工具。

(C)如果效标是以实际经验判断为准的,则称为实用效度。实用效度通常用来检查测量工具的实际效果。由于对某些现象的测量过去并没有一定的标准,所以只能依据实际经验来检验测量工具的有效性。

实用效度与共变效度有些近似,如定量化的干部测评方法就是以组织部门传统的考察干部的方法为效标,当它具有较高的效标效度时,由于它省时间、简便易行,所以就能取代过去沿用的老方法。

准则效度的局限:有些作为效标的测量工具只是假定有效的,它本身是否真正有效并没有理论根据,这一缺陷是心理量度化方法所共有的<3>建构效度(南大99<名>;复旦97、98<名>):是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的,因此也称为理论效度。测量同一个概念可以用多个指标,当用X和Y的多个指标来测量两个概念之间的关系时,如果不同指标的测量都反映出理论所假设的关系,那么这些测量就具有建构效度。<4>内在效度与外在效度(北大2003<名>:内在无效度):测量都是在具体的时间、地点对具体的调查对象所作的观测。如果在一项具体研究中,对上述三种效度(内容效度、准则效度、建构效度)的检查都没有发现问题的话,就可以认为这一研究具有内在效度,它的资料和结论可以有效的解答所研究的问题。可以说,内在效度是指一项研究的资料和结论的有效性。而外在效度是指这种研究结论的普遍有效性。对外在效度的检查要考虑样本的代表性和特殊性,以及研究时间、地点、情境和研究内容的普遍意义。

53、
信度与效度的关系(北大93<名>;北大96<问>:说明测量的信度与效度及其相互关系):(1)信度低效度不可能高。如果收集的资料不可信、不可靠,那么它肯定不能有效地说明所研究的对象。(2)信度高,效度未必高(效度有可能很低)。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。如果有效地说明了各种现象,那么它的资料和结论都必然是且必须是可信的。(5)测量的信度是效度的必要条件,但不是充分条件,无信度必然无效度,但有信度未必有效度。反之,效度是信度的充分条件但不是必要条件,有效度必然会有信度,但无效度却未必无信度。(6)效度=信度-,由此可知,效度系数等于信度系数减去。由于其他变量的影响是内含在测量工具之中,因此很难测出他们的变异量(),而信度系数则可由相关系数计算。所以在一些研究中,研究者常用信度系数来近似的说明效度,但这是有缺陷的,因为在社会研究中,其他无控制的变量对资料的效度有很大影响。所以还是应当通过对内容效度、准则效度和建构效度的检查来说明研究的有效程度。(7)由信度和效度的关系可知,所有影响信度的因素也必然影响效度。此外,除随机误差外,效度还受到系统偏差和其他变量的影响。对这些影响课主要考虑两个方面:<1>测量工具;<2>
样本的代表性。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com

袁方《社会学方法教程》笔记总结第五章:社会研究的设计

第五章:社会研究的设计

33、
描述性研究:同探索性研究一样都没有明确的假设,也是从观察入手来了解并说明研究者感兴趣的问题。但进入观察阶段之前必须有一些初步的设想,以避免观察的盲目性:(1)研究的时间性:在横剖研究与纵贯研究之间做出选择;(2)研究的空间范围:以确定观察的地点和对象;(3)研究的主题和内容:明确本次研究究竟要描述什么;(4)研究层次和角度:经验层次还是抽象层次;宏观层次还是微观层次;(5)具体化与操作化:对所使用得概念作出具体定义。(6)调查对象的选取,若为抽样调查,还要确定选取的方法与程序。

34、
解释性研究:主要运用假设检验逻辑,在研究之前需要建立理论框架(理论假设)并提出一些明确的研究假设,然后将这些假设联系起来,构成一个因果模型。建立这些模型的三种方式:(1)列出现象的原因或结果;(2)详析两变量间的关系:与上一种方式不同,他不是在研究之前就列出各种原因或后果,只选择一个最主要的自变量建立研究假设,然后用各种资料来检验这一假设,并在深入详细地分析了这两个变量于其他变量之间的关系之后再建立因果模型;(3)深入分析变量件作用的机制。

35、
横剖研究(浙大99<名>;浙大2001<名>;南大2000<名>):是在某一事件对研究对象进行横断面的研究。所谓横断面是指研究对象的不同类型在某一事典所构成的全貌。人口普查和民意测验多采用横剖研究的方式。横剖研究并不等于静态研究,他也可以进行动态分析。此外,许多理论检验研究都采用横剖设计来探寻因果规律。

横剖研究的特点:调查面广、多办采用统计调查的方式、资料的格式比较统一且来源于同一时间,因而可对各种类型的研究对象进行描述和比较。但资料的深度和广度较差。

36、
纵贯研究(南开2000<名>;复旦98<简>:纵贯研究及其四种类型):是在不同时点或较长的时期内观察和研究社会现象。
纵贯研究类型:(1)趋势研究(北大2004<简>:趋势研究和同期群研究的异同;复旦97<名>;人大2000<名>):是对研究对象随时间推移而发生的变化进行研究。
(2)
同期群研究(北大97<名>;人大2001<名>):是对同一时期同一类型的研究对象随时间推移而发生的变化的研究。同期群研究注重的是某一类型,而不是某一个体的特征。所以在不同时间可以调查不同的人,只要他们都属于同一类型。但每次调查的抽样都应当是随机的,以保证被调查到的样本可以代表这一类型的人。(3)追踪研究(复旦96<名>):是对同一批研究对象随时间推移而发生的变化的研究。追踪研究注重个体特征,因此要求在各次调查中都调查同一批对象。

(4)纵贯研究的特点:<1>能够了解现象的发展过程,能比较不同时期的变化,此外,由于各种变量的时间顺序清楚,因此容易做出逻辑上的因果判断。<2>但纵贯研究的调查范围较小,难以进行不同类型的比较。

37、 普查、抽样调查和个案调查:(1)普查:是对较大范围的地区或部门中的每一个对象都进行调查。

<1>普查的作用:能够对现状作出全面、准确的描述,其目的是了解国情,把握整体的一般状况、得出具有普遍性的概括。
<2>普查的特点:资料的标准化程度很高,可统计汇总和分类比较,调查结论具有很高的概括性和普遍性,可精确反映总体的一般特征。但调查内容较有限、缺乏深度。普查的工作量很大,所花费的时间、人力和经费很多,因此,除统计部门和政府部门外,一般社会研究很少采用这种设计。

(2)抽样调查(人大99<简>:简述抽样调查与个案调查的区别):从研究对象的总体中抽取一些个体作为样本,并通过样本的状况来推论总体的状况。

抽样调查的特点:比普查要节省时间、人力和经费,资料的标准化程度较高,可以进行统计分析和概括,能了解总体的一般状况和特征,调查结果具有一定的客观性和普遍性。但他的调查内容不如个案调查那样深入、全面,工作量也较大,在资料处理和分析上需要运用较复杂的技术。

(3)个案调查(北大99<名>):是从研究对象中选取一个或几个个体进行深入、细致的调查。

<1>主要作用:是详细描述某一具体对象的全貌,了解事物发展、变化的全过程。
<2>特点:与抽样调查相比,个案调查不是客观的描述大量样本的同一特征,而是主观的洞察影响某一个案的独特因素。
<3>典型调查(北大2001<名>;北大2002<简>:简述典型调查的优缺点):也是从研究对象中选取若干具有代表性的个体,对他们进行深入调查。它试图通过深入的"解剖麻雀",以少量典型来概括或反映总体,从特殊性中发现一般性。
<1>典型调查的作用:真实、迅速地了解全局情况。<2>典型调查的特点:与个案调查不同,它要求被调查的对象具有典型性,因此,选取典型是这种方法的关键。典型调查试图解决有个别推论一般,有个性概括出共性的任务,在这一方面它有很大的独创性和应用价值。局限在于:研究者所选择的典型是否具有代表性是很难判断的,因此有这种主管选择的典型而得出的研究结论并不一定能适用于总体或全局。<3>个案调查和典型调查的共同点:它们能够详细地解剖某一个案,能够在实际生活中体验到当时、当地的情景和气氛,能够深入了解社会行为的背景和发展过程。但调查资料难以标准化,只能依靠主观判断得出研究结论,结论的客观性和普遍性难以检验。

38、
研究方法(北大94<简>:社会研究包括哪几种方式?它们的主要原则是什么?):(1)区分研究法的主要标准:<1>资料的类型;<2>收集资料的途径或方法;<3>分析资料的手段和技术。

(2)统计调查:<1>社会研究资料分类:(A)直接调查得来的数据资料;(B)直接调查得来的文字资料;(C)文献资料。
<2>应用:统计调查法不仅可以用于描述性研究和解释性研究,也可用于探索性研究。
<3>特征:(A)使用结构式调查方法收集资料;(B)在对大量个案作分类比较的基础上进行统计分析。(C)由于这两个特点,他成为理论检验研究的最主要的方法,并且通常与抽样调查相结合。

(3)实地研究(北大92<简>:试述实地研究(或实地调查)的优缺点及适用范围;浙大2000<名>;南大2000<名>):是不带假设直接到社会生活中去收集资料,然后依靠研究者本人的理解和抽象概括从经验资料中得出一般性的结论。

特点:(A)得到的资料通常是无法统计汇总的文字资料;(B)是一个较长期的过程;(C)通常集中关注于某一个案。(D)资料收集方法主要是无结构的观察和访问。(E)资料分析主要运用定性分析和投入理解发。
(4)实验:通过实验而收集到的资料与统计调查资料很相似,它们都可以分类汇总和统计。二者区别是:<1>统计调查是在自然环境中,而实验是在人为控制的环境中观测或询问;<2>统计调查所得到的不同变量只是调查对象本身固有的,而实验则是人为施加某种刺激,使调查对象的属性和特征发生某种程度的变化。

(5)文献研究:是历史学的主要方法,它利用现存的第二手资料,侧重从历史资料中发掘事实和证据。

特点:<1>不直接与研究对象接触,不会产生由于这种接触对研究对象的干扰,因而不会造成资料的失真。因此,也被称为间接研究或非接触性研究。<2>它的资料收集方法是与分析方法相联系的,研究者一般是确定了分析方法之后,再去查找某种类型的文献。
文献分析的三种方式:<1>统计资料分析;<2>内容分析;<3>历史-比较分析。

39、
社会学八种"理论群":美国社会学家将当代社会理论区分为八种不同的理论群:(1)结构功能理论;(2)新因果论;(3)社会预言理论;(4)小群体理论;(5)符号互动论;(6)结构主义;(7)新马克思主义(批判理论);(8)民俗方法学与现象学。各种理论群都有自己的方法论和研究范式。在研究方法上,新因果论、社会预言理论主要依靠大规模统计调查的资料;符号互动论、民俗方法学与现象学偏重实地研究;小群体理论通常使用实验方法;其他三种理论则偏重文献研究,但他们也在不同程度上依靠经验调查的资料。上述分歧实际上是自然科学的定量方法、人文学科的定性方法与韦伯的"理解社会学"方法三者分野的延续。它也反映了对社会"科学"和社会研究的不同看法。

40、
定量方法与定性方法(北大2003<简>:简述理论分析与定性分析、定量分析的关系;复旦97<简>:现代社会调查方法有哪些特点):(1)定量方法的共同特点:它是从一组单位中收集各单位的可对比的信息。只有对这种信息才有可能进行计算,并进而对资料做出更广泛的定量分析。运用定量方法就是要对多少可比较的一组单位进行观察,这些单位可以使个人,也可以使群体或机构。(2)定性方法则无法对不同单位的特征作数量上的比较和统计分析,只是对观察资料进行归纳、分类、比较,进而对某个或某类现象的性质和特征作出概括。(3)统计调查与实地研究(个案调查)对比(北大93<详>:是说明统计调查与实地研究的具体程序。两者的主要区别有哪些?它们的逻辑推理过程是什么?北大2004<论>:统计调查与实地研究的异同,并每个各举三个研究题目,注意适用):<1>统计调查范围广泛,涉及大量单位;而实地研究涉及少数个案。<2>统计调查从一个单位中选取少数侧面;而实地研究选区多数侧面;<3>统计调查客观的统计和量度总体特征;而实地研究主观地洞察性的把握个体特征。<4>统计调查用相关分析等客观方法得出普遍化的结论;而实地研究用主观洞察性方法得出普遍化的结论。(4)定量方法的优点:标准化和精确化程度较高,逻辑推理比较严谨,因而更客观、更科学。定量方法还能大大推进理论的抽象化和概括性,促进对现象之间普遍的因果关系得精确分析。(5)定量方法的局限:<1>由于是对大量样本的少数特征作精确的计量,因而定量方法很难获得深入、广泛的信息,容易忽略深层的动机和具体的社会过程。<2>由于社会现象错综复杂,影响因素众多且难于控制,因此要确立两个变量之间的因果关系也并非易事。可以说,所研究的现象越复杂,统计分析或相关分析也就越不可靠。<3>由于许多社会现象都是独特的,无法得出普遍的经验概括,因而也无法依赖数量分析。<4>还有人认为:统计调查只能得到表面的、浮浅的信息,而不能抓住事物的本质特征。他们推崇实地研究法,认为只有通过对日常生活的直接观察,才能获得有关社会生活的有效知识,因为社会是由活生生的任何具体的社会活动组成的,对它必须根据社会成员的动机和主观意义来理解。在他们看来,统计调查、问卷、测量这类方法会肢解和歪曲社会现实,它们实际上是把研究者本人对现实的看法强加于社会世界。他们并不认为主观洞察的方法是非科学的,相反,认为它是获取科学知识的重要手段,他们指出,"日常生活的各个基本方面还是能够直觉地被掌握的,因此而产生的创造性的见解总有一天将成为客观知识。"(6)定性方法的局限:<1>它是依据典型的或少量个案的资料得出结论,这种结论不一定具有普遍性。<2>主观洞察法的分析既有可能获得真知灼见,也有可能导致荒谬的结论,这是因人而异的。由于对这种主观性的分析或结论缺乏客观的评价标准,因此人们也无法对不同的研究结论进行检验。(7)理想的调查研究方法:<1>涉及大量个案;<2>选取多个侧面并且与整体相联系;<3>通过客观计量和统计把握共性;<4>尽可能客观分析并结合主观洞察和理解得出普遍化的结论。

评论:这一设想曾受到系统论和拉扎斯菲尔德的"多变量分析"方法的启发和鼓舞,但近几十年的实践中,由于研究经费和操作化技术的限制,这一理想未能实现。目前,社会科学家所能做到的也只是在资料收集和分析中结合主观洞察的方法。当前的主要发展趋势是:定量方法的应用领域越来越大,同时人们也越来越深刻地认识到定性方法在社会研究中的特殊意义并尽可能使它系统化。目前看来,排斥一种方法或将两者统一起来的努力都是徒劳的。

41、
资料的可靠性和有效性:信度指资料的真实可信程度;效度指资料是否准确有效的说明了索要研究的问题。<1>一般来说,实地研究的资料的可靠性不如统计调查。实地研究依靠个人感官,很难保证调查资料的客观性。而统计调查可靠性真实性较高。<2>统计调查资料的有效性不如实地调查。统计调查往往会导致这种倾向,即把时间和精力花费在收集越来越多的数据资料上,并设计了越来越复杂的分析资料的方法,却忽略了资料的有效性问题。假如资料是琐碎的、枝节性的,那么不管他的数量有多大,分析技术有多精密,也仍然不能有效地说明事物的主要特征和本质属性。<3>对调查研究来说,影响资料信度和效度的因素还包括研究本身对被调查者的干扰。这种干扰表现为:(A)被调查者由于对访问员或问卷措辞的误解等原因,不自觉或无意识的做出错误的不真实地回答。(B)被调查者由于顾虑、反感、不耐烦等原因,而有意识地隐瞒或改变自己真实的行为和态度。<4>尽管客观性和科学性是社会研究追求的目标之一,但完全客观的、不受个人价值观念影响的研究室很难达到的。越来越多的社会学家认识到:"一个调查者的价值观不仅影响他选择的研究课题,而且也影响他研究这些课题的方法和他所应用的资料的来源。"这意味着,不存在判断资料有效性的固定标准或绝对标准。但这并不能否认社会科学的科学性和客观性。因为:(A)从认识论的观点看,人们的思维能否与客观世界相一致是一个实践的问题。此外,自然科学和社会科学都以同样的方式来解决"思维与存在"的关系问题,它们都是假定理性认识与经验证据之间存在着逻辑一致性。尽管社会研究更容易受主观因素的影响,但研究者的基本出发点是:"他们能够通过操作化过程来领悟和描述现实,能够依赖科学验证的绝对标准去评价他们的研究成果,除此之外的唯一选择只能是不搞研究"。当然,所谓判断知识真理性的"绝对标准"是随科学实践的发展而变化的。(B)近几十年来,社会科学为了使理论与证据据有一致性,越来越多地采用更客观,更有信度的方法,统计调查正是在满足这一要求的方向上发展的,他试图最大限度地消除主观因素的影响,但目前,他还未能有效的解决资料的效度问题。

42、
分析单位(北大93<名>;北大2004<名>;复旦98<名>):是研究者所要调查和描述的对象,它是研究的基本单位,研究的最终目的是将这些分析单位的特征会及其赖以描述由它们组成的较大集合体或揭示某种社会现象。(1)一般来说,分析单位等同于抽样单位;但有时,分析单位可能与抽样单位不一致。(2)分析单位不一定是研究结论中所要揭示的单位。(3)社会研究中分析单位的类型:<1>个人:个人是社会科学中最常用的分析单位;<2>群体:指具有某些共同特征的一群人;<3>组织:指由具有共同目标和正是分工的一群人所组成的单位;<4>社区:是按地理区域划分的社会单位;<5>社会产物:指各种类型的社会活动、社会关系、社会制度和社会产品。(4)可以说,分析单位是研究者所要了解的一些个案。选择分析单位是应注意:<1>一项研究课题可以采用多种分析单位;<2>在研究中,如果以某一种分析单位进行调查所收集的资料不能完满的解答研究课题的话,就应当增加或改变分析单位。

43、
研究内容:是指分析单位的属性和特征,它们是研究者所要调查和描述的具体项目或指标。(1)研究内容的类型:<1>状态:是一些客观指标,通过他们可以描述分析单位的基本状况。<2>意向性:是分析单位的内在属性,它是一种主观变量。包括态度、观念、信仰、个性、动机、偏好、倾向性等。<3>行为:是一种外显变量,研究者可直接观察到的各种社会行为和社会活动。(2)根据理论和方法论偏好,研究者可在下列几个方面进行选择:<1>研究层次;<2>抽象程度;<3>解释的方式;

44、
层次谬误和简化论(北大2003<问>:举例说明在推论中容易发生的、与分析单位有关的两类错误):(1)层次谬误(或生态谬误、区位谬误)(北大94<名>;北大97<名>;人大96<简>:简述什么是层次谬误):是指用一种高层次的分析单位做调查,却用另一种低层次的分析单位作结论。层次谬误就是这种将社区特征与群体特征、群体特征与个人特征相混淆的错误。在用统计资料分析时很容易出现这类"层次谬误"。当然,这种推论偶尔也是符合实际的,但它的推理方法则是完全错误的。(2)简化论(或还原论):在社会研究中是指局限于用某类特征来分析和揭示各种复杂的社会现象。实际上,并没有一种普遍适用的分析单位,一项研究应考虑到各种分析单位和各种特征,然后依据理论假设和初步考察来确定较适当的分析单位和研究内容。

45、
研究方案的设计(北大95<问>:设计一个调查研究方案主要考虑哪些方面?复旦97<简>:设计一个调查研究方案主要考虑哪些方面?南开2000<简>:影响调研方案设计的主要因素是什么?南大95<简>:怎样编制调研提纲?南大97<名>:调研程序):(1)研究方案:它是对研究的具体程序和操作方式的规划,即制定研究计划,分解研究课题,然后将所要研究的概念具体化、操作化,并说明研究的各种细节以及所采取的各种策略。研究方案相当于一项工程的设计图和施工方案,如果事先有比较周密和精细的规划,考虑各种问题就比较全面。那么实施过程就会比较顺利。(2)研究方案的内容:<1>阐明研究课题和研究目的;<2>确定研究类型和研究方法;<3>确定分析单位和研究内容;<4>制定抽样方案;<5>制定问卷、观察表格或访问提纲;<6>确定调查的场所和时间计划。并对调查员的任务和工作进度作出安排。<7>研究经费和物质手段的计划、安排。
--
"奇思妙想"http://www.forcode.net
rss订阅: http://feeds.feedburner.com/woodphone
邮件联系我:woodphone@gmail.com