forcode想看的


forcode看过的


新技术
新趋势
奇思妙想
科学探索
科幻奇幻
资料搜集
网络研究
统计定量
社会学研究
书摘读后感
数码网络
软件评测
数据指标
实用信息
有趣的东西
房地产
网络赚钱
投资创业
新闻评论
网站经营
电影八卦
美景美人
人物朋友
情感回忆梦
forcode生活

2007-06-17

070616:forcode老年人宗教参与研究遇到的问题(同门及导师回复)

forcode:我们同门在google group建立了一个邮件组,导师和同门可以在里面讨论各种问题,forcode在写"影响老年人宗教参与因素"论文时,遇到了一个严重的问题:模型的解释力似乎过小,于是,forcode在邮件组中提出了下面的问题,得到了同门和导师的指导,为了给其他学习定量研究的朋友提供一个可供参考的案例,forcode公布这篇论文写作过程中的各种问题,希望对读者 有所帮助或启发。

forcode在同门邮件组中的提问:

    我这几天在写人口会议的论文,使用的还是李老师给我们的数据中2002年的"中国高龄老人健康长寿调查"数据库,由于这个数据库非常庞大,案例数16064,变量数百个而且涵盖面广,所以具有很大的可探索性,我浏览了一下调查问卷,选取了一个不起眼的变量"D11-9宗教佛事活动"作为因变量,然后选取了"健康状况"、"心理状况"、"社会支持"、"社会经济状况"、"个人情况"、"家庭状况"、"居住状况"、"生活习惯"八类共41个变量(后面有删减,尚未统计)作为自变量,想要用logistic回归做一个模型来预测老年人的宗教参与情况,由于事先没有看有关宗教研究的文献,所以完全凭感觉来选取这些变量,这可能不符合研究方法,也正是因为这样,我在做模型的过程中遇到了问题:类确定系数太小了,加入了我选取的所有变量(除了生活习惯和居住状况还未全部纳入之外)后,总的类确定系数Cox & Snell R Square才0.052,Nagelkerke R Square才0.084,模型总的Chi-square才400.3876527996,这意味着我有一些非常重要的变量没有纳入,或者我对某些变量的重新编码有问题呢?(比如,我将职业编码成两类F2 您60岁以前的主要从事什么工作(职业): (单选)0. 专业技术人员/医生/教师;1. 行政管理;2. 一般职员/服务人员/工人;3. 自由职业者;4. 农民;5. 家务劳动;6. 军人;7. 无业人员;8. 其他;我的编码规则是:0、1、2、6编码为0,参照组;3、4、5、7编码为1;8删除),但是我检查了一遍调查问卷,似乎可能与宗教参与有影响的变量都纳入了,这是不是意味着我用这个数据库来研究宗教参与是失败的呢?能够写论文呢?请李老师和各位同门给我指导一下,谢谢了。
    我将我的编码规则和变量一览表,以及案例筛选代码全部存在附件中的excel文件中,另外spss运行结果我存为spo文件也放在附件中,请大家给我看看,谢谢了。

同门回复一:

      看了你的研究设计,觉得是一个相当有意思也是一个有潜力的问题。就你提出的问题而言,我主要有如下几点看法(或建议):
     1.我run了数据,发现参加宗教活动的老年人比例相当之低,大约只有6.6%。当然这也符合中国的实际状况。不过可以尝试一下,分城乡来做。农村的老年人参加宗教活动的比例相对要高一些。
     2.run模型之前,需要有一些基本假设。人的行为时有目的性的,参加宗教也有目的性。譬如交流的需要、赎罪的需要等等。可以从这些方面入手,操作化。举个例子来说,可以看一下老年人与子女的交往状况,对参加宗教活动的影响。当然,参加宗教活动受到一些客观状况的影响,譬如健康,你也选了,参加宗教活动必须要有一定的活动能力(ADL)保证的。
      这样模型的解释力可能会强一些。
    3. 分类也有有目的性,要与的研究目的相联系。同时,分类不宜过多,多了会占用模型的自由度,从而影响显著性。
 
一些粗陋的想法,你也可以问问李老师,还有其他同门。


同门回复二:

我也遇到类似的问题,也是正在做的论文。类确定系数太低也许是因为自变量对因变量的解释力太弱了,它们所能解释的因变量的方差太少了。


导师回复一:

关于你现在做的文章,我有如下建议:
1、对你的努力要给予肯定和支持!2、我觉得你的研究设计不是特别好。首先你的问题是什么?是想回答哪些变量会影响老年人的宗教佛事活动吗?如果是这样一个问题,那我认为,在中国对于这批老年人来说,不是一个很合适的问题。在中国社会,宗教活动这样的问题多少有些敏感,况且,在中国也多是泛神论者,这样上述变量关系就不会明显,即便是有关系,也好像不是你假设的这种因果关系。其实,这是一个中国老年人健康长寿的研究课题,课题关注的是哪些因素会影响老年人的健康。你的问题可以关注,但我觉得在这个调查不能满足你的要求。我过去做的一项研究中("中国高龄老人生活方式与健康自评的相关因素研究",在我那本书中),是把是否参加宗教佛事作为生活方式自变量来考察的,而国外这方面的研究也有,文中有些讨论,不知你看过这篇文章没有。3、正因为研究设计不是太好,提得问题不得当,所以,感觉是为统计分析而统计分析,这也正是上次谢宇讲座中强调的问题。这样,计算结果不理想也就在预料之中。
没关系,多积累、多练习,总会是有进步的!


导师回复二:

对了,你们都提到了类确定系数,由于这不是线性回归,所以,关于用类确定系数表示解释力一直有不同的看法,所以,很多研究包括我自己,都不会用它来判断方程的有效,主要还是以Chi2变化值来判断的。

forcode回复二:

我当初选择这个变量作为因变量,是考虑到类似法轮功这种民间宗教组织往往打着治病的旗号来发展会员,所以我想老年人的健康状况可能与宗教参与情况相关,现实中也经常看到一些老太太求神拜佛来祛病消灾,我想健康应该会影响宗教参与,希望能够找到一些变量可以预测具有哪些属性的老年人更容易被法轮功这种组织吸引参与,这可能比较有趣。

老师那篇"中国高龄老人生活方式与健康自评的相关因素研究"我们在第二次读书会讨论过。

我在做的过程中也知道可能犯了谢宇所说的统计至上主义(虽然我事先头脑里也有一定的假设),但是作为一种探索性的研究是否可以没有假设就去凭直觉纳入大量变量来寻找可能作用显著的变量呢?然后筛选出显著的变量来建立新的模型呢?因为"健康长寿调查"所包含的数据非常丰富,所以,是不是可以选取其中任何一个有价值的变量作为因变量来分析呢?由于我们是事先获得了这个数据库,然后想发掘这个数据库蕴含的未知变量关系,如果不从数据库出发,而是从以往研究出发,可能建立的假设很难获得需要的变量(因为数据库中没有),所以我觉得从理论出发建立假设这条路,在数据库确定的情况下不太好验证。

"高级社会统计学"那门课的讲义上也说了,类确定系数能否作为方差解释比例存在争议,但是这么低(0.052,0.084)是不是表示肯定解释力很差了呢?如果用chi平方作为衡量标准,那么要多少才比较合适呢?我在老师那篇"社会支持与中国老年人口生活满意度的关系研究"中看到模型一、二、三的chi平方分别是401.25,664.53,746;我现在加入的变量总的chi平方是400.39,这是否可以说还是具有一定的解释力呢?我用这些数据来写一篇论文是否有意义呢?

另外,我打算按骆为祥说的把案例限定为农村老年人来试试,看看是不是能够获得比较高的chi2。

另外,我也感觉到不论回归分析还是别的方法,要确定因果关系真的是非常难。如果获得了显著的回归系数,也只能说二者有确定的相关关系,回归方程中,左右两边的变量可以公式变换把任意一个作为因变量移到左边来,建立模型的意义更大在于预测因变量的状况,比如预测老年人"参与宗教活动"的概率,用来预测的那些变量并不是"参与宗教活动"的原因,仅仅是一些用来预测的指标。
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

标签:

0 条评论:

发表评论

订阅 博文评论 [Atom]

<< 主页

热门文章
============================================================
格兰仕微波炉报价单    英语六级历年真题听力下载    大陆身份证生成器
東方神起的所有反轉劇!!.[含东方剧场](會繼續更新以後的)(已可覲看)
电视剧《靠近你温暖我》全集下载(BT/迅雷/电驴/剧照)
精彩的洞庭湖人鼠大战(4视频+forcode点评)
一百多个电影字幕下载网站,精心收集整理!
(视频)(CCTV10“走进科学”-科幻之旅专题-克隆人 8.14)
国外BT站点和BT种子搜索站(国外完整bt搜索列表)
============================================================
forcode科幻小说《抽水马桶的秘密》正在起点中文网连载
《抽水马桶的秘密》读者评论:
(1)你的书很好看,比大刘,王晋康的创意好太多了,努力吧将来出实体书我一定会买的。(2)很有想象力的作者啊!!估计是看了不少科幻小说的人,希望不要浪费你非凡的想象力。
(3) 读者在自己博客或论坛对《抽水马桶的秘密》的评论。(4)点击此处查看全部的读者评论(18页,1000条以上)
《抽水马桶的秘密》相关帖子:
《远程面包机》提纲|| 《进化论危机》提纲大家一起来设计
抽水马桶是外星人的试管|| 读者推荐超一万票
《抽水马桶的秘密》内容简介:
地球哺乳界正在发生的一次大规模跨物种升级,DNA机制并非人们所想像的那样是决定生命的最终遗传载体,而是类似浏览器这样的转译机制,真正的遗传物质存储在弥漫整个宇宙的光子数据库中,DNA机制实际上是一种设定了进化路径的文明压缩包的解压机制,数十亿年前灭绝的三栖人发明了光子数据库和DNA机制,目的是为了让这个机制最终复活三栖人文明,而人类(裸猿)这一物种在三栖人社会里其实是一种宠物,但是DNA机制似乎出现了点问题,或者说不知道什么原因裸猿突然变得太过聪明了,在播撒了始祖菌(DNA种子)的所有星球,进化路径发展到裸猿阶段,并没有继续演化出最后一步:三栖人,而强大的光子数据库一旦意识到DNA进化机制的这个漏洞,立刻关闭了这些星球对光子数据库的访问权限,这样,这些星球的生态系统都面临着灭绝的危险,因为他们脱离了光子数据库的遗传支持再也无法自然繁殖,只能靠遗传工程来复制现有的基因,或者做些小打小闹的修改,整个宇宙各星球上的基于DNA机制的生态系统都面临崩溃的危险。最终在13世纪,裸猿一族在银河边缘一个不起眼的小星系发现了地球这个由于某种原因至今还刚进化到裸猿初级阶段的星球,为了催熟地球的进化速度,外星裸猿文明开始介入地球的发展,为了防止光子数据库察觉到非地球文明的介入并关闭地球的权限,这种介入始终是暗中进行,因为介入方式的分歧,银河系裸猿文明分裂为两大集团,这两大集团的争斗伴随着人类近现代的发展,于是,文艺复兴开始了、三次科技革命出现了、两次世界大战也来了,直到今天,地球人类为自己的技术进步而沾沾自喜,丝毫不知道技术迅速发展的真正原因以及潜藏的危机。
============================================================
forcode2003年以前的习作:未来的婚姻、远程面包机
forcode朗诵《蜀道难》||forcode的一百多个科幻构思
奇想录:最新奇有趣的新技术和新闻点评|| 订阅“奇想录”