Ao Yun期间服务器需要避运,所以暂时关闭论坛,等“运期”结束我们会马上重新开放论坛,请大家谅解!谢谢! [08-08-22 1:06:12]
谢益辉:秩和比法(Rank-Sum Ratio,RSR法)简介
作者:谢益辉 发布时间:06-10-06 浏览次数:6693 [ ]

在COS论坛上看到有人问关于RSR法的问题,于是写一篇小文供参考。有何不解的请在下面留言或到COS论坛提出讨论。本来这种方法诞生于医学统计领域,但有其推广价值,且用到的是非参数统计思想,所以发到“非参数统计”栏目。作者联系方式:xieyihui (at) gmail.com;文末有相应的PDF文档下载。

  秩和比法(Rank-Sum Ratio,RSR法)是我国著名统计学家田凤调于1988年提出,后来相继补充和完善的一组全新的统计信息分析方法,是数量方法中一种广谱的方法,针对性强,操作简便,使用效果明显。从理论上讲,它融古典的参数统计与近代的非参数统计于一体,兼及描述性与推断性,非常适合于医学背景的广大用户。传统的参数统计要求样本总体分布类型是已知的(如正态分布),若总体为非正态分布,则样本例数必须足够多,而实际工作往往不能满足;近代的非参数统计虽然不受总体分布的限定,但检验效率低,分辨率不高。秩和比法则弥补了这些缺陷,它从计算RSR开始,确定RSR分布,进而进行各种参数与非参数统计处理,最后对RSR分析结果进行科学阐述。它除了涵义自明,容易推广的优点外,还可以消除异常值的干扰,可以解决指标值为零时在统计处理中的困惑,能在充分利用原有信息的基础上起校正作用。秩和比(RSR)是一个内涵丰富的统计量,是多项指标的一个综合指标,其值波动在0~1之间。它是复合信息的载体,是综合效应的量化指标,也是非参数统计与参数统计相互融通的接口、切人点,有着极强的统计信息功能,在统计管理与统计研究中兼有描述性与推断性。

  简而言之,RSR法实际上就是对于变量的秩(Rank)的一种综合处理评价方法,具体操作过程也比较简单。例如,对于一个多变量的样本,假设样本量为n,评价变量依次为X1,X2,……,Xk;那么,对于样本中的任意一个Case(实际工作中往往就是某一个评价单位),我们可以求出它的每个变量取值的秩的总和,最后用这个秩和除以(n*k),即得到该Case的RSR值。

  在此不得不提醒各位注意的是,此处的“秩”与通常的非参数统计中的秩并不是完全相同的概念,而是与非参数统计中的秩的顺序相反!也就是说,对于n个数字,最小的数字的秩为n,最大的数字秩为1!(注1)

  举例说明RSR的计算方法:对于一个样本X,假设含有5个变量X1~X5,数据如下——

X1 X2 X3 X4 X5
[1,] -1 -4 -2 -2 -30
[2,] 17 5 -5 6 8
[3,] 3 2 -5 -1 8
[4,] -7 7 -3 4 1
[5,] -4 -8 -10 12 10
[6,] 14 14 -14 14 -14
[7,] -1 18 3 6 7
[8,] -14 0 11 -10 0
[9,] -30 23 -1 5 -27
[10,] 26 -7 8 8 -1
[11,] 3 -4 -13 23 -11
[12,] 5 -1 -17 -2 -8
[13,] 10 15 7 6 3
[14,] 10 -12 11 -4 4
[15,] 10 -8 6 -2 -2
[16,] 6 -7 11 1 -1
[17,] -11 -2 -4 -2 -9
[18,] -3 10 -2 -9 -5
[19,] 1 -13 10 -25 4
[20,] -16 -1 -3 2 -5


  第一步,先求出对应的“秩”(注2,注3):

X1 X2 X3 X4 X5
[1,] 12.5 13.5 10.5 14.5 20.0
[2,] 2.0 7.0 15.5 6.0 2.5
[3,] 9.5 8.0 15.5 12.0 2.5
[4,] 16.0 6.0 12.5 9.0 8.0
[5,] 15.0 17.5 17.0 3.0 1.0
[6,] 3.0 4.0 19.0 2.0 18.0
[7,] 12.5 2.0 8.0 6.0 4.0
[8,] 18.0 9.0 2.0 19.0 9.0
[9,] 20.0 1.0 9.0 8.0 19.0
[10,] 1.0 15.5 5.0 4.0 10.5
[11,] 9.5 13.5 18.0 1.0 17.0
[12,] 8.0 10.5 20.0 14.5 15.0
[13,] 5.0 3.0 6.0 6.0 7.0
[14,] 5.0 19.0 2.0 17.0 5.5
[15,] 5.0 17.5 7.0 14.5 12.0
[16,] 7.0 15.5 2.0 11.0 10.5
[17,] 17.0 12.0 14.0 14.5 16.0
[18,] 14.0 5.0 10.5 18.0 13.5
[19,] 11.0 20.0 4.0 20.0 5.5
[20,] 19.0 10.5 12.5 10.0 13.5


  第二步,求出每一个样本点的秩和:

[1,] 71.0
[2,] 33.0
[3,] 47.5
[4,] 51.5
[5,] 53.5
[6,] 46.0
[7,] 32.5
[8,] 57.0
[9,] 57.0
[10,] 36.0
[11,] 59.0
[12,] 68.0
[13,] 27.0
[14,] 48.5
[15,] 56.0
[16,] 46.0
[17,] 73.5
[18,] 61.0
[19,] 60.5
[20,] 65.5


  第三步,将秩和除以(n*k=20*5=100)

[1,] 0.710
[2,] 0.330
[3,] 0.475
[4,] 0.515
[5,] 0.535
[6,] 0.460
[7,] 0.325
[8,] 0.570
[9,] 0.570
[10,] 0.360
[11,] 0.590
[12,] 0.680
[13,] 0.270
[14,] 0.485
[15,] 0.560
[16,] 0.460
[17,] 0.735
[18,] 0.610
[19,] 0.605
[20,] 0.655


  这样就求出了RSR。那么RSR在评价上究竟有什么意义呢?从“秩”的概念不难看出,RSR求出来的就是一个“平均顺序”(把每个评价变量的秩加起来求平均),这个值的大小就可以说明对一个被评价单位的评价优劣。若按照田凤调的定义,那么也就是:RSR越小,则说明对被评价单位的评价越差,反之评价越好。

参考文献:
1、黎有文,秩和比法在医学领域中的应用,《医学文选》,2004 Vol.23 No.6
2、田凤调,秩和比法及其应用,《中国医师杂志》,2002年2月第4卷第2期115

-----------------------------------------------
注1:笔者对田凤调创始这种方法时为何修改秩的定义也感到不解。
注2:关于为什么秩会出现小数的问题请参照任意一本关于非参数统计的书,此处不赘述。
注3:本文中的计算均采用R语言,其中主要用到rank以及sum两个函数。


田凤调简介

中国预防医学科学院研究员,中国卫生统计学会顾问组长、中国卫生统计杂志副主编。曾任中华医学会卫生统计学组副组长、中国卫生统计学会副会长兼秘书长。1993年获国务院有突出贡献的科技者称号。五十多年来从事卫生统计科学研究与教学工作,在普及统计信息知识和推动学术交流中作出了很大贡献。所创立的“秩和比法”是一种全新的实用数量方法,集参数统计与非参数统计于一身,有描述有推断,能提高统计分析与再分析的水平,满足人们在统计研究与统计管理中的各种需求,这是医学统计方法的创新。主编了《卫生统计应用丛书》、《医学正常值的统计研究方法》、《实用卫生统计学》、《秩和比法及其应用》等书,发表学术论文数百篇。

下载全文:如果图片缩小请点击放大谢益辉:秩和比法(Rank-Sum Ratio,RSR法)简介>>>

相关附件:无
相关文章[]:无
下一篇:[06-10-06] SPSS教程、资源下载
上一篇:[06-09-25] 《SPSS编程与数据管理》:读入SAS 数据文件
相关评论:
[06-11-06]yzh319 (at) 163.com
这是把五个因子的影响程度等同了,比较粗糙,如果对每个因子附以权重,采用加权秩和比就更好了
[06-10-08]xieyihui (at) gmail.com
优点:简单;缺点:太简单
[06-10-08]Rtist (at) Rtist.edu
反正我是没看出有多大的优越性
[06-10-07]xieyihui (at) gmail.com
其实思想挺简单的,看来国人还是爱偷懒啊,呵呵
[06-10-06]colinisstudent (at) sohu.com
好奇特的方法
添加评论:
Email:
验证码:
评论[最多2000字节]: