| 谢益辉:非参数统计——鱼与熊掌不可兼得 | |||||||||
| 作者:谢益辉 | 发布时间:06-06-19 | 浏览次数:6888 | [大 中 小] | ||||||
注:某日,突然接到赵博元同学来函,曰急需非参数统计小文一篇,乃王星老师精品课程建设所需,遂满纸荒唐言而得此文。 在统计推断中,如总体均值的区间估计、两个或多个均值的比较、相关分析和回归系数的假设检验等,大都是假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。 在许多实际问题中,总体分布函数形式往往不知道或者知道的很少,例如只知道总体分布是连续型的或离散型的,这时参数统计方法就不适用,此时需要借助另一种不依赖总体分布的具体形式的统计方法,也就是说不拘于总体分布,称为非参数统计(nonparametric statistics)或分布自由统计(distribution-free statistics)。 从参数统计到非参数统计,我认为是统计思维的重大转变(此处并没用“跳跃”一词),但是对于这种转变或者非参数统计本身应该如何评价,也不能简单以褒贬来概括。在我的理解上,非参数统计与参数统计并没有优劣之分,而是平等的思维方式。表面上看来,非参数统计可以舍弃总体分布形式于不顾,貌似是统计分析技术的重大进步,因为在此之前,参数统计已经有了很长的历史,发展起来的体系也比较完善,但无论如何,在完美的数学假设条件下建成的体系,到了实际应用领域,总会遇到假设前提不满足的情况,这使得统计的应用颇为受限;非参数统计对于分布函数条件的放松,从统计分析和应用的角度来说,确实让统计学家们松了一口气,甚至可以通俗地讲:只要有数字,就可以作统计分析。这一点对于非参数统计来说,是毫不夸张的。 然而,“中庸之道”似乎总在冥冥之中控制着一切。 我们知道,在非参数统计中,最重要的概念恐怕要数“秩”(rank)了。什么是秩?秩就是有关顺序的统计量。在非参数统计的“眼”中,一般是看不到具体数值的,而是只有数值的顺序;比如,对于一组样本数据:
在非参数统计分析中,我们需要的只是每个数值的顺序:
舍弃具体数值,只留下其秩。显然,这造成了严重的信息损失。“鱼与熊掌不可兼得”即此意。 不难发现,对于这样一组样本数据:
在非参数统计分析中,它与上面那组样本数据是没有差别的,如果看到这一点,可能就会有人对非参数统计方法提出质疑了。 因为“秩”是一种离散的量,所以即使不了解非参数统计的内容,也能大致猜测出其中采用的方法应该是处理离散数据的方法。事实上,非参数统计中采用的统计分布也的确是诸如二项分布、超几何分布等离散分布。 |
|||||||||
|
|
|||||||||
| 相关附件:无 | |||||||||
| 相关文章[非参数统计]:无 | |||||||||
| 下一篇:[06-06-19] R for Beginners中文版 | |||||||||
| 上一篇:[06-06-16] 孰是孰非?——列联表的“迷宫” | |||||||||
| 相关评论: 这个话题也不是我所能讲的……你可以参照范剑青主页上的一篇文章:"Prospects of Nonparametric Modeling" (http://orfe.princeton.edu/~jqfan/papers/pub/jasaoverview.ps)
我想知道非参数统计学的历史,发展过程
我个人认为,在考虑非线性的情况下,非参数要比参数方法好!!毕竟解决了参数方法不能解决的问题
精髓啊!!
其实不光是非参,统计本身又何尝不是一种信息丢失和信息获得矛盾之间的艺术呢。想一想,当我们把实体的样本映射到一个二维表的时候,我们的指标能涵盖样本的所有特征吗? 广义的讲,信息的处理一定伴随信息的丢失,但有意义的是,我们看到了我们想要的那个侧面,这或许是统计真正意义的所在吧 我也感觉好像只写了一半,如果能写的详细些就好了。具体方法的涉及好像也不是很多呀。还有具体哪里冲突了,我还是不清楚。
有时量的概念可以弱化时,用非参数统计非常方便,并且有着比参数统计更为绝妙的效果。比如,在体育比赛的裁判员主观评分项目中,(如自由体操等的打分属于此类)如果裁判员的打分带有主观的个人倾向的话,可以视为异常数据,众所周知,如果此时用非参数处理异常值则会起到很好的效果,使得统计的结果更加稳健。
可能是觉得我的有些话为时过早吧,不过我觉得她是误解我的意思了……
哪里冲突了?不都是她上课讲的么?
本文中的观点与王星老师的观点产生严重分歧,最后被老师枪毙了(本来是想放到非参数统计精品课程网页上去的)……但是,我仍然坚持我的观点:)
谢谢,刚刚学习了这篇文章
说完“鱼与熊掌”,也就算完了。那天急着催我,我也就只是潦潦草草写了一通……
怎么感觉只写了一半?
|
|||||||||
| 添加评论: | |||||||||