【转帖】Robust 的译文是真棒还是真棒槌默认分类 2010-11-14 10:53:14 阅读58 评论0 字号:大中小 订阅 .
Robust
请问计量经济学文献中经常出现的 Robust 是什么意思, 不仅请翻译,也请说明含义!谢谢!
--------------------------------------------------------------------------------
作者:xuehe 时间:2007-5-29 10:04:00
第 2 楼
翻译为稳健性检验,数理统计有时称鲁棒检验。关于稳健性检验请看教材吧。
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-5-30 4:43:00
第 3 楼
当大样本的时候,样本越大,有些估计或者统计值就会越趋近于一个点,这种情况叫做稳健,有时候并不会趋近一个点,而是无止尽的在一个范围内呈现出散点,这就是不稳健。
当convergence in paobability 的时候,一般这个家伙就是稳健的呢
--------------------------------------------------------------------------------
作者:iamhappy 时间:2007-5-30 9:09:00
第 4 楼
楼上的把consistency和robustness弄混淆了
--------------------------------------------------------------------------------
作者:shufe007 时间:2007-5-30 10:08:00
第 5 楼
就是看看在不同的条件下(如加入其他变量等)其原有的结果是否稳健(系数符号、大小、显著性等)。
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-5-30 16:06:00
第 6 楼
robust译为稳健的,或强健的,或鲁棒的(音译)
含义大致就是估计量比较 稳定
我看的一些文献中,关于robust有两大类,一类是在伍德里奇的书里经常出现的,就是一类统计量,面对未知的假设,这种统计量都是稳定的,都是可靠的。比如异方差稳健估计量
Since testing hypotheses is such an important component of any econometric analysis
and the usual OLS inference is generally faulty in the presence of heteroskedasticity,
we must decide if we should entirely abandon OLS. Fortunately, OLS is still useful. In
the last two decades, econometricians have learned how to adjust standard errors, t, F,
and LM statistics so that they are valid in the presence of heteroskedasticity of
unknown form. This is very convenient because it means we can report new statistics
that work, regardless of the kind of heteroskedasticity present in the population. The
methods in this section are known as heteroskedasticity-robust procedures because they
are valid—at least in large samples—whether or not the errors have constant variance,
and we do not need to know which is the case.
第二类,就是更直观的稳定性,比如最小一乘法min(abs(y-y_hat)),就是比最小二乘法min(sqr(y-y_hat))更为稳健的估计。因为最小二乘法更易受异常值的影响。但最小一乘法是非线性的,也没有最小二乘法那么好的几何解释,所不常用。但从稳健的角度看,最小一乘法是比最小二乘法robust。
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-5-30 19:23:00
第 7 楼
为什么弄混了?
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-5-30 21:31:00
第 8 楼
你在3楼说的就是convergence 嘛,呵呵。
因为robust和convergence 有相同的必要条件,就是large sample
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-5-30 23:59:00
第 9 楼
我觉得他们是一个妈妈生的,名字不一样而以两者关联很大。不过robust的解释我是抄的我本科的老师的解释,难得我还记得。
--------------------------------------------------------------------------------
作者:iamhappy 时间:2007-5-31 12:49:00
第 10 楼
如果你的老师是这样解释robustness,那就是他把两个概念弄混了。
另外,robustness并不是一个大样本的概念,更谈不上大样本是必要条件了。
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-5-31 13:22:00
第 11 楼
楼上见多识广,但我认为,至少从伍德的计量里看来,heteroskedasticity-robust 是需要大样本为条件的.而且,我只见看过伍德里奇的两本计量经济学教科书涉及到robust统计量.所以我还是大胆主观地判断robust的第一层意思(见6楼)是需要大样本条件的. 另一些书上,比如北京大学的陈家鼎,孙山泽,李东风的<数理统计学讲义>里是举的6楼里的最小一乘法来解释robust,就是我见过的第二层意思.
不知道iamhappy能不能与大家分享你关于robustness的概念,这里是学习交流的版块,大可畅所欲言.
[此贴子已经被作者于2007-5-31 13:24:29编辑过]
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-6-2 0:52:00
第 12 楼
在日本人书里也只有在大样本条件下称robust.恩 我要去查查书。
美食家不要老喝咖啡,对身体不好。
--------------------------------------------------------------------------------
作者:iamhappy 时间:2007-6-2 12:40:00
第 13 楼
可以先从robust的定义开始。
可以考虑一下这些问题,
1, robustness的定义是什么?
2,定义中包含大样本的含义吗?
3,大样本在计量学中的定义是什么?实际中有“大样本”吗?为什么要考虑大样本?
4,非参方法是不是比参数方法更robust?bootstrap,subsampling等是否比极限分布更“robust”? "大样本"是“必要条件”吗?
5,efficiency在计量学中的定义是什么?它与robustness有什么关系?
...
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-6-2 15:06:00
第 14 楼
1、关于robust的概念。
我在中文维普电子期刊系统分别输入“robust”和“鲁棒性”,发现有此两个关键词的文章不少,但专门介绍或讨论什么是robust的却不多,记得大约2005年一位西财学统计的师妹给我发了一篇关于“鲁棒性”的综述,好大篇幅,没看完也没什印象了,但现在找不到了,时间有限,下面是从维普里搜的两篇有点代表性探讨什么是“robust”的文章:
第一篇是:《通信管理与技术-2006年4期》中 《什么是鲁棒性》
鲁棒是Robust的音译,也就是健壮和强壮的意思。鲁棒性(robustness)就是系统的健壮性。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,是指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。根据对性能的不同定义,可分分稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。
显然上面这个定义是说的系统的robust,不是指的统计拟合或估计上的robust。
第二篇是:《科技术语研究》中院士来信:
对“robust”中文译名的建议
编辑同志:
robust(robustness)一词近年来在信号处理和声学领域中经常出现,国内专家有按音译的,称为
“鲁棒”、“鲁棒性”,有按意译的,译为“稳健的”、“稳固的”、“宽容的”。根据1996年9月13日发布的国标GB/T 3947—1996上也译为“鲁棒”,我认为robust的意思是一种信号处理技术或算法,它对模型的失配不敏感,所以最恰当的翻译应当是“宽容的”。robustness则可译为“宽容性”,这样比较贴切。
以上意见,仅供参考。
致
礼
李启虎
时间所限,没继续找在统计或计量里所说的robustness,大体清楚,robust不是统计或计量领域才有的概念,不知是否统计领域最先提出robust,但思想完全一致,知道是稳定的,强健的这层含义就行了。
2、嗯,————可上述这robustness概念并不涉及large sample!
3、关于大样本在计量中的定义。
还是不翻书了,不过在统计中,一般把样本数大于30称为大样本,自由度大于30时,t分布和标准正态分布基本没什么区别了。至于是否存在,我想和问robustness是否存在是一样的,如果它不存在,却有一个名字并大家还在这讨论它,比如“为什么要考虑大样本?”那真的很奇怪了。呵呵。之所以要讨论大样本,估计是在参数统计方法下,样本究竟是我少统计量才是值得信赖的。可能这也是为什么Fumio Hayashi的Econometrics第1章是Finite-Sample Properties of OLS 第2章名 就开如讨论Large-Sample Theory的原因吧。无论如何,伍德里奇书上关于Heteroskedasticity-Robust Inference的东西都是要求大样本的,如果没有足够的样本数,这些方法是免谈了。而这也是在计量里最常用的关于robust的方法,所以大样本就是它的必要条件。
4、参数、非参数方法及bootstrap等与robust的关系
谢邦昌 一篇文章中《统计学与Data Mining》中涉及了统计中所robust,并且他总结的很好。其中介绍了非参数,bootstrap,以及robust的联系。非常好,我把它贴上来,供大家参考。
[upload=pdf]viewFile.asp?ID=1333[/upload]
关于非参数估计,包括平滑法、核函数法、最近领法、样条法、小波法等(有一本国内的参考书,介绍得很详细,推荐给大家:《理论计量经济学》,童恒庆著,科学出版社,2005年9月版,比Greene的还要“百科全书”),五花八门,但最终目的和参数回归一样,都是要消除随机误差ε的影响,寻找因变量与自变量的联系规律。但非参数法不需要先验的理论,而是直接找x和y的关系,所以也不存在什么假设和检验的必要了。这样得到的,当然x最能反映y的变化,因此也最robust,但显然,在计量里,参数是有意义的,计量的目的虽然是为了找规律,但同时也为了验证经济理论,所以个人认为,非参数方法永远不可能在计量经济学领域里代替参数方法。毕竟计量的基础是不仅仅是统计学,还有经济学。
5、efficiency与robustness
Efficiency在统计中定义,有一个前提,就是无偏的。如果都是无偏的,那么方差较小的那个估计是efficiency的。样本数越大,就df越大,sigma 当在就越小了,所以越有效,但是这似乎回到了讨论的焦点问题,就是你说的,robustness与large sample从定义上没有联系!
我觉得robustness更多的是一种思想,是一大类方法,并不是程序性的方法(异方差稳键统计量的计算就是一个具体的程序性方法),所以你才说robustness与large sample毫无联系。但我觉得这些问题本身就是人为定义的,就象你说的large sample是否存在一样。特别是这个概念本来就模糊不清,希望在这里讨论能使大家更了解这个robustness,我自己也好象清楚一些了,呵呵。
时间保贵,事情太多,勿勿搜了一些资料,读书太少,希望iamhappy多多指点。
精华
--------------------------------------------------------------------------------
作者:远大前程3 时间:2007-6-2 15:15:00
第 15 楼
我也掺和两句:
鲁棒性我记得是自动控制里的术语,说的是一个系统的抗干扰的能力。比如,不倒翁的鲁棒性就很强:)
计量里没太注意过
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-6-2 22:08:00
第 16 楼
美食家好厉害。
robustness: def: an estimator is said to be robust if its desireable properties are not sensitive to violations of the conditions under which it is optimal. in general, a robust estimator is applicable to a wide variety of situations, and is relatively unaffected by a small number of bad data values.
----- a guide to econometrics
baby以前理解错了,抱歉。
robust 是考证一个estimator是否要的标准之一,虽然不是重要的标准。
five robust estimators are: m estimator, lp estimator,l estimator.trimmed least squares. bounde influence sesitmator.another method is a epecial case, LAR, least aosolut residuals.
另关于美食家的大样本,至于大样本,是否还和变量数目有关?
至于在肯尼迪的书中,robust并没有和大样本取得联系。使用ols假设
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-6-3 1:03:00
第 17 楼
看来还是baby的资源丰富啊..
你说的LAR, least absolut residuals不就是最小一乘法吗?
另,是的,大本样实际上说的是大自由度,没发现公式:回归误差的估计=sqrt((残差平方和)/(样本数-变量个数))吗,分母就是自由度.
[此贴子已经被作者于2007-6-3 1:09:56编辑过]
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-6-3 5:54:00
第 18 楼
多谢美食家,因为我到现在才知道你们说的最小一乘是什么咚咚,最小一乘是我刚才说的几种方法的特例呢。至于efficient和robust的联系,我也没有找到。
我的资源丰富,我要哭了,我家里的计量可是9本,我现在手头上只有3本,这三本都还默认我已经把初中级的书背的滚瓜乱熟了。电子书不算,人家喜欢拿手翻。
ps:你这家伙这么不上msn。你什么时候发财了帮我寄几本书过来啊。
happy兄能不能给个自己的观点呢?
[此贴子已经被作者于2007-6-3 6:01:45编辑过]
--------------------------------------------------------------------------------
作者:iamhappy 时间:2007-6-3 11:24:00
第 19 楼
你没有理解大样本这个概念。
既然你们都有fumio,那就看看第二章,看看所有的结果是不是n->infinity下推出的。很显然,这样的“大样本”是不存在的。任何样本都是有限的,只不过当n很大的时候,一些"大样本"的结果会比较接近而已。
统计上的确有“30”这个提法,但是说这就是大样本是很不准确的。首先,这个说法的意思仅仅是“如果你有30个样本(并且在一定的条件下),那么一些大样本的结果(如CLT)可以看成近似成立”。另外,经济学的数据(特别是一些时间序列数据),不要说30,就是100都很少有让大样本结果很接近的。
那么,如果你理解我以上的话,请就在思考一下,到底为什么要考虑大样本。对了,顺便提一句,计量学中有一分支叫“finite sample econometrics”.
答案提示:可以看看elements of large sample theory -- E.L. Lehmann,或者就看看fumio第二章的引子。
另一个建议是看一本介绍robust statistics的书,就应该会对robustness有个很好的了解了。这些是大样本概念:estimation consistency, testing consistency ...
[此贴子已经被作者于2007-6-3 12:41:04编辑过]
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-6-3 14:09:00
第 20 楼
看来happy说的大样本是指的infinity那么大,我想大样本就是大得足够让统计量不是invalid就可以了吧?
以下是你说的引子:
Fumio的Chapter1 Finite-Sample Properties of OLS 的引子:This chapter covers the finite- or small-sample properties of the OLS estimator, that is, the statistical properties of the OLS estimator that are valid for any given sample size.
Chapter2 Large-Sample Theory 的引子:In the previous chapter, we derived the exact- or finite-sample distribution of the OLS estimator and its associated test statistics. However, not very often in economics are the assumptions of the exact distribution satisfied. The finite-sample theory breaks down if one of the following three assumptions is violated: (1) the exogeneity of regressors, (2) the normality of the error term, and (3) the linearity of the regression equation. This chapter develops an alternative approach, retaining only the third assumption. The approach, called asymptotic or large-sample theory, derives an approximation to the distribution of the estimator and its associated statistics assuming that the sample size is sufficiently large.
Rather than making assumptions on the sample of a given size, large-sample theory makes assumptions on the stochastic process that generates the sample.
以上就是前两章的引子。我想大样本的用处已经说得很清楚了:当情况violate三个假设时,小样本理论breaks down,同时,因为样本数不可能无限,large sample更注意随机数据的生成过程。
你说的finite sample econometrics,以及elements of large sample theory -- E.L. Lehmann这样的书比较专业了,不太好找吧?国内介绍robust statistics的书也没遇见过. 图书馆所有的计量书,以及书店上见过的,网上电子版的书都见了不少, 就是关于robust的书不多.讨论了半天,还不如16楼 baby找到的a guide to econometrics(肯尼迪写的?)就说清楚了计量里的robust.
所以觉得重要的是有一个途径找到正确的书籍, happy似乎了解不少前沿的文献啊, 可以给大家列一个清单吗? 比如作者, 出版年份, 什么地方可以得到等等, 这样就真是一件非常有意义的事了!
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-6-3 19:23:00
第 21 楼
其实我觉得何必在乎大样本这个本身就很模糊的界定呢。只要能近似符合大样本的假设条件(ssumptions),就可以用大样本来解决。还有,我认为30的大样本说法的确不能苟同。因为我做过一个回归,解释变量有十几个之多(很多dummy) ,这种30的样本肯定不够把。
至于肯尼迪的那本书,是我老师介绍的一本衔接中高级的辅助读物,是一本很rich的书。这本书对很多计量的概念的理解,是很有帮助的,里面收录了很多不同的观点方法参考了大量文献资料。里面的第20章专门就讲了robust的问题(我还没有看到20章)。中国我记得是有这本书的,当时我觉得这本书写得精辟的难懂,没有买,美食家可以找找看。这就是我跟你说的,计量不一定要用公式去理解,你看这本书就明白了。
不过美食家,我很奇怪,你不懂线性,你的hayashi怎么看懂的,天才。
--------------------------------------------------------------------------------
作者:tasteconomic 时间:2007-6-5 0:45:00
第 22 楼
晕! 不懂线代能在这混吗? 不要把我当文肓呀.别忘了你的作业ridge regression 方差还是我帮忙你才想出来了的.我是说对自己的线代水平还不够满意,所以想专门学一下矩阵分析.那是老早以前的事了. 不过后来发现没必要了.能将Greene搞定矩阵就基本过关了.hayashi的书收藏了一年多,也没怎么看过,因为没打印的原故.基本上只是当参考书来查. 不过,觉得它的难度比Greene高不了多少. 真的能把Greene完全搞懂就不错了.另外,我打印了wooldridge(2002)的那本书,觉得他的书比hayashi的好. 因为wooldridge的风格就是言无不尽,深入浅出,看起来爽啊,不象其他的点到为止,呵呵.而且wooldridge偏微观,而hayashi是偏宏观了.等我看完wooldridge的再打印hayashi的吧.有兴趣我们来写偏论文怎样?不过现在没时间哈,等放假吧,这也是我不上msn的缘故,我的即时聊天工具,包括QQ,msn都很久没用了
(这是啤酒,不是咖啡,哈哈)
--------------------------------------------------------------------------------
作者:baby8962 时间:2007-6-5 1:07:00
第 23 楼
讨厌,ridge regression 那道题不是我自己做出来的吗?并不算难的题目。我准备把肯尼迪的书看完并学习STATA,我6月25号去巴黎考试GRE,我想申请的学校的项目要求必须有GRE。等我考完你就差不多放假了吧。我们都轻松了再来讨论讨论。哈哈。
喝这么水都会中毒何况是啤酒。哈哈
--------------------------------------------------------------------------------
作者:boulotdodo 时间:2007-6-7 13:47:00
第 24 楼
robust思想在统计中确实很常用,如稳健回归等,可以传统回归改善对异常点敏感的问题,大家可以参考Huber: Robust Procedure...
--------------------------------------------------------------------------------
作者:下流学者 时间:2007-6-19 0:20:00
第 25 楼
谢谢各位高手, 我认为robust就是稳健性, 宽容性了, 不涉及统计方法诸如鲁棒实验, 只是统计结果的的强弱! 鲁棒也只是音译而已!
谢谢!
--------------------------------------------------------------------------------
作者:下流学者 时间:2007-8-13 10:04:00
第 26 楼
为感谢各位的支持, 本人友情建议大家可以看看美国金融杂志2006年第6期的" 治理机制和股权价格", 上面提到有很详细的论述!
--------------------------------------------------------------------------------
作者:zhuyuzlf 时间:2008-6-10 21:52:00
第 27 楼
如果是指robustness against outliers的话 是指在有一定比例的contamination下 能保持较小的bias
这个领域的牛人有Martin, Huber,Hampel,Zamar等,统计方法说白了就是截尾 把high leverage点的influence限制住
除此之外 还有剔除outlier的方法
robust statistics的书的话 Yohai 06年有一本 这个网上就能下 还有04年huber有一本
至于大样本 看收敛速度好了
[此贴子已经被作者于2008-6-10 22:20:33编辑过]
--------------------------------------------------------------------------------
作者:yanty 时间:2008-6-28 12:51:00
第 28 楼
受教了,希望以后版面上有更多类似的讨论!!