中国的腐败问题受到了来自官方和学界越来越多的重视。根据国际透明组织的排名,中国的可感知腐败指数(PCI,又称为清廉指数)排名常年居世界中下游,总体而言,是腐败较为严重的国家。近期的一个新闻是“中国2014年清廉指数排名下降”。我们关心的一个问题是:中国的腐败到底有多严重?这是发展中的正常现象还是说中国的问题尤其突出?乔治梅森大学的Carlos D. Ramirez在2014年1月发表在《比较经济学刊物》(JCE)上的一篇文章“中国的腐败失控了吗?历史视野的中美比较”中回应了这个问题。
这篇文章的基本假设是随国家经济发展,腐败有着先增加后减少的呈倒U型曲线的生命周期。这个理论并非作者原创,而是之前的不同学科的学者(Huntington, 1968; Bardhan, 1997; Laffont, 2008)都强调了这一倒U型曲线。搞清楚中国位于倒U型曲线的哪一个阶段有助于预测中国将来腐败程度发展的趋势,不同国别间同发展阶段的比较有助于知道中国的腐败到底多么严重。
作者选择了比较中国1990年至2011年这一阶段与美国的1870年到1930年。之所以选择这些年份是由于从1870年到1928年,美国的人均收入(以2005年美元计算)从2800美元增长到7500元,而中国从1996年到2009年完成了同样的人均收入增长。
国际透明组织公布的PCI指数是从20世纪80年代才开始发布的,那么如何衡量历史年份中的腐败呢?Goldin and Glaeser (2006)提出了一种统计对应年份报纸中提及“腐败”的相对频率的办法。好在ProQuest提供了最早追溯到18世纪至今美国重要报纸的全文检索,作者选择了五家重要的报纸,并统计了1870年到1930年中“corruption US government”和“corruption Congress”检索出的次数,作为腐败序列,为了计算相对频率,作者还统计了“politic”和“January”这两个普通词汇的检索次数,作为两个新的序列。前者(腐败序列)分别除以后者(两个普通词汇的序列),则得到两个缩减后的序列,可用来表示腐败的相对频率。这样就衡量出了对应年份中美国的腐败。如何衡量中国1990年至2011年的腐败呢?相似的过程,不同的是把检索的词汇换成了“corruption China”和“corruption Chinese government”,同样用“politic”和“January”来做缩减,这样就衡量出了中国腐败的相对频率。
通过对中国和美国比较,本文得出结论:中国在1990年代中期与美国在1870年代,两国人均收入水平相似时,中国的腐败程度远低于美国。美国的腐败程度是中国的7到9倍。当前中国的腐败并不比美国在1920年代后期严重。由于对中国的腐败有夸大的成分(美国媒体在各方面有参与“排华风潮”的倾向),且对美国的腐败存在低估,美国的腐败问题要远比中国严重。从美国的历史经验看,中国的腐败并没有失控。从时间序列的形态看,中国的腐败很有可能随和经济发展而减少。
一些(可能很不靠谱的!)评论:该文采用的报纸词频统计来衡量腐败的的方法很新颖,值得借鉴而且可以推广使用到很多其他问题的研究上。但是我对作者的结论保留认同。我最大的质疑是:用美国媒体的报道来衡量中国腐败的方法是否可行。计算中国腐败的相对频率时,用“politic”和“January”来做缩减是否会大大低估了中国的腐败程度?毕竟美国媒体关于中国报道在数量上应该是远不及对美国的报道。我坚持认为应该用“China”来做缩减是否更合理(如果你发现其实是我没读懂文章,导致我理解错了,请在文章评论里告诉我)。即使中国存在媒体审查,但用中国媒体的数据来做统计是否具有可行性?(中国的重要报纸有没有被电子化,可供全文检索?搞明白这个应该可以拓展我们的研究。)