新浪科技

科学大家|投票、选举、排名,有靠谱的方法吗

科学大家

关注

出品 | 新浪科技《科学大家》

撰文 | 夏志宏 南方科技大学讲座教授、数学系主任,美国西北大学终身教授

我是一名数学家,有时候也有人称我为天文学家,但是我现在讲的跟数学、天文关系都没太大关系,严格来说这应该是经济学的一个范畴:选举理论。

其实选举跟排名都是同一个范畴里面的,都是经济学里面的社会选择问题,在经济学里面有很多这方面的研究,也有很多经济学的诺贝尔奖是给了这个方向。

我们该相信选举吗

上图是美国现任总统特朗普跟希拉里,在竞选时的辩论图片。现在我们知道特朗普当了总统,但其实他得的选票比希拉里低了很多,至少有两百万票;2000年美国大选时,小布什当上了总统,当初跟他竞选的是民主党的Gore,Gore得票的整个人数是48.4%票,小布什得的是47.9%票,但小布什却赢得了大选。

这里面主要的原因是选举制度的问题,美国的选举制度不是看多少人投你的票,而是看选举团有多少选举人投票,看你得多少个州。大部分州是这样的,如果你得了这个州的大部分票,那么这个州的票将会全部给你。

那么他们选举人的票得了多少呢?Gore得了266票,小布什得了271票,尽管他这个271票是超过了Gore,但是他得271票,到最后是因为美国的佛罗里达州,这个州到最后很长时间有争议,最后重新数票,数票以后发现小布什比Gore在这个州只多了500票左右,这500票还是有争议的。这个州当初有一个人参选,参选的第三个人是Ralph.Nader,Nader在这个州得了97000张票,而97000张票基本上从民主党那里拿来的,就是Nader当初的主要的票源是民主党的票。所以从这个角度来讲,他假如不参选的话,佛罗里达所有的票就会全部给Gore,这样的话Gore的票远远超过了小布什的票,所以这也是一个非常不幸的例子,小布什最后当上了总统。

这个是美国1860年大选,林肯是美国历史上最伟大的总统,当初北方都希望林肯当上总统,南方都希望其他人当上总统,最有名的候选人是道格拉斯,现在历史上最著名的总统辩论便是林肯跟道格拉斯辩论。

当初整个南方都反对林肯当总统,所以林肯根本就没到南方去竞选,不仅南方,还有其他地方的票也基本上拿不到。但是很幸运的是,反对林肯的人有三个候选人,这三个候选人基本上把票给分了,所以到最后,林肯当上了总统。随后南方宣布独立,美国发生内战,战后又统一。

所以整个选举,到最后影响了历史,人类的历史很多时候就是因为一个简单的选举方法的不同,影响了整个人类历史的发展。

在体育比赛里面,很多时候它的名次,尤其在花样滑冰的时候,它的名次不是仅仅由得分来决定谁是冠亚军,而是在花样滑冰里面除了得分以外还有名次,它是一个非常复杂的公式,这个公式有时候就会发生很有趣的现象。

在1995年世锦赛滑冰的时候,上图中三个人在Kwan没有滑之前,她们三个人排名是陈露第一, Kobek第二, Bonaly第三。结果Michelle Kwan,Michelle Kwan的实力不如其他三个人,所以她基本上不会拿到奖牌,结果她滑了一下以后,因为她的加入,使得最后这三个人,第二名和第三名两个名次就换了一下。比较荒唐的在什么地方呢?她们三个,一二三名已经都滑好了,而且名次都定好了,到最后第四个人,跟她们没有关系的,她滑了以后改变了以前的名次。这个算是一个投票或者算一个选举的方法,所带来的一些比较自相矛盾的问题。

结论是什么呢?有时候选举的方式决定了选举的结果,而不是所谓的人民的意愿。有时候经常会发生的,你是什么样的选举方式,你就有什么样的结果,换一个方式就换一个结果,这个在历史上很多很多时候都发生过。

选举有很多不同的方式,比方在美国投票一次,这一次谁得票最多,这个州就是谁胜。而在欧洲就不一样,比方说法国、英国这些地方,尤其法国,假如三个候选人投票以后,投票最高的候选人会再投票一次,这是一个不同的选举方式。最高得票的再投一次票,这个时候来决定。假如有更多的候选人,他每一次会把这个得票差的拿掉,拿掉以后再投,这是欧洲一般的选举方式。

所以带来一个有趣的问题,为什么美国是两大党,民主党跟共和党,其他的党都很小。而为什么欧洲,比如说法国还有其他国家,有很多很多的小党,一般欧洲的国家你去看都有很多很多的小党,大家可能认为这是文化习惯或者传统来决定的,其实跟文化没有关系。

为什么美国肯定是两大党,而欧洲会有很多很多的小党,很多很多党派,其实就是因为它的宪法里面,它的选举制度决定的,跟文化没有关系。举个例子,在你投票的时候,我假如投票给一个小党派,美国现在有民主党、共和党,我假如投票给一个小党派,那我这一票就浪费了,因为这个小党派不可能出线,他出不去的话我这一票就等于浪费,所以绝大部分人投票肯定投两大党,不然你的票就浪费了。

欧洲为什么会有很多很多小党派呢?因为你第一轮投票的时候无所谓,你投了小党派表示你的意见,你表示你的意愿,然后以后你还有机会,这个小党派哪怕得票不够高的话,他下次还有机会再去投票,所以选民不会浪费他这张票。这就是为什么各个国家的党派的多少,并不是因为这个国家的文化所决定的,而是他的选举制度所决定的。

Saari是我的导师,博士生导师,他是做经济学的。他有一个数学定理,基本上你用任何不同的投票方式,我都可以给这个例子。这个定理告诉我们什么呢?你总归会找到这种情形,你的任何投票方式都会决定你的投票结果。

经济学家为什么要做这个?因为这是一个社会选择的问题,社会选择问题有很多应用,当然排名是一种方式,要把各个学校排名或者班级的学生排名,这都是一个选举方式,只不过这个时候投票不一定是真正的人去投,可能有其他的指标在投票。

选举理论可以在这些领域用

所以在选举里的一个应用是排名,第二个在招聘,还有商业管理和决策,一般人来讲都是有很多选择,你做哪一种选择?你想做最好的选择,这个时候你就要有一定的指标、一定的方式,来把它排名,哪个是第一个选择、第二个选择、第三个选择。还有你要找对象,比如说一个女孩,你想选一个女孩,这个时候她的排名或者你说投票,不是说你爸爸投一票、你的妈妈投一票、你的奶奶投一票,这当然也是一种投票方式,你决定选哪个对象。另外一个可能是你把这个女孩的各种素质,把它加起来,我来决定我把谁排在前面,把谁排在后面,你要选最好的。比方说你喜欢漂亮女孩的话,你打分,给这个漂亮女孩打这个分,然后你喜欢她的性格,那你把她的性格再打分,是不是钱很多,你也可以打分。所以整个你选取对象的方式也是一个排名,就是要各种各样的指标把它打分,这样你最后选择第一、第二、第三。

大家知道有时候做这种选择是非常艰难的一个选择,找对象的时候很多人会动摇不定,不知道选哪个好,所以这个也在选举的范畴,这个也是大家需要考虑的,这个在经济学里面是非常重要的一个理论的一部分,是决策方面的。

我们就来看固定的规则,看有什么情况会发生。举个例子,我是南方科技大学数学系主任,三年前在南科大创立了数学系,我们每年都要招很多人,现在每次招人一般是大家聚在一起,在系里面进行一个投票,看我们招谁。假如现在有四个人应聘想到南科大来工作,我们有30个老师,这30个老师每个人都有自己的想法,每个人都希望或者把自己的朋友招过来,或者希望招自己领域的同事,让自己领域能够发展。

现在我有30个老师整体是这样一个情况,比如说这个例子有3个人他认为A最好,C第二,D第三,B第四,然后这4个人认为DCBA,我们当然系里面就要开始投票,看我们来决定选谁。这个是我们固定一个投票方式,我们不再去考虑其他的方式,就选一个,因为我们只招一个人。你投票以后发现什么呢?你会发现,投票谁得票最多呢?A总共有9票,这里九个人会投A,八个人投B,七个人会投C,这六个人会投D。也就是说我们投票的结果是A得票最多,B得票第二,C得票第三,D得票第四。投票好了以后,我作为系主任就开始打电话给A,然后说希望你到南科大来工作,问他你愿意不愿意来。A突然告诉我他会留在美国,不想回国,所以他不来。所以A我打电话给他,他告诉我非常抱歉,我不来了。那大家觉得我作为系主任,我应该干什么呢?我就会打电话给B,我非要招一个人不可。所以正常的想法是A他决定不来了,那么显然要给得票最多的第二多人,第二多人是B,这个时候大家觉得是非常自然的一个想法,我告诉大家这个可能最糟糕的一个想法,为什么呢?

这个也是对的,但是我现在讲一个更糟糕的情形,刚才我说的也是。我在打电话之前,我打电话给A之前,这是另外一个例子,然后有一个人告诉我,D告诉我,他说我不想到你们南科大去工作了。就是我要给A打电话之前,D告诉我他不想到南科大工作,这个时候一般作为系主任来讲,D反正得票最少,你告诉我来与不来,跟我没什么关系,我仍旧要要给A打电话,告诉A我们要录用你。但是你会发现这是个非常糟糕的决定,为什么呢?假如D退出,他不再参加我们这个招聘,你重新去数一下票,就会发现什么呢? D不在了,我们重新再去数一下,A得9票,B得10票,C得11票。也就是说我们本来已经投票投好了,最差的那个D他告诉我他不来了,假如D不来了以后,你会发现突然一下子我们整个排序反了,这个时候我再去投票,发现C是最强的,而不是A。你会发现这个选举方法是不是很奇怪,而且很荒唐,用选举决定我们招聘谁的话,在这个情形之下,你会发现这基本上是很荒唐的一个过程。

独裁是完美的选举方法?

举了这么多的例子,那我们是不是可以找到一个完美的选举方法?其实从18世纪开始人们就想找一个完美的选举方法,到最后出来一个美国人, Kenneth Arrow,他去年刚去世,Arrow从数学上证明了一个定理。

在这个定理之前,我首先讲两个假设,什么叫选举方法?第一,任何一个选举方法至少满足一些基本的条件,这些基本的条件是什么呢?第一个叫做Pareto条件,它的条件是什么呢?假如所有人的想法一致的话,你的选举结果必须跟大家想法一致,这个条件是个非常简单的条件。第二个条件,IIA条件, IIA假定讲的是什么事呢?A跟B相比的时候不应该受其他因素的影响。

然后在这两个条件之下,Arrow定理说的什么呢?唯一满足这两个条件的选举方法,我们想找一个公正的、没有内在矛盾的选举方法,不是没有,有一个,而且是唯一的选举方法,是独裁。独裁什么意思呢?由一个人说了算,我们把某一个人的选票拿出来作为我们的结果。

为什么这个选举方法满足呢?这个显然满足第一个条件,因为所有人想法一样,这一个人的想法和大家一样;第二个,它没有任何内在矛盾,除了独裁而外,没有任何一个选举方法是合理的、没有内在矛盾的。

这个事让大家非常失望,Arrow花了近十年,去寻求一个非常完美的选举方法,证明了一个数学定理,就是不存在没有自相矛盾的选举方法,当然除了独裁,。Arrow的这个定理使他得了诺贝尔经济学奖,在选举理论里,这是非常基础的一个定理。这里面的学问非常非常大,Arrow拿了诺贝尔奖以后,他有六个学生都拿到了诺贝尔经济学奖。在经济学里,社会选择是一个非常有意义的学科。这些人都有一个共同的特点,这些人本科都读的数学,以后再去读的经济学。

我们显然不喜欢数学上最完美的选举方法,也就是独裁。我想大家可能都有共识,就是所有的东西不能一个人说了算。你可能要问了,有没有哪个方法比其他方法更好一些?这个其实有一些定论,有些方法比其他方法更好一些,有些方法比较糟糕。最好的方法数学上可以证明,是BORDA COUNT,就是加权的方法。假如选五个人,最高的人给4分,第二高的给3分,依次给2分、1分、0分,就是给他打分,从上到下,从数学上可以证明这是最佳的选举方法。因为它充分考虑到选举的每个人之间的排序,而且给相差一分的这种排序方法是最合理的。为什么这么说?什么方法说这个最合理呢?是要从概率上,用这种方法进行排序的话,它发生问题的概率最小。

相对比较完美的选举方式

为什么这个情况下发生问题的概率最小,在选举理论里面有一个简单的例子叫Condorcet Cycle,一个死循环,就像打乒乓球一样,A打的过B,B打的过C,C又打的过A,这种循环之下很难断定是谁更好、谁更差,所以这个时候用Borda Count,所谓的Borda Count这种选法,用这种直接的方法去数分数的话,刚好完美的把对称性考虑进去了,所以用Borda Count这种方法打分的方式,是一个相对比较完美的选举方式。

刚才说Borda的这个选举方法,从概率上讲它是出问题最小的一个方法。但是现在有一个问题,当初跟Condorcet他们在争论的时候争论到一个问题:策略性的投票,这个策略性的投票是什么呢?我刚才说了,你给第一名打最高的分数,第二名降一分,再一名降一分,这个在理论上是非常好的一个方法,它能避免很多问题,但是在实际操作的时候突然发现,在法国科学院投票的时候就发现这个问题,发现这个问题是什么问题呢?我喜欢A,我给A打满分,但是有可能B非常强,是A的竞争对手,这个时候这些人故意的压低,本来A是最好,他认为A最好,B第二,但是他为了怕B跟A去抢票,所以他恶意的去把B的分数降到最低,给他0分,这是非常有趣的一个问题,在投票理论里面。投票理论不仅要考虑从数学上的完善,也要考虑在实用上的完善。在实用的过程中你会发现,假如你用Borda这种方式投票打分的话,你会发现有很多人不按照这个规则去(打分),他故意不按照他自己的想法去投票,而是恶意的去压低竞争对手的分数,所以在实用过程中就发现了这个问题。

当初Condorcet和Borda在争论的时候,到最后Borda也没有办法,他就说我的方法只对诚实的人有用,对不诚实的人是没有用的。所以他最后也承认我的方法只能对诚实的人有用。

但是整个这个世界在投票过程中都是恶意竞争,所以所有恶意的方法都会用出来,这也就是为什么从数学上证明了Borda的方式是最好的方式,但是为什么没有经常性的使用的原因。

在实际过程中,在各个国家政府、各个国家议院都会发生的一个现象,你只要允许他随意打分,都会有不少人去压低他的对手的分数。尽管最强的三个人,比如说最强的肯定是A跟B,但是他会故意的把B分数打低,分数哪怕送给C,他不能把这个分数送给B。这是投票另外一个方面的问题。假如纯去打分的话,这个方法就避免了我们刚才说的Arrow定理提到的内在矛盾问题,但是它带来的其他问题比Arrow选举方法的问题还要多。

排名是如何进行的

最后谈谈排名。排名现在怎么做的呢?一般的排名。比如说一个大学我现在想排名,大家知道很多不同的排名方式,而且有时候他们都说排名是公正的、是公开的,他把指标的权重都把它公开。

其实这里面的猫腻非常非常多,一个排名的方式往往是给各种指标,你可以把这个指标算成是一个人,比如说这个学校的师资力量算成是一个投票,这个学校的学生质量作为一个投票,把学校的就业情况作为一票,跟其他所有的办学相关的你都可以把它当成一票。但是这个时候权重不一样,比如说你的科研质量算成十票,你的其他各种指标可以把它算成一票,比方说最后所有的排名方式就是基于加权平均得来的。其中加权平均还有一个地方,就是他的学校的声誉,声誉本身也是一个投票排名来的,那个也是很多人给这个学校打分得来的,这本身就是一个投票的部分。然后其他的排名都是用各种指标,这些指标作为一个因素,然后进行排名。

即使定了权重以后,里面还有很多东西、很多地方可以去调整。所以基本上这个排名到最后,是把所有的权重加起来,然后大家进行一个选取。你假如跟排名的人好,或者我是上海交大的,比方说我做一个排名,或者我是浙江大学的,比方说我做一个排名,这两个学校都在做,那显然上海交大和浙大的排名名次高,这里面很多很多参数,你去调整一下,基本上让他名次往上高上去,根本是很容易的事,所以这是关于排名。这是为什么你们看到的排名,各种排名的方式决定了这个排名的顺序,当然有些地方是公认的,有些不是公认的,有些地方有很多的操作在里面。

足球联赛排名那些事

当初2003年的时候,那个时候中国有甲A,甲A每年要淘汰一些(球队),每年其他的要晋升上来,要保住甲A的位置当然对各个足球队非常重要。那个时候中国足协有一个规定,怎么排名呢?上年度的排名乘以0.5,加上本年度排名,最后作为最终排名。这个大家想想挺有道理的,我们今年打的比赛排一个名,然后把去年的排名乘以0.5,然后加起来看谁的排名名次高。一用起来你会发现一个问题,这个问题在哪里呢?最后一轮比赛,重庆跟天津争夺最后一个中超的名额,这个时候重庆突然发现本年度的排名已经定下来了,我无论胜还是败,我的名次已经决定,最后一轮假如输给青岛的话,就有机会让青岛超过天津,自己可以成功的晋级。重庆一上来就输了三个球,就是故意的输了三个球。也就是说他故意的把球输给了青岛,青岛就有机会打败天津,然后他就可以晋级。这个时候他一输以后,足协就开始发现这个问题了,他故意输球,而且很有可能他输球了以后会晋级,这一点就很惨。

这个时候,足协到最后为了确保这个事情不发生,足协就做工作,确保要让天津战胜上海,他就要去劝,上海本来是要拿冠军的,而且打天津本来是没有问题的。但是假如上海真的把天津打败的话,天津就会下去,结果重庆输了球反而有好处的情况(就会发生),到最后足协只好劝上海不要拿冠军,这样就把重庆给压下去,果然,本来是要夺冠军的,然后足协做工作,所有这些东西都违反了体育精神,但是足协到最后做工作,让上海顾全大局,最后把球输给了天津。

所以你可以看到排名非常荒唐的一幕,这是一个非常实实在在的例子,我从新闻里面把它拿下来的,大家可能认为,新闻上认为是足协太笨,其实不是足协太笨,就是因为我们刚才说的Arrow定理,以任何方式来排名,它都会有自相矛盾,都会出现这一类型的情况,所以这个事不能怪足协,只能怪我们没有一个完美的选举方法。(图片来源于作者演讲PPT)

注:本文根据夏志宏老师在墨子沙龙的演讲整理而来,有删减。

《科学大家》专栏投稿邮箱:sciencetougao@sina.com  来稿请注明姓名、单位、职务

加载中...