科学大家|投票、选举、排名，有靠谱的方法吗

科学大家

2018.09.2710:22

关注

出品 | 新浪科技《科学大家》

撰文 | 夏志宏南方科技大学讲座教授、数学系主任，美国西北大学终身教授

我是一名数学家，有时候也有人称我为天文学家，但是我现在讲的跟数学、天文关系都没太大关系，严格来说这应该是经济学的一个范畴：选举理论。

其实选举跟排名都是同一个范畴里面的，都是经济学里面的社会选择问题，在经济学里面有很多这方面的研究，也有很多经济学的诺贝尔奖是给了这个方向。

我们该相信选举吗

上图是美国现任总统特朗普跟希拉里，在竞选时的辩论图片。现在我们知道特朗普当了总统，但其实他得的选票比希拉里低了很多，至少有两百万票；2000年美国大选时，小布什当上了总统，当初跟他竞选的是民主党的Gore，Gore得票的整个人数是48.4%票，小布什得的是47.9%票，但小布什却赢得了大选。

这里面主要的原因是选举制度的问题，美国的选举制度不是看多少人投你的票，而是看选举团有多少选举人投票，看你得多少个州。大部分州是这样的，如果你得了这个州的大部分票，那么这个州的票将会全部给你。

那么他们选举人的票得了多少呢？Gore得了266票，小布什得了271票，尽管他这个271票是超过了Gore，但是他得271票，到最后是因为美国的佛罗里达州，这个州到最后很长时间有争议，最后重新数票，数票以后发现小布什比Gore在这个州只多了500票左右，这500票还是有争议的。这个州当初有一个人参选，参选的第三个人是Ralph.Nader，Nader在这个州得了97000张票，而97000张票基本上从民主党那里拿来的，就是Nader当初的主要的票源是民主党的票。所以从这个角度来讲，他假如不参选的话，佛罗里达所有的票就会全部给Gore，这样的话Gore的票远远超过了小布什的票，所以这也是一个非常不幸的例子，小布什最后当上了总统。

这个是美国1860年大选，林肯是美国历史上最伟大的总统，当初北方都希望林肯当上总统，南方都希望其他人当上总统，最有名的候选人是道格拉斯，现在历史上最著名的总统辩论便是林肯跟道格拉斯辩论。

当初整个南方都反对林肯当总统，所以林肯根本就没到南方去竞选，不仅南方，还有其他地方的票也基本上拿不到。但是很幸运的是，反对林肯的人有三个候选人，这三个候选人基本上把票给分了，所以到最后，林肯当上了总统。随后南方宣布独立，美国发生内战，战后又统一。

所以整个选举，到最后影响了历史，人类的历史很多时候就是因为一个简单的选举方法的不同，影响了整个人类历史的发展。

在体育比赛里面，很多时候它的名次，尤其在花样滑冰的时候，它的名次不是仅仅由得分来决定谁是冠亚军，而是在花样滑冰里面除了得分以外还有名次，它是一个非常复杂的公式，这个公式有时候就会发生很有趣的现象。

在1995年世锦赛滑冰的时候，上图中三个人在Kwan没有滑之前，她们三个人排名是陈露第一， Kobek第二， Bonaly第三。结果Michelle Kwan，Michelle Kwan的实力不如其他三个人，所以她基本上不会拿到奖牌，结果她滑了一下以后，因为她的加入，使得最后这三个人，第二名和第三名两个名次就换了一下。比较荒唐的在什么地方呢？她们三个，一二三名已经都滑好了，而且名次都定好了，到最后第四个人，跟她们没有关系的，她滑了以后改变了以前的名次。这个算是一个投票或者算一个选举的方法，所带来的一些比较自相矛盾的问题。

结论是什么呢？有时候选举的方式决定了选举的结果，而不是所谓的人民的意愿。有时候经常会发生的，你是什么样的选举方式，你就有什么样的结果，换一个方式就换一个结果，这个在历史上很多很多时候都发生过。

选举有很多不同的方式，比方在美国投票一次，这一次谁得票最多，这个州就是谁胜。而在欧洲就不一样，比方说法国、英国这些地方，尤其法国，假如三个候选人投票以后，投票最高的候选人会再投票一次，这是一个不同的选举方式。最高得票的再投一次票，这个时候来决定。假如有更多的候选人，他每一次会把这个得票差的拿掉，拿掉以后再投，这是欧洲一般的选举方式。

所以带来一个有趣的问题，为什么美国是两大党，民主党跟共和党，其他的党都很小。而为什么欧洲，比如说法国还有其他国家，有很多很多的小党，一般欧洲的国家你去看都有很多很多的小党，大家可能认为这是文化习惯或者传统来决定的，其实跟文化没有关系。

为什么美国肯定是两大党，而欧洲会有很多很多的小党，很多很多党派，其实就是因为它的宪法里面，它的选举制度决定的，跟文化没有关系。举个例子，在你投票的时候，我假如投票给一个小党派，美国现在有民主党、共和党，我假如投票给一个小党派，那我这一票就浪费了，因为这个小党派不可能出线，他出不去的话我这一票就等于浪费，所以绝大部分人投票肯定投两大党，不然你的票就浪费了。

欧洲为什么会有很多很多小党派呢？因为你第一轮投票的时候无所谓，你投了小党派表示你的意见，你表示你的意愿，然后以后你还有机会，这个小党派哪怕得票不够高的话，他下次还有机会再去投票，所以选民不会浪费他这张票。这就是为什么各个国家的党派的多少，并不是因为这个国家的文化所决定的，而是他的选举制度所决定的。

Saari是我的导师，博士生导师，他是做经济学的。他有一个数学定理，基本上你用任何不同的投票方式，我都可以给这个例子。这个定理告诉我们什么呢？你总归会找到这种情形，你的任何投票方式都会决定你的投票结果。

经济学家为什么要做这个？因为这是一个社会选择的问题，社会选择问题有很多应用，当然排名是一种方式，要把各个学校排名或者班级的学生排名，这都是一个选举方式，只不过这个时候投票不一定是真正的人去投，可能有其他的指标在投票。

选举理论可以在这些领域用

所以在选举里的一个应用是排名，第二个在招聘，还有商业管理和决策，一般人来讲都是有很多选择，你做哪一种选择？你想做最好的选择，这个时候你就要有一定的指标、一定的方式，来把它排名，哪个是第一个选择、第二个选择、第三个选择。还有你要找对象，比如说一个女孩，你想选一个女孩，这个时候她的排名或者你说投票，不是说你爸爸投一票、你的妈妈投一票、你的奶奶投一票，这当然也是一种投票方式，你决定选哪个对象。另外一个可能是你把这个女孩的各种素质，把它加起来，我来决定我把谁排在前面，把谁排在后面，你要选最好的。比方说你喜欢漂亮女孩的话，你打分，给这个漂亮女孩打这个分，然后你喜欢她的性格，那你把她的性格再打分，是不是钱很多，你也可以打分。所以整个你选取对象的方式也是一个排名，就是要各种各样的指标把它打分，这样你最后选择第一、第二、第三。

大家知道有时候做这种选择是非常艰难的一个选择，找对象的时候很多人会动摇不定，不知道选哪个好，所以这个也在选举的范畴，这个也是大家需要考虑的，这个在经济学里面是非常重要的一个理论的一部分，是决策方面的。

我们就来看固定的规则，看有什么情况会发生。举个例子，我是南方科技大学数学系主任，三年前在南科大创立了数学系，我们每年都要招很多人，现在每次招人一般是大家聚在一起，在系里面进行一个投票，看我们招谁。假如现在有四个人应聘想到南科大来工作，我们有30个老师，这30个老师每个人都有自己的想法，每个人都希望或者把自己的朋友招过来，或者希望招自己领域的同事，让自己领域能够发展。

现在我有30个老师整体是这样一个情况，比如说这个例子有3个人他认为A最好，C第二，D第三，B第四，然后这4个人认为DCBA，我们当然系里面就要开始投票，看我们来决定选谁。这个是我们固定一个投票方式，我们不再去考虑其他的方式，就选一个，因为我们只招一个人。你投票以后发现什么呢？你会发现，投票谁得票最多呢？A总共有9票，这里九个人会投A，八个人投B，七个人会投C，这六个人会投D。也就是说我们投票的结果是A得票最多，B得票第二，C得票第三，D得票第四。投票好了以后，我作为系主任就开始打电话给A，然后说希望你到南科大来工作，问他你愿意不愿意来。A突然告诉我他会留在美国，不想回国，所以他不来。所以A我打电话给他，他告诉我非常抱歉，我不来了。那大家觉得我作为系主任，我应该干什么呢？我就会打电话给B，我非要招一个人不可。所以正常的想法是A他决定不来了，那么显然要给得票最多的第二多人，第二多人是B，这个时候大家觉得是非常自然的一个想法，我告诉大家这个可能最糟糕的一个想法，为什么呢？

这个也是对的，但是我现在讲一个更糟糕的情形，刚才我说的也是。我在打电话之前，我打电话给A之前，这是另外一个例子，然后有一个人告诉我，D告诉我，他说我不想到你们南科大去工作了。就是我要给A打电话之前，D告诉我他不想到南科大工作，这个时候一般作为系主任来讲，D反正得票最少，你告诉我来与不来，跟我没什么关系，我仍旧要要给A打电话，告诉A我们要录用你。但是你会发现这是个非常糟糕的决定，为什么呢？假如D退出，他不再参加我们这个招聘，你重新去数一下票，就会发现什么呢？ D不在了，我们重新再去数一下，A得9票，B得10票，C得11票。也就是说我们本来已经投票投好了，最差的那个D他告诉我他不来了，假如D不来了以后，你会发现突然一下子我们整个排序反了，这个时候我再去投票，发现C是最强的，而不是A。你会发现这个选举方法是不是很奇怪，而且很荒唐，用选举决定我们招聘谁的话，在这个情形之下，你会发现这基本上是很荒唐的一个过程。

独裁是完美的选举方法？

举了这么多的例子，那我们是不是可以找到一个完美的选举方法？其实从18世纪开始人们就想找一个完美的选举方法，到最后出来一个美国人， Kenneth Arrow，他去年刚去世，Arrow从数学上证明了一个定理。

在这个定理之前，我首先讲两个假设，什么叫选举方法？第一，任何一个选举方法至少满足一些基本的条件，这些基本的条件是什么呢？第一个叫做Pareto条件，它的条件是什么呢？假如所有人的想法一致的话，你的选举结果必须跟大家想法一致，这个条件是个非常简单的条件。第二个条件，IIA条件， IIA假定讲的是什么事呢？A跟B相比的时候不应该受其他因素的影响。

然后在这两个条件之下，Arrow定理说的什么呢？唯一满足这两个条件的选举方法，我们想找一个公正的、没有内在矛盾的选举方法，不是没有，有一个，而且是唯一的选举方法，是独裁。独裁什么意思呢？由一个人说了算，我们把某一个人的选票拿出来作为我们的结果。

为什么这个选举方法满足呢？这个显然满足第一个条件，因为所有人想法一样，这一个人的想法和大家一样；第二个，它没有任何内在矛盾，除了独裁而外，没有任何一个选举方法是合理的、没有内在矛盾的。

这个事让大家非常失望，Arrow花了近十年，去寻求一个非常完美的选举方法，证明了一个数学定理，就是不存在没有自相矛盾的选举方法，当然除了独裁，。Arrow的这个定理使他得了诺贝尔经济学奖，在选举理论里，这是非常基础的一个定理。这里面的学问非常非常大，Arrow拿了诺贝尔奖以后，他有六个学生都拿到了诺贝尔经济学奖。在经济学里，社会选择是一个非常有意义的学科。这些人都有一个共同的特点，这些人本科都读的数学，以后再去读的经济学。

我们显然不喜欢数学上最完美的选举方法，也就是独裁。我想大家可能都有共识，就是所有的东西不能一个人说了算。你可能要问了，有没有哪个方法比其他方法更好一些？这个其实有一些定论，有些方法比其他方法更好一些，有些方法比较糟糕。最好的方法数学上可以证明，是BORDA COUNT，就是加权的方法。假如选五个人，最高的人给4分，第二高的给3分，依次给2分、1分、0分，就是给他打分，从上到下，从数学上可以证明这是最佳的选举方法。因为它充分考虑到选举的每个人之间的排序，而且给相差一分的这种排序方法是最合理的。为什么这么说？什么方法说这个最合理呢？是要从概率上，用这种方法进行排序的话，它发生问题的概率最小。

相对比较完美的选举方式

为什么这个情况下发生问题的概率最小，在选举理论里面有一个简单的例子叫Condorcet Cycle，一个死循环，就像打乒乓球一样，A打的过B，B打的过C，C又打的过A，这种循环之下很难断定是谁更好、谁更差，所以这个时候用Borda Count，所谓的Borda Count这种选法，用这种直接的方法去数分数的话，刚好完美的把对称性考虑进去了，所以用Borda Count这种方法打分的方式，是一个相对比较完美的选举方式。

刚才说Borda的这个选举方法，从概率上讲它是出问题最小的一个方法。但是现在有一个问题，当初跟Condorcet他们在争论的时候争论到一个问题：策略性的投票，这个策略性的投票是什么呢？我刚才说了，你给第一名打最高的分数，第二名降一分，再一名降一分，这个在理论上是非常好的一个方法，它能避免很多问题，但是在实际操作的时候突然发现，在法国科学院投票的时候就发现这个问题，发现这个问题是什么问题呢？我喜欢A，我给A打满分，但是有可能B非常强，是A的竞争对手，这个时候这些人故意的压低，本来A是最好，他认为A最好，B第二，但是他为了怕B跟A去抢票，所以他恶意的去把B的分数降到最低，给他0分，这是非常有趣的一个问题，在投票理论里面。投票理论不仅要考虑从数学上的完善，也要考虑在实用上的完善。在实用的过程中你会发现，假如你用Borda这种方式投票打分的话，你会发现有很多人不按照这个规则去（打分），他故意不按照他自己的想法去投票，而是恶意的去压低竞争对手的分数，所以在实用过程中就发现了这个问题。

当初Condorcet和Borda在争论的时候，到最后Borda也没有办法，他就说我的方法只对诚实的人有用，对不诚实的人是没有用的。所以他最后也承认我的方法只能对诚实的人有用。

但是整个这个世界在投票过程中都是恶意竞争，所以所有恶意的方法都会用出来，这也就是为什么从数学上证明了Borda的方式是最好的方式，但是为什么没有经常性的使用的原因。

在实际过程中，在各个国家政府、各个国家议院都会发生的一个现象，你只要允许他随意打分，都会有不少人去压低他的对手的分数。尽管最强的三个人，比如说最强的肯定是A跟B，但是他会故意的把B分数打低，分数哪怕送给C，他不能把这个分数送给B。这是投票另外一个方面的问题。假如纯去打分的话，这个方法就避免了我们刚才说的Arrow定理提到的内在矛盾问题，但是它带来的其他问题比Arrow选举方法的问题还要多。

排名是如何进行的

最后谈谈排名。排名现在怎么做的呢？一般的排名。比如说一个大学我现在想排名，大家知道很多不同的排名方式，而且有时候他们都说排名是公正的、是公开的，他把指标的权重都把它公开。

其实这里面的猫腻非常非常多，一个排名的方式往往是给各种指标，你可以把这个指标算成是一个人，比如说这个学校的师资力量算成是一个投票，这个学校的学生质量作为一个投票，把学校的就业情况作为一票，跟其他所有的办学相关的你都可以把它当成一票。但是这个时候权重不一样，比如说你的科研质量算成十票，你的其他各种指标可以把它算成一票，比方说最后所有的排名方式就是基于加权平均得来的。其中加权平均还有一个地方，就是他的学校的声誉，声誉本身也是一个投票排名来的，那个也是很多人给这个学校打分得来的，这本身就是一个投票的部分。然后其他的排名都是用各种指标，这些指标作为一个因素，然后进行排名。

即使定了权重以后，里面还有很多东西、很多地方可以去调整。所以基本上这个排名到最后，是把所有的权重加起来，然后大家进行一个选取。你假如跟排名的人好，或者我是上海交大的，比方说我做一个排名，或者我是浙江大学的，比方说我做一个排名，这两个学校都在做，那显然上海交大和浙大的排名名次高，这里面很多很多参数，你去调整一下，基本上让他名次往上高上去，根本是很容易的事，所以这是关于排名。这是为什么你们看到的排名，各种排名的方式决定了这个排名的顺序，当然有些地方是公认的，有些不是公认的，有些地方有很多的操作在里面。

足球联赛排名那些事

当初2003年的时候，那个时候中国有甲A，甲A每年要淘汰一些（球队），每年其他的要晋升上来，要保住甲A的位置当然对各个足球队非常重要。那个时候中国足协有一个规定，怎么排名呢？上年度的排名乘以0.5，加上本年度排名，最后作为最终排名。这个大家想想挺有道理的，我们今年打的比赛排一个名，然后把去年的排名乘以0.5，然后加起来看谁的排名名次高。一用起来你会发现一个问题，这个问题在哪里呢？最后一轮比赛，重庆跟天津争夺最后一个中超的名额，这个时候重庆突然发现本年度的排名已经定下来了，我无论胜还是败，我的名次已经决定，最后一轮假如输给青岛的话，就有机会让青岛超过天津，自己可以成功的晋级。重庆一上来就输了三个球，就是故意的输了三个球。也就是说他故意的把球输给了青岛，青岛就有机会打败天津，然后他就可以晋级。这个时候他一输以后，足协就开始发现这个问题了，他故意输球，而且很有可能他输球了以后会晋级，这一点就很惨。

这个时候，足协到最后为了确保这个事情不发生，足协就做工作，确保要让天津战胜上海，他就要去劝，上海本来是要拿冠军的，而且打天津本来是没有问题的。但是假如上海真的把天津打败的话，天津就会下去，结果重庆输了球反而有好处的情况（就会发生），到最后足协只好劝上海不要拿冠军，这样就把重庆给压下去，果然，本来是要夺冠军的，然后足协做工作，所有这些东西都违反了体育精神，但是足协到最后做工作，让上海顾全大局，最后把球输给了天津。

所以你可以看到排名非常荒唐的一幕，这是一个非常实实在在的例子，我从新闻里面把它拿下来的，大家可能认为，新闻上认为是足协太笨，其实不是足协太笨，就是因为我们刚才说的Arrow定理，以任何方式来排名，它都会有自相矛盾，都会出现这一类型的情况，所以这个事不能怪足协，只能怪我们没有一个完美的选举方法。（图片来源于作者演讲PPT）

注：本文根据夏志宏老师在墨子沙龙的演讲整理而来，有删减。

《科学大家》专栏投稿邮箱：sciencetougao@sina.com 来稿请注明姓名、单位、职务

科学大家|投票、选举、排名，有靠谱的方法吗

科学大家

了解更多信息 欢迎关注科学探索微信公众号及微博

了解更多信息欢迎关注科学探索微信公众号及微博