体育中的博弈论
利用博弈论中著名的“囚徒困境”,来揭示体育界愈演愈烈的兴奋剂问题,也许可以给我们很多新的启示。
对局者在预知对手策略的情况下如何应对,以达到最佳结果, 这就是博弈论(Games Theory) 研究的内容。这一理论所针对的“对局”,不仅仅是指扑克游戏或侧重于战术策略的各种体育比赛,还包括需要作出经济、军事决策乃至国家外交政策的各种极其严肃的活动。所有这些“对局”都有一个共同点,就是对局者会依据公开的选项范围,分析对手的每一“步”行动。
著名的“囚徒困境”就是博弈论的一个经典实例:你和同伙落入法网,被分开关押,无法串供。你们事先约定,大家都打死不招,然而地方检察官给出了下面几个选择:
1.如果你坦白交待而同伙拒不认罪,那么你将被释放,而他将蹲三年监狱;
2.如果他坦白交待而你拒不认罪,那就轮到你蹲三年大牢,而他获得自由;
3.如果两人都坦白,每人各处两年有期徒刑;
4.如果两人都不认罪,每人各处一年有期徒刑。

上表名为“博弈矩阵”,概括了上述四种结果。
从这些结果来分析,背叛同伴似乎是你的最佳选择。我们先从罪犯甲的角度来考虑,他唯一无法控制、又能影响结果的因素就是罪犯乙的选择。假定罪犯乙始终保持沉默,那么,罪犯甲坦白交代结果最佳,可以躲过牢狱之灾;如果他选择保持沉默,结果也还不错,只要蹲一年大牢。因此,对于罪犯甲来说,最好的选择就是坦白。现在,我们假设罪犯乙认罪。在这种情况下,对罪犯甲而言,情况依然是坦白交待胜过拒不认罪——坦白会让他被判两年监禁,否则迎接他的将是三年铁窗生涯。由于两名罪犯面临的情势完全相同,因此无论对方如何选择,对另一个罪犯来说,最好的办法都是坦白。
这不仅仅是理论上的结果,也得到了实验的证实。当参与“囚徒困境”博弈的受试者彼此间不允许通气时,只玩一次或固定次数的对局,他们常用的策略就是坦白交待。如果受试者玩次数不定的对局,那么最常用的策略便是“针锋相对”:开始时,受试者都会遵守约定保持沉默,但随后就会根据对方的表现来决定自己的选择:你义气我也义气,你不仁我也不义。多人囚徒困境的对局中,如果局中人玩的次数增多,彼此间形成信任,则可能出现更加合作的模式。不过研究表明,一旦大家都争相坦白而导致背叛成风,就会出现多米诺骨牌式的崩盘局面。
在自行车、棒球和其他一些体育项目中,参赛者按照一组规则彼此竞争。自行车竞赛规则明文禁止使用兴奋剂。但这类药物极其有效,服用以后又很难检测出来(尽管还是有可能),再加上成功之后名利双收,使运动员们无法抗拒禁药的诱惑。一旦几位车手依靠兴奋剂获得佳绩,其他遵规守纪的选手也必定效仿,导致违规之风愈演愈烈。由于违规将导致重罚, 车手们全都对此保持沉默。因此,通过公开协商来扭转这种局面、使比赛回到正轨的想法,是不现实的。
以前的情况并非如此。20 世纪40 年代到80 年代,许多车手都服用兴奋剂和镇痛药。直到1967 年环法自行车赛中,英国车手汤姆· 辛普森(Tom Simpson) 因过量服用安非他明而在旺图山赛段爬坡时猝死,兴奋剂禁令才随之出台。即便在辛普森的悲剧之后, 整个70 年代和80 年代,反兴奋剂条例的执行也时紧时松。由于对服用禁药没有明确的规定,很少有人把使用兴奋剂视为作弊行为。但随着90 年代出现的一个新生事物,博弈矩阵被改变了。 |