决策的结构

2026年01月14日

版权

第一节决策的结构

1．1 小引

在推理或决策问题中要加工处理的情报可区别为三个要素: 样本数据、先验知识和任何可能行为的后果利益(或不利)。显然，后果的估量对于在不确定中的可能行为的选择也许是很重要的帮助。不论是在决定决策的策略时我们所作的形式的评估，还是在推理中例如在经典的显著性检验中选择显著性水平，我们对此作非形式的考虑，都说明这一点。

给后果分配数值的一种方式是由效用论提供的，正如主观概率是个人对不确定情况怎样作出反应的模型一样，效用论则提供在包含不确定性的情况中个人对不同的可能行为方案如何作出反应(或应当作出反应)的模型。从个人势必选择某一个特定的行为方案这一点出发，效用论认为，相对于他如何评估不同的可能性他才这样行动(或应当这样行动)的。这个评价相当于为不同的选择定出一个偏好的顺序，并且选择那个最称心合意的行为。如果这些被优选的行为要成为不矛盾的和协调的(coherent)——按照这些名词在效用论和主观概率理论中所具有的意义——那就隐含着: 个人已给不同的可能行为分配实际的数值: 效用。在选择最佳的行为时，他不过是采取那个有最大效用的方案。效用论者主张: 当个人定出“合理的”(无矛盾的和协调的)选择计划时，便有一个隐含的、他据以行动的效用集合。效用论进一步提出在一个特殊情况中决定对个人相关的隐含效用的方法。当然在实际上个人的行为并不总是合理的，有时受冲动所决定。效用论的看法是: 这种“不合理的”行为是由于对效用论所提供的决策和行为的合适基础完全无知的结果。只要人们懂得这些，他们就会从错误中学习，并且力求在将来能够更合理地行动。

效用论的来源是主观的，但这不是说它仅仅应用于私人因素占显著地位的场合。在某些情况(例如工业、农业等等)中，不同行为的效用的主要成分是清楚的和客观的。因而在这些场合，效用的一般形式及其在决策中的应用是毫无问题的，唯一未决定的是如何定量化的问题。

效用概念早已出现在主观概率的理论中。蓝姆赛提出一种概率和效用相结合的理论，这一对概念在其中是内在地互相联系的。林德莱也赞成这个观点，他说: “……我们曾试图证明把数和不确定事件相联系是合情合理的。现在我们要表明决策的后果也能够有数与其相联，并且这两个数集结合起来便能解决问题和决定最佳的决策。”[1]

1．2 可能的行为

一个决策永远是选择一个行动方案，采取一个行为。除非涉及一个以上的行动方案，便无所谓决策。就是说，你必须面对着两个或更多可能的行动方案之间的选择问题。你可以选择可能途径的集合当中的一个。用决策论的语言，任何决策问题都涉及至少两个不同的可能行为的集合，即行为空间(actionspace)。

简单的决策问题也许只限于两个可能方案之间的选择。复杂的决策问题往往涉及两个以上的可能选择。例如在你毕业时便面对着这样的决策问题: 是否报考研究生? 你也许选择立即工作，而不考研究生。如果工作，你志愿在哪里工作呢? 如果考研究生，你打算报考什么学校呢? 如此等等。

考虑决策的好处是使你晓得首先把你的可能选择加以概观的重要性。仅仅表述一个决策问题就要求你定出可能行为的集合。那么，概观你的可能选择，以免把也许对你是最好选择的一个可能方案遗漏了，是很重要的。另一方面，不要想到太多的可能方案，以致无法把它们加以权衡，也是同样重要的。聪明的决策的一个秘诀是产生足够多的可能选择以便把“好的”选择包括在内，但并不多到这样的程度，以致使你难以作出决定。例如百货公司售货员便不明显地遵循这个原则。售货员要懂得: 让顾客从两三个不同的可能选择中作出决定，却不要使他面对着太多的可能性，否则顾客也许不能够作出决策，什么也没有买便离开商店了。

决策论的原则要求我们把任何决策中的可能行为这样地组织起来，以便选出一个，而且仅仅一个行为。用逻辑术语来说，这些行为必须是不可兼的和穷举的。

要这样地表述你的可能行为，使它们是不可兼的。例如，如果你把“吸烟”和“每天吸半包”看做两个不同的可能的行为，它们便不是不可兼的。不可兼的选择应当是“每天吸烟半包或更少”和“每天吸烟超过半包”。再举一个例子: 在毕业时你对于读研究生或立即工作进行选择。你同时也考虑是否要离开学校到别的地方。你也许要说你有三个可能选择: “上学”、“工作”或者“迁移外地”。但这三者不是不可兼的。如果“上学”和“工作”是指整天的，不是半天的，这两者是不可兼的。但你能够迁移外地工作或者迁移外地上学。因此，第三个选择同其他两个不是不可兼的。你的可能选择必须按下图的模式来表述:

你的可能行为要穷举，意思是说: 无论你做什么事，你要做的是行为空间中的至少一个行为。任何决策问题中的行为集或行为空间必须穷举你的可能方案。例如，如你已决定上学或工作，那么上图的四个行为集对于你的决策目的，是穷举的。它们不是逻辑地穷举的，因为还有其他的逻辑地可能的方案。比方说，你也许觉得健康欠佳，想休养一年。但要是你已排除了这一可能性，上图的行为集就是穷举的了。

人们倾向于用简单的两分法来表述决策问题: 例如，“吸烟”或“不吸烟”。理由之一就是: 这样的可能行为集必定是不可兼的和穷举的。

1．3 可能的状态(https://www.daowen.com)

我们是在现实世界中作出决策或者实行我们的行动方案的。我们都是在一个由许多其他的系统，包括其他的人组成的一个大的系统内部活动的。这个世界，其他人的行为，甚至我们自己的行为，这一切都会影响我们决定采取的行为的结果。因此，在表述一个决策问题时必须考虑在我们实行自己的决策时这个世界会处于什么样的状态中。

在表述一个特定的决策问题时，当然你不必概观整个世界的状态。那是不可能的。但是，你确实需要概观世界的那一部分，它对你选取这一行动方案或另一方案所产生的结果将有所影响。你需要考虑那些对你的决策有关的世界的状态。

例如，假定你是石油公司的一位负责人，对于公司是否投资在一个特定的新地点，必须作出决策。在思考这个决策时你当然已经考虑到那一地点有石油的可能性。但因为即使最好的地质学家也不能够保证那里有石油，你如果并不至少也考虑到在那个地点没有发现石油的可能性，你便显然是不合理的。对一个资金缺乏的小公司来说，进行钻井而不发现任何石油的代价将是经济上的破产。

正如关于可能的行为一样，人们倾向于用简单的两分法来思考，例如，有油或者无油，但如果你仔细地调查实际情况，你将几乎必定发现有中间的可能性，或甚至完全不同的可能性要加以考虑。例如，你钻井的地点光有油是不够的，还要有足够偿还投资的油。所以，你应当考虑可能在那个地点发现的石油的不同产量。此外，一个输油管公司可能正在考虑建设一条新的管道通到很靠近那个位置的地方。如果他们这样做，那就意味着由于运费的降低，你能够从那里的石油获得更好的利润。如果不这样，你的利润将要减少。所以，这是要考虑的另一个可能性。有时甚至一个单纯的可能性对于某一个将要选择的决策也是有关的。

像可能的行动一样，世界的各个不同的有关状态的描述也必须按照不可兼和穷举的析取的方式，因为要把简单的决策论策略表述得能够应用于部分重合的可能状态集，是很困难的。这个假设已知的可能状态集也叫做状态空间(statespace)。

在石油钻探的例子中，“有石油”，“没有石油”和“有输油管通进来”并非不可兼的。不管你在那里是否发现石油，输油管都可以通过来，因此再次有四个而不是三个需要考虑的可能状态。如下图中所示。

如果还有另一个完全不同的状态要考虑，那就会把全集增加到八个状态。例如，主要的产油国家也许要提高油价。这就意味着你的公司也可以提高油价。这个可能性显然同你的决策有关。把这个可能性加进来的简便方法是在上表中“有输油管”和“无输油管”每次出现时都加上“提价”和“不提价”两个短语，这就使你得到由八个不可兼的可能性组成的一个集。八个可能状态中至多有一个状态实际出现。

要保证所描述的相关状态是不可兼的，相当容易做到。但要有把握地说你的集是穷举的——就是说: 这些析取肢中的一个必定发生——就困难多了。你也许以为已经考虑到一切有关的事情，但一个新的考虑仍然能够涌现! 例如，你也许听说有一家别的公司正在考虑购买这个位置的钻探权。

很清楚，考虑有关的可能状态是重要的，但你不能够考虑得太多，因为把它们描述为一个互斥集很快就会把状态的数目倍增到这样的程度: 即使把它们都写下来，你也不能够弄清楚。为什么大公司、政府机构和军队要使用计算机来作出决策，就是这个道理。计算机比人的脑子更善于记忆项目异常复杂的很长的表。

1．4 结果(outcomes)

当你实际做出一个行为时，你的行为便在世界的某个状态中出现。这是你的决策的结果，在世界的某一状态中完成某一行为。这样，一旦你已确定你的选择并且决定世界的哪些状态是相关的，你的决策的可能结果就完全被决定了。

和一个特殊决策问题相应的可能结果可以称为行为-状态对(action-statepairs)。每一对行为-状态决定一个结果，这一事实意味着: 要考虑的结果的数目永远是可能行为的数和状态的数的乘积，这就是为什么你要设法使你的决策问题不要变得太复杂的另一个好理由: 很容易生成比你所能够设想的更多的结果。

让我们举一个简单的例子，假定你的决策问题是要不要穿过一条来往车辆很繁忙的街道。有关的可能状态是被车撞倒，或者安全过街。你的两个可能行为是立即过街或者稍等一会。这两个可能行为和两个可能状态便生成四个不同的可能结果。实际上展示这些结果的最便易方式是用图11那样的一个结果表。四个“盒子”中的每一个都表示你的决策的一个可能结果，例如，左上方的盒子便表示立即但安全地过街的可能结果。

图11 一个简单决策的行为，状态和可能的结果

你作出决策时之所以对结果感兴趣，是由于效用是通过结果同决策相联的。你的效用并非和行为单独相联，亦非和状态单独相联，而是和行为状态对，即结果相联。让我们看看效用在决策中的作用吧。