2.1.1 传统的收益管理
根据研究问题中资源的属性分为单资源的收益管理和多资源的收益管理,其中多资源收益管理又称为网络收益管理。
1.单资源收益管理研究
最早的收益管理方法是由Littlewood(1972)提出的[5]。在该模型中,假设只有高价票和低价票两种票价,且低价票需求先于高价票需求到达。r1和r2分别表示高等级价格和低等级价格,D1是对高价票的随机需求,y1表示高价票的保护水平。Littlewood提出了以下准则:只要卖出一张低价票的收益不小于将其保留为一张高价票获得的期望收益,即只要满足下式:(https://www.daowen.com)
r2≥r1Pr(D1≥y1) (2-1)
就应该卖掉这个低价票。式(2-1)中,Pr(D1≥y1)表示有y1个高价票需求到达的概率,r1Pr(D1≥n1)是将座位预留给高价票的边际期望收益。
在Littlewood准则的基础上,Belobaba博士提出了一种启发式模型EMSR(Expected Marginal Seat Revenue)[16]。EMSR模型在原有的Littlewood模型上进行改进,将原有的只有两等级票价模型变为了多等级票价模型。由于EMSR启发式模型容易理解且被证明有很好的鲁棒性,因此,该模型被很快地应用到实际操作中。然而就像很多启发式算法一样,EMSR模型在某些情况下与最优解存在一定的差距,Brumelle等(1993)[17]、Wollmer(1992)[18]以及Robinson(1995)[19]通过数据模拟等方法都证明了这点,并基于相同假设提出了存在最优解的条件。其中Brumelle等(1993)[17]假设低价票顾客到达时间在高价票顾客之前(Low Before High,LBH)且需求分布是连续的,Robinson(1995)[19]释放了这个假设但依然假设顾客的到达并不是随机分布的。Curry(1990)[20]利用这个假设将每一个单航段组合起来形成了一个网络问题并用数学规划的方法和收益的凹函数特性来求最优解。Wollmer(1992)[18]同样假设了LBH但需求分布模型变成了离散模型。以上这些模型都是假设各票价等级之间的需求是独立的。基于EMSR启发式模型中的假设在实际情况中是有一定的局限性的,因为实际售票中各票价等级之间的需求是互相影响的,且EMSR是个静态模型,没有将售票过程中的一些状态变化考虑在内,例如顾客到达的随机性等。但是即便如此,EMSR因为其计算简单,易于操作,故在航空公司的实际应用非常广泛。
为了释放LBH这个假设条件,很多学者提出了将顾客到达过程描述成一个随机的泊松过程[21]。这种方法既可以将顾客到达实际情况体现出来,又可以通过动态规划的方法求得最优解。将整个销售期划分为多个决策时段,并假设每个时段足够小以至于最多只有一个预订需求到达。对于一个单航段的动态规划模型,每一个时段指的是距离起飞还剩余的时间,状态代表着在这一时刻航班上尚未售出的座位数,状态的转移是由预订的情况决定,每一阶段的决策是在给定票价下是否接受到达顾客的预订。具体方程如下:

其中,pj表示的是顾客在票价等级j的到达概率,Vt(x)是在t时刻有x个座位剩余的期望收益。J是票价等级的数量,rj表示的是j等级的价格。在动态方程中,在t时刻,只有当rj≥Vt-1(x)-Vt-1(x-1)时,顾客会被接受。Vt-1(x)-Vt-1(x-1)即为竞标价格,通过竞标价格来控制各个票价等级的开关。在单航段动态存量控制模型中,航空公司可以根据顾客到达的情况,依据竞标价格调整各阶段的存量控制策略,以实现收益的最大化。还可以通过动态方程中的竞标价格解释取消预订、团队预订、爽约(noshows)等一些存量控制问题。
2.网络收益管理
关于运输网络中收益管理模型与存量控制策略的研究可参考文献[22],此处仅列出与本书密切相关的文献。
在航线网络中,将每一段航班看作是一个资源,每一资源有固定的容量。一个旅客从起点到终点的旅程(Origin-Destination,O-D)可能需要使用多种资源。在网络存量控制模型中,一般将销售过程分为T个销售期,目标函数Vt(x)为从第t个销售期开始时剩余舱位为x的情况下的总收入的期望。
Glover(1982)等[23]学者最早将数学规划方法用于解决网络问题构造了确定性线性规划模型(Deterministic Linear Programming Model,DLP)。其模型如下:

其中,D=(D1,D2,…,Dn)是旅客对产品的总需求向量,E(D)表示对D的每个分量求期望。x和y均是向量,其中,y是每种产品的预订数量限制。
但DLP模型的最优值函数Vt(x)不是最优控制策略所能达到的期望收益,Talluri等(1999)[24]证明了Vt(x)是最大收入期望的上界。Cooper(2002)[25]证明随着舱位容量和需求的增大,所获得的实际收入在概率意义下接近于最大收入。若最优解不是退化的,则用对偶最优解作为各个资源在第t个销售期的门槛价格,即竞标价格。DLP模型简单有效,在实践中应用非常广泛,也是其他研究方法的基础。很多模型将通过DLP求得的门槛价格作为初始的竞标价格。但它的一个主要弱点是仅仅利用了需求随机变化的均值,忽视了需求的完全信息。
考虑到需求的随机变化,Smith(1988)[26]提出了随机线性规划模型(Randomized Linear Programming Model,RLP),并计算出各产品的竞标价格为最优目标函数的梯度。但RLP模型要求事先预测总需求D的概率分布,如果需求预测的不准确,那么,舱位控制结果可能得不到更好的收益。Ciancimin(1999)建立了概率非线性规划模型(Probabilistic Nonlinear Programming Model,PNLP)[27],得出的最优值是最大期望的下界。
为了得到更精确的解,动态规划模型也被应用于网络的存量控制中。从概念上讲,网络的动态规划优化模型与单航段优化模型相似,具体方程如下:

Chen等(1998)第一个完整地应用动态规划方法求解网络座位控制问题[28]。他们提出带有偿付函数的多阶段随机规划模型(Multi-Stage Stochastic Programming,MSSP),根据各销售期的实际情况,调整各产品舱位的控制决策,以寻求总体收益的最大化[29]。Moller等(2004)提出了另一种随机规划方法,使用了情景树的方法来模拟随机需求的过程[30]。这些模型对需求基本上没有做任何假设,既不要求每个销售期至多只有一种产品的需求和各时期的需求相互独立,也不要求不同产品的需求互不相关,基本接近实际需求情况,并能通过标准的线性规划软件求解。所以,近期的网络存量控制研究多是在建立更加逼近的动态规划求解近似的方法[31,32]和基于资源分解的动态规划模型[33,34]。
在运输网络中建立满足所有实际目标的精确最优化模型几乎是不可能的,因此,学者们总是在增进模型的近似精度、计算速度与提高收益之间寻求平衡,相继发展了网络舱位控制的数学模型。Cooper等在2002年提出了一种将随机动态规划模型(Stochastic Dynamic Programming Model,SDP)和PNLP模型联合应用的混合策略方法[25]。该方法将整个销售过程分为两个阶段:在距离起飞时间长的第一个阶段,使用PNLP模型,运用简单的分块预定限制策略实现舱位控制;在接近起飞时间的第二阶段,应用SDP模型,对剩余舱位实行竞标价格的控制策略,这样做的目的是可以简化控制过程,如果阶段分解点选择合适,总收入也可以显著提高。2006年,Cooper等[35]又对其工作进行了完善。
在求解时,由于一般网络中状态变量的维数很高,数学规划的计算量很大,因此,Chen等(2003)提出了一种基于统计学习的方法,该方法可以求一些维数较高的随机动态规划问题的数值解[29]。考虑到一般情况下离航班起飞时间越近,剩余舱位数量越小,因此,没有必要在每个销售期都使用同样大小的状态空间,Siddappa等(2006)[36]提出了按照各销售期的模拟数据缩小状态空间的方法,这样不仅可以减少计算量,而且试验证明求出的最优控制策略可以提高期望最大收入。
在传统的网络存量控制的研究中,由于动态模型很难求出精确解,更多的还是利用线性规划模型进行近似求解,这就很难对顾客的需求变化做出相应的策略优化。为了更准确地制定存量控制策略,需要更多可以考虑顾客选择行为的模型和方法。