理论教育 平均交互信息量不增:信息论基础与工程应用

平均交互信息量不增:信息论基础与工程应用

更新时间:2026-01-13 理论教育 版权反馈
【摘要】:定理3.8设由两个信道串接构成随机变量序列,当即当是Markov链时,有当且仅当即亦是Markov链时,才有由概率一般运算规则有由式,有这表明,当随机变量序列是Markov链时,随机变量序列亦是Markov链,根据定理3.5,有在一般情况下,随机变量序列不是Markov链,根据定理3.6,有由式和式,有根据平均交互信息量的交互性,可证得当随机变量序列亦是Markov链时,根据定理3.6,有由式有根据平均交互信息量的交互性,证得这样定理就得到了证明。

在实际通信系统中,常需对信道传输的数据作适当处理,若把数据处理装置亦看作是一个信道,这就由两个信道串接,组成了一个串接信道。

设信道I和信道II串接,组成图3.16所示串接信道。信道I的输入符号集X:{a1,a2,…,ar}输出符号集Y:{b1,b2,…,bs},输出符号集Z:{c1,c2,…,cL}。又设,信道I的传递概率P(Y/X):{p(bj/ai)(i=1,2,…,s)},信道II的传递概率P(Z/XY):{p(ck/aibj)(i=1,2,…,r;j=1,2,…,s;k=1,2,…,L)}。且假定p(aibjck)>0(i=1,2,…,r;j=1,2,…s,k=1,2,…,L)

图示

图3.16 串接信道

由一个信道组成的通信系统只有输入、输出两个随机变量X和Y。由两个信道串接组成的串接信道中,就有X、Y、Z三个随机变量,那么,由三个随机变量构成的随机变量序列(XYZ),在信息传输上又有什么新的特点和规律呢?

定理3.5 设由两个信道串接构成随机变量序列(XYZ),则

图示

当且仅当

图示

即(XYZ)是Markov链时,才有

图示

【证明】根据平均交互信息量的定义,有

图示

图示

即证得

图示

由式(3.56)有

图示

则由式(3.60)有

图示

即证得

图示

定理3.6 设由两个信道串接构成随机变量序列(XYZ),则

图示

当且仅当

图示

即(YXZ)是Markov链时,才有

图示

【证明】 根据平均交互信息量的定义,有

图示

图示

图示

即证得

图示

由式(3.64)有

图示

则由式(3.67)有

图示

即证得

图示

定理3.7 设由两个信道串接构成的随机变量序列(XYZ)。当

图示

即当(XYZ)是Markov链时,有

图示

当且仅当

图示

即(YXZ)亦是Markov链时,有

图示

【证明】由定理3.5可知当随机变量序列(XYZ)是Markov链时,有

图示

由定理3.6可知,在随机变量序列(YXZ)不是Markov链的情况下,有

图示

由式(3.74)和式(3.75)可得,当(XYZ)是Markov链,而(YXZ)不是Markov链的情况下,有

图示

由定理3.6可知,当(YXZ)是Markov链时,有

图示

则由式(3.74)、式(3.75)证得,当(XYZ)和(YXZ)都是Markov链时,即

图示

时,有

图示

证毕。

对于图3.16所示串接信道,在工程上一般把随机变量序列(XYZ)看作Markov链,整个串接信道的传递概率频p(ck/ai)(i=1,2,…,r;k=1,2,…,L)求得,即有

图示

这就是说,整个串接信道的信道矩阵[P](rxL阶),等于信道I的信道矩阵[PI](rxs阶)与信道II的信道矩阵[PII](sxL)阶的连乘,即

图示

若要求随机变量序列(XYZ)和(YXZ)都是Markov链,则要有

图示

图示

即必须有

图示

这就是说,整个串接信道的信道矩阵[P]与信道II的信道矩阵[PII]要完全一样,即要有

图示

显然,信道I的矩阵[PI]是(sxs)阶单位矩阵,是式(3.81)能得到满足的一种情况,这时有

图示

式(3.82)指明,当信道I是一一对应的确定关系的一般无噪信道时,随机变量序列(XYZ)与随机变量序列(XYZ)一样,亦是Markov链。

由以上分析可以得到这样一个结论:在一般情况下(XYZ)是Markov链,输出随机变量Z通过信道II一个信道,获取关于随机变量Y的信息量I(Y;Z),总是比输出随机变量Z通过信道II、信道I两个信道,获取关于随机变量X的信息量I(X;Z)大,这就是说,随机变量Y通过信道I到随机变量X,总是要丢失一部分信息量(如图3.17)。只有当随机变量序列(YXZ)亦是Markov链(如信道I是一一对应确定关系的一般无噪信道)时,随机变量Y到随机变量X才不会丢失信息量,因而从Z中获取关于Y的信息量I(Y;Z),才与从Z中获取关于X的信息量I(X;Z)相等。

定理3.8 设由两个信道串接构成随机变量序列(XYZ),当

图示

即当(XYZ)是Markov链时,有

图示

当且仅当

图示

即(YZX)亦是Markov链时,才有

图示

【证明】由概率一般运算规则有

图示

由式(3.83),有

图示

这表明,当随机变量序列(XYZ)是Markov链时,随机变量序列(ZYX)亦是Markov链,根据定理3.5,有

图示

在一般情况下,随机变量序列(YZX)不是Markov链,根据定理3.6,有

图示

由式(3.89)和式(3.90),有

图示

根据平均交互信息量的交互性,可证得

图示

当随机变量序列(YZX)亦是Markov链时,根据定理3.6,有

图示

由式(3.89)有

图示(https://www.daowen.com)

根据平均交互信息量的交互性,证得

图示

这样定理就得到了证明。

对于图3.16所示串接信道,在一般情况下,随机变量序列(XYZ)都可看作是Markov链,即随机变量序列(ZYX)亦可看作Markov链。如要求随机变量序列(YZX)同时也是Markov链,则必须有

图示

即有

图示

即必须有

图示

图示

由式(3.94)以及式(3.95)、式(3.96)可知,则必须有

图示

这说明,如果要求随机变量序列(ZYX)是Markov链的条件下,随机变量序列(YZX)亦是Markov链,则必须要求图3.16串接信道的信道矩阵[P]与信道I的信道矩阵[PI]完全相同,即必须有

图示

显然,信道II的信道矩阵[PII]是(s×s)阶单位矩阵,是式(3.98)能得到满足的一种情况,这时有

图示

这表明,当信道II是一一对应的确定关系的一般无噪信道时,随机变量序列(YZX)与随机变量序列(ZYX)一样,亦是Markov链。

由以上分析可得到这样一个结论:对于图3.16串接信道,在一般情况下,由于随机变量序列(XYZ)可看作是Markov链,所以随机变量序列(ZYX)亦可看作是Markov链。随机变量X通过信道I获取关于随机变量Y的信息量I(X;Y),总比随机变量X通过信道I和信道II两个信道,获取关于随机变量Z的信息量I(X;Z)大。这就是说,随机变量Y通过信道II到随机变量Z,总要丢失一部分信息量(如图3.18)。只有当随机变量序列(YZX)亦是Markov链(如信道II是一一对应确定关系的一般无噪信道时),随机变量Y到随机变量Z才不会丢失信息量。因而从随机变量X中获取关于随机变量Y的信息量I(X;Y),才与从随机变量X中获取关于随机变量Z的信息量I(X;Z)相等。

图示

图3.17 关注信道II

图示

图3.18 关注信道I

【例3.9】设信道I和信道II相接,组成图3.19串接信道。若随机变量序列(XYZ)是Markov链,试证明I(X;Z)=I(X;Y)。

图示

图3.19 (XYZ)构成Markov链

解:因为随机变量序列(XYZ)是Markov链,由图3.19可知,串接信道的信道矩阵

图示

由于串接信道的信道矩阵[P]与信道I的信道矩阵[PI]完全一致,所以有

图示

根据式(3.97)、(3.96)、(3.95)、(3.94)、(3.93),随机变量序列(YZX)亦是Markov链。根据定理3.8,可证得

图示

这一特例说明,在(XYZ)是Markov链的条件下,信道II是一一对应确定关系的一般无噪信道,是式(3.84)中等式(3.85)成立的必要条件,但不是充分条件。

推论 设有两个信道串接构成随机变量序列(XYZ)。若随机变量序列(XYZ)是Markov链,则有

图示

【证明】因为随机变量序列(XYZ)是Markov链,则由定理3.7有

图示

又因为当(XYZ)是Markov链时,随机变量序列(ZYX)亦是Markov链,由定理3.8,有I(X;Z)≤I(X;Y)

即证得,当随机变量序量(XYZ)是Markov链时,有

图示

这样,推论就得到了证明。平均交互信息量I(X;Z)与I(Y;Z)和I(X;Y)之间的关系综合表示为图3.20所示。

图示

图3.20 数据处理

推论指出,若以Z作为观察点,把信道I看作是一个数据处理装置(如图3.21),随机变量序列(XYZ)是Markov链。因随机变量Y经过处理后,变成随机变量X,则从随机变量Z中获取关于随机变量X的平均交互信息量I(X;Z),不会超过数据处理前从随机变量Z中获取关于随机变量Y的平均交互信息量I(Y;Z),最多两者相等。这就是说,把随机变量Y变成随机变量X的数据处理过程,总是要丢失一部分信息。只有当随机变量序列(YXZ)亦是Markov链时(数据处理是一一对应确定关系时),数据处理过程才不会丢失信息。

推论又指出,若以X作为观察点,把信道II看作是一个数据处理装置,如图3.22所示,随机变量序列(ZYX)是Markov链。因随机变量Y经过数据处理后,变成随机变量Z,从随机变量X中获取关于随机变量Z的平均交互信息量I(X;Z),不会超过数据处理前从随机变量X中获取关于随机变量Y的平均交互信息量I(X;Y),最多两者相等。这就是说,把随机变量Y变成随机变量Z的数据处理过程,总是要丢失一部分信息。只有当随机变量序列(YZX)亦是Markov链时(数据处理是一一对应的确定关系时),数据处理过程才不会丢失信息。

图示

图3.21 串接信道

图示

图3.22 串接信道

综合推论所指出的两方面的结论,可以得到一个总的结论:任何无源数据处理过程都要丢失一部分信息量,最多不丢失信息量,但一定不会增加信息量。由定理3.5、3.6、3.7、3.8及其推论所阐明的平均交互信息量的不增性,一般通称为数据处理定理。

数据处理定理是信息传输的重要规律。把数据处理定理与前面讨论的平均交互信息量的极值性结合起来,就可导出信息传输和处理的一个完整的概念,如图3.23(a)和(b)所示。对于信源X来说,经信息传输或信息处理,最终从随机变量Q中获取关于信源X的平均交互信息量I(X;Q),绝对不会超过信源X本身含有的平均信息量H(X),最多等于信源X本身含有的平均信息量H(X)。信息所经过的传输信道或数据处理装置越多,丢失的信息量就可能越多。即有

图示

图3.23(b)

图示

对于随机变量Q来说,经信息传输或信息处理,最终从随机变量X中获取关于随机变量Q的平均交互信息量I(Q;X),绝不会超过随机变量Q本身含有的平均信息量H(Q),最多等于H(Q)。信息所经过的传输信道或数据处理装置越多,丢失的信息量就可能越多。即有

图示

在传输或处理过程中,一旦在某一环节(信道或处理装置)丢失一部分信息,以后的系统不管怎样传输或处理,如不能接触到丢失信息环节的输入端(如多次测量),就不能再恢复已丢失的信息。

【例3.10】设有三个二进制对称信道(BSC),串接组成图3.24所示串接信道。随机变量序列(XYZW)是Markov链。若信源X:{0,1}是等概信源,试求平均交互信息量I(X;Y)、I(X;Z)、I(X;W),并比较它们的大小。

图示

图3.24 三个信道串联

解:(1)因为信道I的矩阵为

图示

信源X的概率分布为

图示

所以,随机变量Y的概率分布为

图示

则随机变量Y的熵

图示

由信道I的信道矩阵[PI],有

图示

所以,信道I的平均交互信息量

图示

(2)因为随机变量序列(XYZW)是Markov链,所以信道I、信道II的串接信道(XZ)的信道矩阵,等于信道I矩阵[PI]与信道II矩阵[PII]的连乘,即有

图示

随机变量Z的概率分布为

图示

则得随机变量Z的熵

图示

由串接信道(X-Z)的信道矩阵[P]X-Z,有

图示

图示

同理可得

图示

则可有

图示

(3)一般地,设有N(大于1的正整数)个二进制对称信道(BSC),串接成如图3.25所示的串接信道。当信源X是等概分布时,同理可证:

图示

图3.25 串接信道

图示

则有

图示

(3.108)式是由N个二进制对称信道(BSC)组成的串接信道,当信源X:{0,1}为等概信源时,数据处理定理的具体表现。

实践:信道容量的迭代算法

【已知】信源符号个数r、信宿符号个数s、信道转移概率矩阵P=(pji)r×s

【算法】

图示

图示

【要求】

(1)输入:任意的一个信道转移概率矩阵。信源符号个数、信宿符号个数和每个具体的转移概率在运行时从键盘输入。

(2)输出:最佳信源分布图示,信道容量C。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈