3.3.2 太阳帆轨道优化设计方法
1.太阳帆最优交会模型
太阳帆进行星际转移的轨迹设计思路一般是利用变分原理求解时间最优的转移轨道,将太阳帆的轨迹设计构造为优化问题的求解,经典的间接法求解即为采用最优控制理论的变分法和极大值原理构造最优控制模型,求得对应的两点边值问题的解则可得到最优转移轨迹和对应的时间最优控制律。太阳帆是利用光压推进,不需要携带燃料,而利用光压力获得到达目标星球的能量必须经过一段时间的积累。对于太阳帆而言,更关注的是航天器的深空飞行时间,因而一般的太阳帆轨迹优化采用的优化指标即为太阳帆的转移飞行时间。作为初步设计,这里把出发星球和目标星球均视为质点,其运动规律均为以太阳为中心的二体轨道,忽略各种摄动力,与目标星球交会为目的,飞行时间最短为优化指标,出发时刻为2020年前后,出发和到达时间不定。太阳帆的出发星球已经确定为地球,而主探测目标行星为灶神星也已经确定,只有中途探测目标不确定,这里通过对由2 065颗主带小行星组成的数据库进行穷举计算,根据总飞行时间最短的原则筛选出2颗中途探测目标小行星。这样即可把太阳帆日心转移段的飞行过程分为3个阶段:从地球出发与1号目标小行星交会;从1号小行星出发与2号目标小行星交会;从2号小行星出发与主目标灶神星交会。这三个飞行阶段对应的优化问题除了第一阶段的出发时刻不定与后面两段不同外,其余采用的均是相同的最优控制模型,下面将给出具体的求解模型。
太阳帆的动力学模型采用二体+光压力,忽略其他摄动力的影响,则动力学方程为(为了计算简便,以下将太阳引力常数μS归一化处理)
容许控制集:
其中帆法线的指向以角度α和δ描述,锥角α(Cone Angle)定义为帆法线与太阳光线(即太阳帆的日心位置矢量r)之间的夹角,而周角δ(Clock Angle)定义为帆法线在垂直于太阳光线的平面上投影与太阳帆的轨道角动量(k=R×V)之间的夹角,如图3-8所示,帆面的法向量定义式如下:
图3-8 姿态角的定义
太阳帆从出发星球出发后,与目标行星交会,出发时刻为时间t0,终端时刻tf(不定)、帆面法向量n(t)为控制变量。最优性能指标为时间最短:
式中,引入的协态变量λ0为正数,是为了方便归一化协态变量初值而引入的,由于λ0为正数,因此并不影响最优性条件。
采用间接法(庞德里亚金极大值原理)求解该最优问题,则构造Hamilton函数并使之极小:
协态方程为:
边值条件约束为
横截条件为
其中,γ0=[γR0,γV0],γf=[γRf,γVf]为拉格朗日常数乘子。
稳态条件为
需要注意的是,对于太阳帆从地球到1号目标小行星的第一段飞行,由于出发时刻不定,采用的是上述完整的方程模型;而对于第二和第三段飞行而言,由于出发时刻即为前一阶段的终端时刻,由前一时刻的结果决定固定值,因而上述模型中关于t0时刻的方程则不再必要。
极值条件为
即
等价于
其中:
上标^表示单位向量,对速度协态的方向并无限制,覆盖全空间。
因此最优条件也等价于
由于
得到
即最优条件(a)为
则此时最优条件等价于
首先求关于α的驻值,得到
得到驻值点为
为了保证驻点对应的最优角为锐角,则上式的正负号对应为
可以验证,上述驻点值对应J2取得极小值。
这样,根据角度关系,法线矢量与速度协态矢量在通过太阳光线矢量的同一平面内(图3-9),即令
则由
得到
图3-9 太阳帆法向与速度协态的几何关系
而
则最优控制法线应为
则采用上述优化模型,依次对太阳帆飞行的三个阶段进行求解,1号和2号目标小行星从2 065颗主带小行星数据库中穷举筛选,最终在总飞行时间少于7年的结果中挑选用时最短的结果,即可筛选出满足任务要求所对应的1号和2号目标小行星。
而要求解上述最优控制问题,对于上述间接法模型而言,需要求解两点边值问题,求解的难点在于确定协态初值。这里引入了协态初值归一化的方法,能够有效解决初值敏感的问题,从而提高了求解效率。根据式(3-19)中引入的正值λ0以及协态的齐次性,可以利用如下归一化方法:
即将原本无界的协态初值限定到一个单位球面内,所有的协态初值可以在有界的取值范围内搜索,提高了搜索收敛的效率。
2.轨迹分段详细优化设计
决定性能指标优劣的关键往往取决于顶层设计,但是详细优化设计又是必需的,这也是最有技术难度的。目前已有许多研究致力于构造轨迹优化设计的有效方法,同时也遇到了各种各样的困难。在介绍连续推力轨迹优化设计的各种方法之前,简要地从动力学角度探讨轨迹优化设计的含义是有意义的。飞行中的航天器是一个动态系统,其位置和速度受到推进系统和天体引力的作用而发生变化。轨迹设计的任务是根据特定的探测飞行任务,为这一动态系统规划具体的飞行轨迹。这里的探测飞行任务包括近行星轨道调整(升高或降低)、航天器从行星逃逸或被俘获、星际转移(日心转移轨道)等。在动力学意义上,轨迹设计具有两个明显的特征:
(1)轨迹设计在本质上是一个动力学反问题,重点在于规划设计而不是分析演绎;
(2)轨迹设计所处理的动力学过程往往是远离平衡态的。这里的平衡态指的是动力系统意义下的平衡点和周期解(如二体椭圆轨道、Halo轨道、极限环等),而通常的飞行任务除了轨道保持,其他诸如轨道调整、近行星段逃逸或俘获、星际转移等都不是在平衡态附近。
特征(1)反映了轨迹设计问题的难度。除非能够求解动力系统的解析解,否则通常动力学反问题并没有一般性的结论。对于采用脉冲推进方式的航天器而言,经典的二体系统解析解(二体系统的轨道只能是椭圆、抛物线和双曲线轨道)可以用来求解这一动力学反问题,这也是所有基于圆锥曲线轨道设计方法的理论基础。然而,采用连续小推力(包含太阳帆)的航天器是一个受控非线性系统,并没有解析解。特征(2)表明,在动力学分析中应用广泛的(平衡态附近)线性化方法在小推力轨迹设计中很难得到应用。因此,小推力轨迹设计将不得不面对强非线性动力学系统,求解这一强非线性系统将很难回避解对初值的敏感性。事实上,轨迹优化的间接解法中如何处理初始协态敏感问题长期以来是一个公认的困难。(在某些情况下,比如小推力轨迹的摄动制导问题或者小推力轨迹与Kepler标称轨道比较接近时,可以通过在初始/标称轨迹附近线性化将原非线性问题转化为线性时变问题来求解)。
现在来分析轨迹设计问题的实质。物理系统的轨迹设计(如发射入轨、轨道转移及软着陆等)是一个动力学过程,它至少包含动力学模型和各种约束条件(即初、末状态约束及路径约束)两个基本要素。在给定动力学模型的情况下,寻找满足各种约束条件的可行解是轨迹设计的本质。在求解可行解这个意义上,打靶法(基于牛顿迭代)对轨迹设计有基本的重要性,尽管对非线性问题而言,该方法的收敛域可能很小、很不规则,不过由于求解可行解方法的自身局限性以及实际工程的需要,通常轨迹设计问题被进一步强化为一个优化问题,即在动力学模型和约束条件的基础上再引入一个优化指标,要求可行解使该指标最优(即求最优轨迹)。被强化为最优问题的轨迹设计,即轨迹优化,初看起来比原问题更加难于求解。但是由于各种强大的优化方法和工具的出现,轨迹优化目前已经成为轨迹设计的主流方法。
轨迹优化至少包含两层含义:首先,连续小推力轨迹设计被构造为一个优化问题。小推力轨迹的优化设计是一个连续、动态的过程优化问题,这完全不同于脉冲推进的轨迹优化问题。后者的优化变量往往是少数几次(通常1~4次)轨道机动脉冲,因此是一个离散、静态的参数优化问题。其次,采用什么优化方法来求解轨迹优化设计问题。对于脉冲推进的轨迹优化,这是一个函数极值问题,目前采用粒子群算法(Particle Swarm Optimization,PSO)、遗传算法(Genetic Algorithm,GA)等随机演化算法可以获得具有较好最优特性的解。一旦优化问题构造完毕,后续的工作以反复搜索和经验修正为主。而小推力轨迹优化设计本质上是一个泛函极值问题。求解泛函极值的经典方法是变分法和极大值原理(即最优控制),这在轨迹优化中通常称为间接法,这类方法往往能得到高精度的最优解。与之相对应的,称为直接法,通过将连续优化问题离散为参数优化问题来求解最优轨迹。这类方法容易构造,不过通常优化变量数目很大,需要求解大型非线性规划问题,求解结果的最优性和精度往往不如间接法。
对于太阳帆的轨迹优化而言,由于控制变量是连续变化的,控制允许集是开集,因而经典最优控制理论指出,利用变分法的基本原理,即可通过推导性能指标的一阶变分并令其为零得到相应的最优必要条件。通常,最优必要条件包含三部分,即协态微分方程、协态横截条件和与控制变量相关的最优必要条件。与控制变量相关的最优必要条件给出了最优控制的隐式解,它通常是依赖于协态变量的。将最优控制的隐式解代入受控动力学系统的状态微分方程和协态微分方程,结合相应的初、末状态约束与协态横截条件,最优控制将原轨迹优化问题转为一个两点边值问题(TPBVP)。当轨迹设计含有中途飞越或交会时,将在内点时刻导致内点约束条件及相应的内点最优必要条件,此时轨迹优化问题对应于一个多点边值问题(MPBVP)。在两/多点边值问题中,状态和协态微分方程组是基本控制方程,基本未知量是状态变量与协态变量。求解两/多点边值问题(TPBVP和MPBVP)是轨迹优化间接解法的基本问题。
理论上,只要求解了这个两/多点边值问题就可以得到最优轨迹和最优控制。但是,无论是初始条件还是终端条件,都不是完全的,即小于方程的数目。因此,不能按照微分方程初值问题的解法(即直接时间积分)来求解该问题。
在初始时刻,初始状态通常是已知的,但是初始协态未知。假如初始协态给定,通过数值积分状态-协态微分方程组可以得到终端状态和协态。通过不断调整初始协态的猜测值,可使在终端时刻满足终端状态和协态约束条件。这就是单步打靶法求解两点边值问题的思路。通常构造由终端状态约束、部分协态横截条件及其他一阶必要条件组成的所谓打靶方程,这是一个非线性方程组。因此,小推力轨迹优化设计的间接法最后归结为利用基于牛顿迭代的单步打靶法求解非线性方程组的解。通常打靶方程的维数与打靶变量的数目相同,简单情形下打靶变量就是协态初值。对含有中途飞越或交会的内点约束问题,打靶方程往往还要包含内点约束及其所诱导的内点一阶必要条件。此时,打靶方程维数增加,打靶变量包含协态初值、与内点约束相关的拉格朗日乘子及内点约束时刻等参数。
通过构造打靶方程和猜测打靶变量,无论是TPBVP还是MPBVP,最后都归结为求解非线性方程组的解。然而,求解轨迹优化问题的打靶方程(组)常常遇到所谓的初值敏感困难。对于协态初值敏感困难,可以从两方面理解:一方面是由于优化问题本身的非线性导致方程的解对协态初始值非常敏感;另一方面是因为协态变量的物理意义不清晰,很难通过有效的分析为打靶法提供合理的初始猜测。在轨迹优化间接法的研究工作中,绝大部分都是围绕这个初值敏感困难而展开的。
通过各种辅助性方法来获得合理的初始猜测是化解以上初值敏感困难的途径之一。很多文献在试图解决协态初值敏感这一困难上做出了讨论和研究,如构造辅助性的优化子问题的方法、坐标变换的方法、有限差分近似的方法等。在本任务设计中,利用了蒋方华等构造的协态归一化技术,可以看成是在理解协态物理意义方向上的重要努力,这对于有效求解打靶方程有很大的帮助。具体地说,通过对原性能指标乘以任意正数,得到增广的协态。该技术用到的两个重要的观察是:任给正数并不影响最优解,同时增广协态的幅值也不影响最优解。因此,协态归一化通过映射将增广协态“拉回”到单位球面上(注意这是多对一的映射),从而极大地缩小了协态变量可能的搜索范围,而原来的协态变量可能搜索范围是无限域。数值结果表明,协态归一化技术提高了获得初始猜测的效率。
虽然协态归一化技术为求解带来了便利,然而并不能完全化解打靶方程的初值敏感性,太阳帆与小推力相比其受力特性决定了解的收敛域更窄,并且随着未知量的增多,解的收敛困难程度迅速增大。实际上,当打靶未知量增多到数十个时已经很难得到收敛解。而从两点边值问题扩增到多点边值问题时,每增加一个中间交会约束,相应的则增加七个打靶变量,因而在实际计算中,直接进行求解多点边值问题的多段轨迹同时优化,由于变量增多收敛域变窄,求解难度急剧增大,很难得到收敛结果。为了解决此困难,我们采取分段优化拼接的方法,将多段优化的多点边值问题转化为多个单段的两点边值问题,下一阶段的初始状态和时刻与上一阶段的末端状态和时刻进行拼接,由于单段求解比较容易收敛,因而提升了得到整段轨迹设计结果的效率。这里必须指出的是,单段优化拼接的结果可能并不满足多段同时优化的多点边值问题的最优性必要条件,因而不能保证满足整体的最优性。另一方面,即使求解两点边值问题的打靶方程,也很容易出现次优收敛解,毕竟求解的依据是一阶必要条件而非充分条件,即满足最优性必要条件的解不止一个,表3-3即列出了第一阶段从地球飞往Britta时会得到的次优收敛解。对于此困难,我们采用多次求解比较筛选的办法,从而人为筛除掉次优解。
表3-3 地球飞往Britta出现的次优收敛解
3.控制角度连续化
根据最优控制理论设计的初步优化结果,在两段轨迹衔接时,会出现控制姿态角突变的现象,如图3-10所示为地球到Barry到Nicholson到灶神星的最优姿态角变化情况。
图3-10 最优姿态角不连续现象示意图
这是由于根据最优控制理论要求,两段轨道的连续性条件为位置和速度,即状态变量,而控制姿态角是与协态变量相关的,而最优控制理论在中间交会约束时不要求协态的连续性,无论是采用多段的多点边值问题打靶求解还是单段拼接的两点边值问题打靶求解,这种协态的突变不连续状况都不可能避免,因而满足最优性条件的结果中姿态角的不连续也不可能避免。为了工程实现中姿态控制的方便,这里对姿态角进行连续化处理,即将原设计的交会结果调整为飞越,在原设计结果的交会前5天和后25天利用30天时间一边飞越探测小行星,一边调整姿态为下阶段探测做准备。调整策略为匀速变化两个姿态角,使得30天后的姿态角与此时出发进行下阶段优化飞行需要的初始姿态角相同。由于太阳帆的姿轨耦合特性,姿态的调整必然导致轨道位置和速度的变化,因而需要计算姿态角匀速调整30天后太阳帆的位置和速度,以其为初值优化下一阶段的轨道,并查看优化结果对应的初始的姿态角,与上次匀速调整后的结果对比,经过多次迭代后可以得到收敛结果,最终地球到Britta到Nicholson到灶神星的姿态变化如图3-11所示。
图3-11 连续化处理后的姿态角变化