Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 39|回复: 0

极大值原理

[复制链接]

8

主题

8

帖子

36

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
36
发表于 2018-8-24 15:58:18 | 显示全部楼层 |阅读模式
  在前面章节,我们利用古典变分解决了许多问题[1]。提出了关于标量和矢量的欧拉拉格朗日方程的推导。们讨论了相关的贯截条件以及,如果存在不等式约束我们所面临的很多困难。几个简单的最优控制问题是他的状态及其解。在本章中,我们要重新审视在前面章节中提出的许多问题,并获得其中一些更普遍的解法。此外,我们将进一步介绍针对用前面章节中的方法不能方便地公式化的一些问题的解法。
  基于此,我们用哈密顿函数方法介绍变分演算博尔扎公式。这将引导我们进行庞特里亚金最大值原理和相关的贯截条件[2-5] 证明。而后我们将着手探讨哈密尔顿- 雅各布方程[2-14],它相当于贝尔曼连续动态规划方程。最后,我们将简短介绍动态规划的一些限制。提出说明这种方法的例子。许多用极大值原理能够公式化并给出解的问题,我们将留在下一章讨论。
  当终端时刻不固定,且控制向量和状态向量不一定是光滑函数时,为了让我们的方法更接近最优理论,我们必须较详细地考虑这些问题的起始变量。
  对于所有容许轨迹集。让  为最优轨线x对应终端时间。与偏离最优轨线的每个扰动h对应的是在终端时刻的扰动  。让第一变量  是
  的一部分, 在h和 是线),取线性在  (在 , ,和 )并且进行一般分部积分以减少依赖于 的条件到依赖于 条件,我们得出:
  为了把方程(4.1-3)重新整理成方便的形式,我们采用下面记法。我们定义
  在 泰勒级数展开中,我们注意到, 近为在 和 是线)和重新整理,一次变分为
  此处哈密尔顿不是 的函数;  和 称典型变项。根据汉密尔顿,方程(411)的一次变分式 (415)变为
  为建立极小值必要条件,必须消去式(4.1-5)与(4.1-7)中积分环节,并且如从Eq (4.1-7)中获得贯截条件
  至在我们目前的发展止,被约束容许轨迹是关于x和t连续可微的。这些泛函约束对所有容许轨迹往往是不符实际的限制,如下面的例子所述。在这个例子中,一种最优容许解是不存在; 但是,如果容许轨线的泛函约束充分地放宽,一条最优容许轨迹的存在是确定的。我们现在查看容许轨迹的新定义——埃德曼条件[1]的结果。
  但是,这个解有一个令人烦恼特点,这个最优 有一个“死区”或不连续的一阶导数,这就因 包含在拉格朗日方程中而产生的极大的困难。因此,上述问题的解决方法是不可取的。当然,这个特殊函数 是处处连续可导的除了在有限个点 (在这种情况下单点 )之外。因此,应放宽允许轨线约束,以便得到分段连续可导的函数,这个函数 是可行的,并且上述问题也有一个最优的允许控制。魏尔-艾尔德曼条件为我们提供了最优轨线在每个控制间隔点有一个不连续导数的必要条件。具体地,要考虑这样的问题,区间 中有一点 上的连续可微函数,其满足固定起始和终端边界值,在所有这种函数中找到一条轨线使泛函
  有一个极值。理所当然,对于 和 ,函数 为极小值必须满足欧拉拉格朗日方程
  我们可以分别取一次变分为 和 。现在我们假设,a和b固定,并且在t=c时从 和 计算出的 是相同的。因为c是任意的, 的一次变分为
  因为 和 是任意的。方程 (4.2-1)和(4.2-2)这些约定,称埃德曼角点条件,并且必须保证在任何点c极值有一个角落。如果我们使用哈密顿典型变分
  我们立刻发现魏尔埃德曼条件简单地要求在所有有角落的点的最优轨迹上H和 是连续的。
  在3.7节我们考虑了等式约束为 这种形式(所有t在感兴趣的控制区间)的拉格朗日方程的解。一种特殊情况,等式约束被认为作为一个大型的和重要的物理系统模型,是
  其中,选择m维向量 代表了控制函数,n维向量x代表相应的轨线。我们将假设依赖于x和u的 f有连续偏导数。通常作这样连续性的假设是为了保证对于任何分段连续函数u,存在唯一容许轨线)。因此,我们定义对容许控制函数集是分段连续函数类,并且假设对于容许控制u以及给定的初始条件 ,方程(4.3-1)定义了感兴趣的控制间隔一个特别的,容许解。
  利用这一节的余下部分和下面部分,我们将进一步考虑依赖于方程(4.3-1)等式约束的博尔扎问题的必要条件。4.3-1节和4.3-2节将考虑固定终端时刻和不固定终端时刻情况,当约束没有被强加给u可取一每次在在控制间隔利益期间的t值。第4.4节考虑控制函数的不等式约束及其相关通过控制间隔轨迹两种情况。
  我们在最后一节中讨论使用拉格朗日乘子法将系统微分等式约束邻近价值函数,则给出
  我们现在取J的一次变分作为最优控制向量和最优状态向量的控制向量和状态向量的变化。我们得到:
  极小值一个必要条件是在J的一次变分中含任意变化的 和 要消去。因而我们有作为极小值必要条件有非常重要关系:
  有一大类最优控制问题是,系统的初始状态是确定的,但终端状态是不确定的。在此情况下, 方程(4.3-8)的横截条件为
  由于 , 是固定的, 则是完全任意地。另一大类最优控制问题是 和 是固定的。在这种情况下 和 必须为零,并且 和 就成为了两点边值的边界条件问题。对于许多预估问题, 和 都不固定且 。在那中情况下, 由于 和 是任意的,方程(4.3-8)中有 作为这类问题边界条件。另一个情况是,可能有 、 和 。在此情况中,对于我们来说横截条件获得是很容易的,如果我们解这两个标量方程中n个变量,
  我们通过拉格朗日乘子法毗邻这些条件到 函数、 和 中,并且提供给价值函数
  这n个初始条件可通过这样得到,同时从方程(4.3-16)找到的r参数,这样也满足方程(4.3-13)中r的条件。类似的,终端条件是
  n个终端条件通过这样获得,同时从方程(4.3-17)中找到参数q﹑v,这样方程(4.3-14)的q条件是满足的。
  从方程(4.3-9)中得到的n维向量的微分方程被称为伴随方程。方程(4.3-10)表明了原植物的动态(方程((4.3-1))与伴随方程(方程(4.3-9)中的 方程)两者之间的耦合关系。这个耦合方程能从
  得到,并且很重要的一点是,要注意为了得出要获得最优控制需 这个结论, 必须是完全任意的。对于此处提出的问题,其中容许控制集无限, 可以是完全地任意。而对于容许控制是有界的, 不可能是完全地任意的,并且 可能不再是正确要求的条件了。关于这些内容我们在以后将有更多的叙述。我们为这种问题所得的解只是庞特里亚金极大值原理的一种特殊情况。
  我们可以看到,如果 和f不是时间的显函数,沿 的一条最优轨线的汉密尔顿是恒定的。可以证明,即使我们不要求 ,那么沿最优轨线这始终是正确的。我们在以后进一步地研究中将利用这个事实。
  为了J为极小值,J沿所有轨线的二次变分必须是负的,这样可满足方程 (4.3-1)。.因此我们需要计算在方程 (4.3-6)中 J的二次变分,并且强制规定方程(4.3-1)的变分为零,或者
  并且为极小值时其必定为非负。实际情形是n+m维矩阵在积分标志之下并且 是非负定的。
  为最小。对这问题的解决方案如下。 我们计算方程 (4.3-4)汉密尔顿为
  线性性质,使得解这个问题变得很复杂了。在第10章,我们将找出一些迭代方法来克
  在前面小节探讨的内容可能很容易地扩展到这种情况,即终端流形方程是一个终端时刻的函数,并且终端时间是非特指的. 为方便起见,我们将假定初始时间和初始状态向量已指定。而对于初始时间和初始状态向量不确定的情形,它的解可能更容易获得。因而问题就成为一个使代价函数
  在此要注意,先前章节中终端流形线 ,变成了 ,这样更具一般性。我们通过格朗日乘子把等式约束与价值函数联系起来得到
  再次构建一次变分,然后构建微分式 ,且只保留线性条件。为了方便我们去掉^符号,因而有
  我们必须让一次变分等于零,以获得极小值的必要条件。所以,确定最优控制及其状态向量的方程组为
  方程(4.3-37)提供n个条件与q个拉格朗日乘子是待定的。方程(4.3-38)提供q个方程以消除拉格朗日乘子,并且方程(4.3-39)提供了一个辅助方程,该方程中我们必须能确定它的未指定的终端时刻。
  我们希望找到使 的控制函数u(t),其中 是未指定的。例如, 和 值指定时,使      取得最小值。
  边界条件为 ,我们通过求解方程(4.3-39)来确定终端时间,在本例中,它变成     。
  但由于 并且在 的特殊情况下,从上述内容中我们可以很容易看出有 ,这就确定本例的解。最优控制是 ; 相应的轨线 我们在以后很感兴趣的问题是“最短时间”问题。在这种情况下
  我们通过解方程(4.3-32)~(4.3-35)来确定最优控制及其相应的轨线,这些方程变成
  如果汉密尔顿不是时间的显函数,这里也用到的方程,(4.3-21),就成为 ; 因此,对于这个最小时间问题就有
  应该强调我们将不解一般的最小时间问题,因为我们已经把无不平等约束强加在控制(或状态)变量中了。这种问题的一个可供选择观点是考虑 和 。对于这种特殊问题,虽然改变了汉密尔顿方程,但肯定不改变最优控制和状态向量,读者可以很容易地验证。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|经典老虎机小游戏【老虎机的规律压法】—全球最大老虎机现金bg电子游戏

GMT+8, 2018-10-16 23:02 , Processed in 0.162507 second(s), 33 queries .

Powered by Discuz! X3.2

© 2010-2020 Comsenz Inc.

快速回复 返回顶部 返回列表