物理

分析力学基本原理介绍7.7:最小作用量原理

2020-01-13  本文已影响0人  有限与微小的面包

\bullet现在我们讨论另一个与哈密顿体系有关的变分原理。它涉及另一种变分——\Delta-变分。用于推导拉格朗日方程的哈密顿原理所用的是\delta-变分。对于\delta-变分,我们会固定路径两个端点,即,\delta q_i(t_1) = \delta q_i(t_2) = 0

相比之下,\Delta-变分在使用条件上会宽松一些。通常情况下,对于\Delta-变分,错误路径两个端点的时间间隔跟正确路径相比会有所不同,而且端点所对应的坐标也可能改变。

\bullet对于\Delta-变分,我们仍然可以使用与\delta-变分相同的参化方程:

q_i(t,\alpha) = q_i(t,0) + \alpha \eta_i(t)

它代表一个路径曲线家族。

\bullet作用量的\Delta-变分被定义为:

\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt \equiv \int_{t_1 + \Delta t_1}^{t_2 + \Delta t_2}\mathscr{L}(\alpha)\;dt - \int_{t_1}^{t_2}\mathscr{L}(0)\;dt

其中\mathscr{L}(\alpha)代表剩下无数条错误路径;\mathscr{L}(0)代表正确路径。

\bullet作用量的\Delta-变分主要由两部分造成:

1)积分边界的变分(路径端点的变分)

2)被积函数的变分(偏离正确路径)

定义中的第一项近似到一阶小量就等于被积函数乘以边界的变分;第二项则与之前的\delta-变分类似:

\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt = \mathscr{L}(t_2)\Delta t_2 - \mathscr{L}(t_1)\Delta t_1 + \delta\int_{t_1}^{t_2}\mathscr{L}\;dt

\bullet让我们先考虑第二项。变化的路径仍可以使用跟之前相同的参化方程,不同的是,现在路径端点处q_i\delta-变分并不等于零,所以我们要保留由分部积分法得到的端点项:

\begin{align*}\mathbf{\delta} \int_{t_1}^{t_2}\mathscr{L}\;dt &= \sum_i\int_{t_1}^{t_2}\frac{\partial\mathscr{L}}{\partial q_i}\delta q_i + \frac{\partial\mathscr{L}}{\partial \dot{q_i}}\delta\dot{q_i}\\&= \sum_i \int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial q_i}\delta q_idt + \sum_i\int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta\dot{q_i}dt\\&= \sum_i\int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial q_i}\delta q_idt + \sum_i \left.\frac{\partial\mathscr{L}}{\partial\dot{q_i}}\delta q_i\right|_{t_1}^{t_2} - \sum_i\int_{t_1}^{t_2}\frac{d}{dt}\left(\frac{\partial\mathscr{L}}{\partial \dot{q_i}}\right)\delta q_idt\\&= \sum_i\int_{t_1}^{t_2}\left[\frac{\partial \mathscr{L}}{\partial q_i} - \frac{d}{dt}\left(\frac{\partial\mathscr{L}}{\partial \dot{q_i}}\right)\right]\delta q_idt + \sum_i \left.\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta q_i\right|_{t_1}^{t_2}\\&= \sum_i \left.\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta q_i\right|_{t_1}^{t_2}\end{align*}

根据拉格朗日方程,带方括号的第一项消失。

代入作用量变分中,得

\begin{align*}\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt &= \mathscr{L}(t_2)\Delta t_2 - \mathscr{L}(t_1)\Delta t_1 + \delta\int_{t_1}^{t_2}\mathscr{L}\;dt\\&= \left.(\mathscr{L}\Delta t + \sum_ip_i\delta q_i)\right|_{t_1}^{t_2}\end{align*}

\bullet接下来我们需要将q_i在端点t_1t_2\delta-变分用q_i在正确路径以及错误路径端点处的\Delta-变分\Delta q_i来表示。我们需要找出q_i的两种变分之间的关系。

路径家族的参化方程:

q_i(t_1,\alpha) = q_i(t_1,0) + \alpha\eta_i(t_1)

现在考虑端点t_1。端点变化\Delta t_1导致路径的变分为:

\begin{align*}\Delta q_i(t_1) &= q_i(t_1 + \Delta t_1,\alpha) - q_i(t_1,0)\\&= q_i(t_1 + \Delta t_1,0) + \alpha\eta_i(t_1 + \Delta t_1) - q_i(t_1,0)\end{align*}

\Delta t_1\alpha均足够小时(<\!< 1),

可对q_i(t_1 + \Delta t_1,0) 以及\eta_i(t_1 + \Delta t_1) 使用最优线性展开:

q_i(t_1 + \Delta t_1,0) = q_i(t_1,0) + \frac{\partial q_i}{\partial t}\Delta t_1 = q_i(t_1,0) + \dot{q_i}\Delta t_1

\eta_i(t_1 + \Delta t_1) = \eta_i(t_1) + \frac{\partial \eta_i}{\partial t}\Delta t_1 = \eta_i(t_1) (已将二阶导舍去)

于是

\Delta q_i(t_1) = \dot{q_i}\Delta t_1 + \alpha\eta_i(t_1)

根据\delta-变分的定义,\delta q_i = \frac{\partial q_i}{\partial \alpha}\alpha\alpha <\!< 1),有\delta q_i = \eta_i(t) \alpha

替换后我们就得到了两种变分的关系式:

\Delta q_i(t_1) = \dot{q_i}\Delta t_1 + \delta q_i(t_1)

同理,对于端点t_2,有

\Delta q_i(t_2) = \dot{q_i}\Delta t_2 + \delta q_i(t_2)

所以

\boxed{\begin{cases}\delta q_i(t_1) = \Delta q_i(t_1) - \dot{q_i}\Delta t_1\\\delta q_i(t_2) = \Delta q_i(t_2) - \dot{q_i}\Delta t_2\end{cases}}

再代入作用量变分:

\begin{align*}\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt &= \left[\mathscr{L}\Delta t + \sum_i p_i(\Delta q_i - \dot{q_i}\Delta t)\right]_{t_1}^{t_2}\\&= \left.(\sum_i p_i\Delta q_i - \mathscr{H}\Delta t)\right|_{t_1}^{t_2}\end{align*}

如果没有额外的条件,至此就不能再继续了。

\bullet为了得到最小作用量原理,系统需要满足下列三个条件:

1)系统的拉格朗日函数\mathscr{L}以及哈密顿函数\mathscr{H}不能显含时间,这也意味着\mathscr{H}是一个守恒量。

2)变分需保证不管是正确还是错误路径的哈密顿函数\mathscr{H}都是守恒的。

3)所有错误路径端点坐标的变分需为零(时间的变分\Delta t不为零!)。

第三条是间接为第二条服务的。哈密顿函数\mathscr{H} = p_i\dot{q_i} - \mathscr{L},若想要保证它始终是一个守恒量,q_i(t)就不能改变。由于不同的路径会有不同的速度\dot{q_i}(t),为保证\mathscr{H}守恒,时间必须要变化。

\bullet满足上述三个条件的变分原理则简化为:

\begin{align*}\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt &= -\mathscr{H}(\Delta t_2 - \Delta t_1)\\\Delta\int_{t_1}^{t_2}(\sum_i p_i\dot{q_i} - \mathscr{H})\;dt &= -\mathscr{H}(\Delta t_2 - \Delta t_1)\end{align*}

\implies \boxed{\Delta\int_{t_1}^{t_2}\sum_i p_i\dot{q_i}\;dt = 0}

这个简洁的表达式就是最小作用量原理(principle of least action)

积分\int_{t_1}^{t_2}\sum_i p_i\dot{q_i}\;dt = 0在上世纪的相关书籍中被称为作用量或作用量积分。现在人们口头常说的作用量通常指由哈密顿原理得来的积分\int_{t_1}^{t_2}\mathscr{L}\;dt。所以为了区分,前者有时也被称为简缩作用量(abbreviated action)

\bullet最小作用量原理形式多样。我们知道,在非相对论力学中,如果广义坐标不显含时间,动能T的所有齐次展开项中只有速度的二次项不为零:

T = \frac{1}{2}M_{jk}(q)\dot{q}_j\dot{q}_k

如果势函数不显含速度,拉格朗日函数的齐次展开项中速度的零次项\mathscr{L}_0 = -V,于是:

\mathscr{L} = \mathscr{L}_2 + \mathscr{L}_1 + \mathscr{L}_0 = T - V

正则动量

p_i = \frac{\partial\mathscr{L}}{\partial \dot{q_i}} = \frac{\partial(T - V)}{\partial \dot{q_i}} = \frac{\partial T}{\partial \dot{q_i}}

利用欧拉齐次函数定理

\sum_i p_i\dot{q_i} = \sum_i \frac{\partial T}{\partial \dot{q_i}}\dot{q_i} = 2T

代入最小作用量原理中,可以得到简单形式:

\boxed{\Delta\int_{t_1}^{t_2}T\;dt = 0}

而如果这时系统所受合外力也为零(哈密顿函数不显含时间),总能量守恒:

\frac{d\mathscr{H}}{dt} = \frac{d(T + V)}{dt} = \frac{dT}{dt} = 0

动能也同样不含有时间。

于是最小作用量原理又可被进一步简化为:

\Delta\int_{t_1}^{t_2}T\;dt = T\Delta\int_{t_1}^{t_2}\;dt = T\Delta(t_2 - t_1)

\implies \boxed{\Delta (t_2 - t_1) = 0}

这个惊人结果告诉我们,在位形空间的所有路径中,系统会选择一条使得通过两端点用时最短(严格来讲是取得极值)的路径运动。该形式的最小作用量原理又被称为费马几何光学原理(Fermat's principle in geometrical optics)或最短时间原理(principle of shortest time),它是光线传播需要遵守的法则:一条介于两点之间的光束总是会选择一条用时最短的路径传播。

上一篇 下一篇

猜你喜欢

热点阅读