最小作用の原理

こんにちは、turtleです。現在電磁気学を学んでおりまして、その備忘録のような形でこのブログを書かせていただいております。基本的に大学の内容となっていますが、数式さえ乗り越えれば高校生でも理解できると思っていますので、どうぞよろしくお願いいたします。

さて、親記事において、ラグランジュ力学で原理とするオイラー=ラグランジュ方程式を書き下しました。

原理２.２(オイラー=ラグランジュ方程式)
力学系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$としたとき、力学系に対応してラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が定まるならば、$i=1,2,…,N$に対して以下が成り立つ。
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q_i}} =0
$$

ただもちろん、この方程式がニュートンの運動方程式から一発で思いつかれたというわけではありません。というよりも、親記事で書いたように、ラグランジアンというのは”力学系に対して定まる量”であって、上の原理２.２の式を計算するとニュートンの運動方程式になるような物理量のことですから、この原理はある種、そういう物理量$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が存在するはずだという主張をしている、ともとることができます。

なぜこのように一見すると非直感的な主張が理論として受け入れられているかというと、実は歴史的には、原理２.２は以下の主張から導出されたものであるからです。

主張２.２.１(最小作用の原理)
力学系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$としたとき、力学系に対応してラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が定まるならば、時刻$t_i$から時刻$t_f$までの作用$S$を
$$
S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$と定義すると、現実に物体が通過する経路においては、始点$\boldsymbol{q}(t_i)$と終点 $\boldsymbol{q}(t_f)$を固定したときの作用の変分$\delta S$がゼロになる。

最小作用の原理の主張
オイラー=ラグランジュ方程式

最小作用の原理の主張

さて、今の時点で、主張２.２.１から原理２.２が導出されることはまだわからなくて構いません。この段落では、主張２.２.１がいかに自然なものかを理解してもらいたいです。
まずは歴史的に、主張２.２.１が成立するよりも以前、光学において以下のようなことが分かっていました。

補題２.２.２(フェルマーの原理)
光は光学的距離が極小となる経路を通る、すなわち、媒質の屈折率$n(\boldsymbol{r})$、光線の経路$\boldsymbol{r}(\lambda)$(ただし$\lambda$は経路に沿った任意のパラメータ)に対して、$\lambda_i$から$\lambda_f$までの光学的距離$S$を
$$
S=\int_{\lambda_i}^{\lambda_f} n(\boldsymbol{r}) |\boldsymbol{r}'(\lambda)| d \lambda
$$と定義すると、現実に光が通過する経路においては、始点$\boldsymbol{r}(t_i)$と終点 $\boldsymbol{r}(t_f)$を固定したときの光学的距離の変分$\delta S$がゼロになる。

難しいことを言っているように見えますが、「すなわち」の後から続く部分はすべて、「光は光学的距離が極小となる経路を通る」ということの言い換えです。ここで、光学的距離は到達時間と光速の積ですから、この原理の言っていることは「光は到達時間が極小となる経路を通る」ということです。
言っていることはきわめて直感的で自然でしょう。
変分のくだりについては、「その経路を選んだときの光の到達時間が極小であるということは、始点$\boldsymbol{r}(t_i)$と終点 $\boldsymbol{r}(t_f)$を固定したまま経路を微小にずらしたときに、その極限で到達時間は変化しない」ということを言っているわけです。

先に言っておきますが、この補題２.２.２から主張２.２.１が導かれるということはありません。ただ、補題２.２.２と主張２.２.１の記述は、非常に似通っていることが分かるかと思います。
というのは、物理学はこの補題２.２.２の成功から、力学の分野においても「力学系の粒子が現実に選んだ経路において極小となる量」が存在するのでは、と類推したためです。この物理量を作用$S$と試しにおいてみると、作用$S$はどういう形で書けるべきでしょうか。

作用$S$は今まで見たことをふまえると、力学系が運動する経路を１つ定めたときにそれに対して出力される量であるので、“経路の評価”としての意味を含んでいますよね。

まず、$t_i$から$t_m$の部分の作用$S[t_i , t_m]$と、$t_m$から$t_f$の部分の作用$S[t_m , t_f]$に対して、これを足し合わせたものが全体の作用になる、つまり$S[t_i , t_f]=S[t_i , t_m]+S[t_m , t_f]$とかけることが自然です。
さらに、作用$S$は各々の時刻の力学系の状態を含んでいなければなりませんから、作用の増分$dS$は、(その瞬間の状態で書ける量)×$dt$としてかけることが自然です。

(その瞬間の状態で書ける量)の引数として$\boldsymbol{q}, \dot{\boldsymbol{q}}, t$をとるとして、この量を$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$とかくとき、これらの要求からつくられる時刻$t_i$から時刻$t_f$までの作用$S$は、
$$
S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$と書けるのが自然ではないでしょうか。少々天下り的でゴール在りきだと感じたのは当然で、歴史的にはニュートンの運動方程式をふまえながら何度も修正されて、この形にたどり着いています。
そして、ここで出てきた量$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が、実はいままでラグランジアンとして紹介していた物理量であって、「力学系の粒子は作用が極小となる経路を通る」というのがまさに主張２.２.１であるわけです。

オイラー=ラグランジュ方程式

さて、こうして現れた主張２.２.１ですが、ここから原理２.２が導かれることを証明します。主張２.２.１と原理２.２を再掲します。

主張２.２.１を仮定すると、そこから原理２.２が導出できることの証明

現実の経路を$\boldsymbol{q}(t)$として、ここから任意に微小ずれた仮想の経路を$\boldsymbol{q}(t)+\delta \boldsymbol{q}(t)$と表す。なお、経路がずれると当然それに伴って速度も$\dot{\boldsymbol{q}}(t)$から $\dot{\boldsymbol{q}}(t)+\delta\dot{\boldsymbol{q}}(t)$へと変化する。
ここで、極限の定義を考えると、
$$
\delta \left( \frac{d}{dt} \boldsymbol{q}(t) \right) = \delta\dot{\boldsymbol{q}}(t) = \lim_{t_2 \to t_1} \left( \frac{\left( \boldsymbol{q}(t_2)+\delta \boldsymbol{q}(t_2) \right) – \left( \boldsymbol{q}(t_1)+\delta \boldsymbol{q}(t_1) \right)}{t_2-t_1} – \frac{\boldsymbol{q}(t_2) – \boldsymbol{q}(t_1)}{t_2-t_1} \right) = \frac{d}{dt}\delta \boldsymbol{q}(t)
$$より、変分の時間微分と時間微分の変分が等しいことがわかる。

さて、経路が$\delta \boldsymbol{q}(t)$だけずれたときの作用$S$の変分
$$
\delta S=\int_{t_i}^{t_f} L(\boldsymbol{q}+\delta \boldsymbol{q}, \dot{\boldsymbol{q}}+\delta \dot{\boldsymbol{q}}, t) dt-\int_{t_i}^{t_f}L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$を計算する。偏微分を用いて微小項の１次まで展開すると、変分の時間微分と時間微分の変分が等しいことを用いて、
$$
\delta S=\int_{t_i}^{t_f} \sum_{i=1}^N \left(\frac{\partial L}{\partial q_i} \delta q_i + \frac{\partial L}{\partial \dot{q}_i} \delta\dot{q}_i \right) dt = \int_{t_i}^{t_f} \sum_{i=1}^N \left\{ \frac{\partial L}{\partial q_i} \delta q_i + \frac{\partial L}{\partial \dot{q}_i} \left( \frac{d}{dt} \delta q_i \right) \right\}
$$第２項を部分積分を用いて展開すると、主張２.２.１の前提として始点と終点における変分$\delta \boldsymbol{q}(t_i)$, $\delta \boldsymbol{q}(t_f)$はゼロになるから、
$$
\int_{t_i}^{t_f} \sum_{i=1}^N \left\{ \frac{\partial L}{\partial \dot{q}_i} \left(\frac{d}{dt} \delta q_i \right) \right\} dt = \sum_{i=1}^N \left\{ \left[ \frac{\partial L}{\partial \dot{q}_i}\delta q_i\right]_{t_i}^{t_f} – \int_{t_i}^{t_f} \left( \frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i} \right) \delta q_i \right\} dt = \int_{t_i}^{t_f} \sum_{i=1}^N \left\{ \left( \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} \right) \delta q_i \right\} dt
$$とかける。主張２.２.１より$\delta S=0$であるから、
$$
\int_{t_i}^{t_f} \sum_{i=1}^N \left\{ \left( \frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} \right) \delta q_i \right\} dt =0
$$ここで数学的に、変分学の基本補題より、それぞれ始点と終点以外ではどんな形でも自由に選べる任意のズレである$\delta q_i(t)$に対して、どんな$\delta q_i(t)$を掛け算して積分しても結果が常にゼロになるためにはそもそもカッコの中身の関数自体が常にゼロ**でなければならないから、$i=1,2,…,N$に対して以下が成り立つ。
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q_i}} =0 \quad
$$□

さて、こういう歴史的な経緯を経て、オイラー=ラグランジュ方程式を原理とする解析力学(ラグランジュ形式)がつくられました。なお、本稿で「力学系の粒子は作用が極小となる経路を通る」という、まるで自然が意思を持ったかのような表現をいくつか扱っていますが、これはのちに量子力学のなかで位相の重ね合わせとして正当化されることになります。