最小作用の原理とはなんなのか

第１章―最小作用の原理
- １　最小作用の原理の動機
- ２　哲学的な解釈
第２章―最小作用の原理の適用
- １　最小作用の原理の適用
- ２　解析力学の強み

第１章―最小作用の原理

こんにちは、管理人のturtleです。
本稿はあくまで管理人の備忘録として書いておりますが、解析力学を学びたい読者ならだれでも理解できる形を目指しております。本稿はこちらの子記事となっておりますので、よければ合わせてご覧ください。
本稿では、親記事で紹介した最小作用の原理が歴史的にどういう要請で生まれたか、どの物理学の分野では最小作用の原理がたしかに現実に整合しているのか、各分野の支配方程式をわざわざ最小作用の原理に書き換える意義はなにか、とかについて考えていきます。

１　最小作用の原理の動機

ラグランジュ力学では、次のように物理量として「ラグランジアン$L$」と「作用$S$」を定義して、次のようなことを原理としています。

定義１.１(ラグランジアンの定義)
系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$としたとき、各時刻における系の状態$(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$を引数として、その系の自由度や対称性、相互作用を正しく表すように選ばれる物理量$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$を、ラグランジアンと定義する。

定義１.２(作用の定義)
系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$、系に対応するラグランジアンを$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$としたとき、
$$
S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$なる物理量$S$を、時刻$t_i$から時刻$t_f$までの作用と定義する。

原理１.３(最小作用の原理)
現実に物体が通過する経路$\boldsymbol{q}(t)$においては作用$S$が停留する、すなわち、始点$\boldsymbol{q}(t_i)$と終点 $\boldsymbol{q}(t_f)$を固定したときの作用の変分$\delta S$がゼロになる。

最小作用の原理というのは、ある意味で直感的な主張ですが、これが主張された歴史的な背景には、光学における以下の原理があります。

補題１.４(フェルマーの原理)
光は光学的距離が停留する経路を通る、すなわち、媒質の屈折率$n(\boldsymbol{r})$、光線の経路$\boldsymbol{r}(\lambda)$(ただし$\lambda$は経路に沿った任意のパラメータ)に対して、$\lambda_i$から$\lambda_f$までの光学的距離$S$を
$$
S=\int_{\lambda_i}^{\lambda_f} n(\boldsymbol{r}) |\boldsymbol{r}'(\lambda)| d \lambda
$$と定義すると、現実に光が通過する経路においては、始点$\boldsymbol{r}(t_i)$と終点 $\boldsymbol{r}(t_f)$を固定したときの光学的距離の変分$\delta S$がゼロになる。

難しいことを言っているように見えますが、「すなわち」の後から続く部分はすべて、「光は光学的距離が停留する経路を通る」ということの言い換えです。ここで、光学的距離は到達時間と光速の積ですから、この原理の言っていることは「光は到達時間が停留する経路を通る」ということです。
言っていることはきわめて直感的で自然でしょう。
変分のくだりについては、「その経路を選んだときの光の到達時間が停留するということは、始点$\boldsymbol{r}(t_i)$と終点 $\boldsymbol{r}(t_f)$を固定したまま経路を微小にずらしたときに、その極限で到達時間は変化しない」ということを言っているわけです。

別に、フェルマーの原理から最小作用の原理が導かれるということではありませんが、この２つの原理の記述は非常に似通っていることが分かるかと思います。
というのは、物理学はこの補題１.４の成功から、古典力学の分野においても「力学系の粒子が現実に選んだ経路において停留する量」が存在するのでは、と類推したためです。この物理量を作用$S$と試しにおいてみると、作用$S$はどういう形で書けるべきでしょうか。

作用$S$は今まで見たことをふまえると、古典力学の系が運動する経路を１つ定めたときにそれに対して出力される量であるので、“経路の評価”としての意味を含んでいますよね。

まず、$t_i$から$t_m$の部分の作用$S[t_i , t_m]$と、$t_m$から$t_f$の部分の作用$S[t_m , t_f]$に対して、これを足し合わせたものが全体の作用になる、つまり$S[t_i , t_f]=S[t_i , t_m]+S[t_m , t_f]$とかけることが自然です。
さらに、作用$S$は各々の時刻の力学系の状態を含んでいなければなりませんから、作用の増分$dS$は、(その瞬間の状態で書ける量)×$dt$としてかけることが自然です。

(その瞬間の状態で書ける量)の引数として$\boldsymbol{q}, \dot{\boldsymbol{q}}, t$をとるとして、この量を$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$とかくとき、これらの要求からつくられる時刻$t_i$から時刻$t_f$までの作用$S$は、
$$
S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$と書けるのが自然ではないでしょうか。

少々天下り的でゴール在りきだと感じたのは当然で、歴史的にはニュートンの運動方程式をふまえながら何度も修正されて、この形にたどり着いています。
そして、ここで出てきた量$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が、実はいままでラグランジアンとして紹介していた物理量であって、「力学系の粒子は作用が停留する経路を通る」というのがまさに主張１.３であるわけです。

２　哲学的な解釈

以上のような経緯で、最小作用の原理が生まれたわけですが、しばしばこの原理は「粒子が未来の目的地をあらかじめ知っていて、現在地と目的地を結ぶ経路のうちで最も効率的な経路を自ら選んでいる」という、まるで自然に何らかの意思を持たせるかのような哲学的な解釈で紹介されることがあります。
さらに歴史的には、最小作用の原理が神学と融合することで、”自然は無駄を嫌う”という形での神の完全性や知恵の証明としても受け止められました。この、物理法則に哲学的あるいは宗教的な意味を持たせるという姿勢は、やがて激しい論争の的になっていきます。

これに対して、物理学が決定的な否定をしたのは、量子力学、特にファインマンが構築した「経路積分」という枠組みにおいてです。簡単に言うと、粒子は始点から終点へ向かう際、最も効率的な１つの経路を選んでいるわけではありません。物理的に可能なありとあらゆる経路を同時にすべて通っていますが、位相の重ね合わせによって強め合ったり、逆に互いに打ち消し合って消えてしまったりして、人間の目に見えるマクロなスケールではまるで「最も効率的な経路が選ばれた」かのように見えるだけだというわけです。

第２章―最小作用の原理の適用

１　最小作用の原理の適用

系の自由度や対称性、相互作用を正しく表すようにラグランジアンを決定し、そこに最小作用の原理を適用した結果、古典力学のみならず、電磁気学や相対性理論などさまざまな物理の分野で、現実に整合する記述ができることが示されています。
つまり、現代物理学のほぼすべての基礎分野は、解析力学の枠組みに落とし込めるということです。

なお例外的に、摩擦や空気抵抗などの、多数の原子の複雑な動きをマクロに丸めてしまった現象に対しては、ラグランジアン$L$の表式を書き下すことができませんので、注意してください。

２　解析力学の強み

現代物理学のほぼすべての基礎分野は解析力学の枠組みに落とし込めるということですが、各分野での支配方程式をわざわざ最小作用の原理に書き換える意義はどこにあるのでしょうか。
これは、親記事でも紹介したように、ラグランジアンの具体的な表式に依らず、オイラー=ラグランジュ方程式から成り立つ「定理」さえ準備しておけば、あとは、物理が要請する内容にあうラグランジアンをつくるだけで、その物理において成り立つことが一気に出てくることです。

１次元調和振動子とか、電磁場とか、特殊相対論における自由粒子とか、どんな系に対してもラグランジアンさえ準備できれば、あとは解析力学の定理にしたがって、保存量とかが一気に出てくるというわけですね。

以上、最小作用の原理を１記事で説明してみました。お疲れさまでした。

第１章―最小作用の原理

１ 最小作用の原理の動機

２ 哲学的な解釈

第２章―最小作用の原理の適用

１ 最小作用の原理の適用

２ 解析力学の強み

コメント

１　最小作用の原理の動機

２　哲学的な解釈

１　最小作用の原理の適用

２　解析力学の強み