ラグランジュ力学を拘束系に拡張する

第１章―ラグランジュ力学を復習する
- １　最小作用の原理
- ２　オイラー=ラグランジュ方程式
第２章―ラグランジュ力学を拘束系に拡張する

第１章―ラグランジュ力学を復習する

こんにちは、管理人のturtleです。
本稿はあくまで管理人の備忘録として書いておりますが、解析力学を学びたい読者ならだれでも理解できる形を目指しております。本稿はこちらの子記事となっておりますので、よければ合わせてご覧ください。
では、親記事で説明したラグランジュ力学の復習からしていきます。

１　最小作用の原理

まずは、次のように物理量として「ラグランジアン$L$」と「作用$S$」を定義して、次のようなことを原理としましょう。

定義１.１(ラグランジアンの定義)
系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$としたとき、各時刻における系の状態$(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$を引数として、その系の自由度や対称性、相互作用を正しく表すように選ばれる物理量$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$を、ラグランジアンと定義する。

定義１.２(作用の定義)
系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$、系に対応するラグランジアンを$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$としたとき、
$$
S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt
$$なる物理量$S$を、時刻$t_i$から時刻$t_f$までの作用と定義する。

原理１.３(最小作用の原理)
現実に物体が通過する経路$\boldsymbol{q}(t)$においては作用$S$が停留する、すなわち、始点$\boldsymbol{q}(t_i)$と終点 $\boldsymbol{q}(t_f)$を固定したときの作用の変分$\delta S$がゼロになる。

かなり突飛にいろんなことが出てきて、何を言っているのかわからないように思えますが、くわしくはこちらで説明しています。

大事なことだけ書いておくと、原理というのは、証明はできないけれどたしかに現実の運動がそれにしたがっている、という主張のことで、古典力学におけるニュートンの運動方程式、古典電磁気学におけるマクスウェル方程式みたいなものですね。
今回、解析力学をはじめるにあたって、原理１.３、すなわち「現実に物体が通過する経路$\boldsymbol{q}(t)$においては、作用$S=\int_{t_i}^{t_f} L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) dt$が停留する」という主張が、現実に起こる運動と非常によく整合しているから、証明なしに受け入れてしまおうということです。

２　オイラー=ラグランジュ方程式

先ほどの原理１.３から、以下の定理１.４が導かれます。

定理１.４(オイラー=ラグランジュ方程式)
系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$、系に対応するラグランジアンを$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$としたとき、$i=1,2,…,N$に対して以下が成り立つ。
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} =0
$$

さて、ここまでがラグランジュ力学の出発点です。本稿で行う議論は、ここまでわかっていれば大丈夫です。

第２章―ラグランジュ力学を拘束系に拡張する

１　拘束系とはなにか

本稿で扱うのは、”拘束のある”力学系におけるラグランジュ力学です。
$N$次元の力学系について$x_1,x_2,…,x_N$がそれぞれ独立に、かつ無制限に動くことができるときは、系の粒子の位置を指定するために$N$個の変数を必要とします。その一方で、変数の間に関係式として$G(x_1,x_2,…,x_N,t)=0$のようなものが存在するときは、系の粒子の位置を指定するために必要な変数が減ることになりますよね。
例えば、図２.１の台の上を転がる運動であれば、質点の位置を表す直交座標$x,y,z$が$z=x \tan \theta$という関係式を満たしており、このために質点の位置は２変数で与えられることになります。
図２.１の糸につながった運動でも、質点の位置を表す円筒座標$\rho,\phi,z$が$\rho=l$という関係式を満たしており、このために質点の位置は２変数でかけば済むことになります。

こういうように、系の粒子の位置を表す変数が等式$G(x_1,x_2,…,x_N,t)=0$によって制限されているときに”拘束がある”と表現します。正確には、現実の力学系においては不等式による拘束や、等式が変数の時間微分を含んでかかれる拘束などもありますが、簡単のため本稿では、位置を表す変数間の等式による拘束(ホロノミックな拘束)のみを扱うことにします。

２　拘束条件の扱い方①―未定乗数をとる

定理２.１
力学系の一般化座標を$\boldsymbol{q}=(q_1,q_2,…,q_N)$としたとき、力学系に対応してラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$が定まるならば、拘束条件として$M$本の式$G_j(\boldsymbol{q}, t)=0 \quad (j=1,2,…,M)$を要求するとき、$i=1,2,…,N$に対して
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} =\sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial q_i}
$$を満足するような時間$t$の関数の組$\{\lambda_j(t) \}_{j=1}^M $が存在する。

定理２.１の証明

主張Ａ.２.１(最小作用の原理)より、ラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$は現実に力学系が通過する軌道$\boldsymbol{q}(t)$に対して、$S=\int_{t_i}^{t_f} L dt$の変分$\delta S$をゼロにする量として定義されていた。これより、ラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, t)$の変分を計算し、主張２.２.１から原理２.２を導く証明のときと同様に$\delta \dot{q}_i$の項を部分積分すると、次の式が得られる。
$$
\int_{t_i}^{t_f} \sum_{i=1}^N \left\{ \left( \frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} \right) \delta q_i \right\} dt =0
$$もし$N$個の変数$q_i$がすべて互いに独立に動けるのであれば、変分法の基本補題よりカッコの中身がそれぞれ０になり通常のオイラー＝ラグランジュ方程式が得られるが、ここでは$M$個の拘束条件により各$\delta q_i$は独立して動くことができないため、カッコの中身がそれぞれ０とはいえない。ただ、積分の中身について、
$$
\sum_{i=1}^N \left\{ \left( \frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} \right) \delta q_i \right\} =0 \qquad \text{(a)}
$$であることは成り立つ。ここで、$\boldsymbol{x}$として、
$$
\boldsymbol{x}= {}^t \left( \frac{\partial L}{\partial q_1} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_1} , \frac{\partial L}{\partial q_2} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_2} , … , \frac{\partial L}{\partial q_N} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_N} \right)
$$を定義すると、(a)式は$\boldsymbol{x} \cdot \delta \boldsymbol{q} = 0$と書き換えることができる。
ここで、系の$M$個の拘束条件$G_j(\boldsymbol{q}, t)=0 \quad (j=1,2,…,M)$について、軌道が$\delta q_i$だけズレた仮想的な経路でも、この拘束条件は満たされていなければならないため、時間を固定して$G_j$の変分をとると、
$$
\delta G_j = G_j(\boldsymbol{q} + \delta \boldsymbol{q} , t) – G_j(\boldsymbol{q}, t) = \sum_{i=1}^N \frac{\partial G_j}{\partial q_i} \delta q_i = 0 \qquad (j=1,2,…,M)
$$とならねばならない。これは$\nabla_{\boldsymbol{q}} G_j \cdot \delta \boldsymbol{q} = 0$と書き換えることができる。

以上より、$\nabla_{\boldsymbol{q}} G_j \cdot \delta \boldsymbol{q} = 0$のもとで自由に動く微小の経路変化$\delta \boldsymbol{r}$が、$\boldsymbol{x} \cdot \delta \boldsymbol{q} = 0$を満たすような$\boldsymbol{x}$の条件さえ求めればよいが、この条件は$\boldsymbol{x}$が$\{ \nabla_{\boldsymbol{q}} G_j \}_{i=1}^N$によって張られる部分空間の元であること、すなわち、
$$
\boldsymbol{x} = \sum_{j=1}^M \lambda_j \nabla_{\boldsymbol{q}} G_j
$$なる時間$t$の関数の組$\{\lambda_j(t) \}_{j=1}^M $が存在することである。よって、この各成分をみると示されている。□

ここで、定理２.１の式を変形すると、$G_j(\boldsymbol{q}, t)$は$\dot{\boldsymbol{q}}$を引数に含まないため、
$$
\frac{\partial}{\partial q_i} \left( L-\sum_{j=1}^M \lambda_j G_j \right) – \frac{d}{dt} \frac{\partial}{\partial \dot{q}_i} \left( L-\sum_{j=1}^M \lambda_j G_j \right) = 0
$$と書き換えることができることが分かりますね、つまり、拘束条件があるときは、ラグランジアン$L$を$ L-\sum_{j=1}^M \lambda_j G_j $に置き換えていると見ることもできる、ということです。いずれにしても、
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt} \frac{\partial L}{\partial \dot{q}_i} =\sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial q_i} \qquad (i=1,2,…,N)
$$$$
G_j(\boldsymbol{q}, t)=0 \qquad (j=1,2,…,M)
$$という$N+M$個の式を立てれば、理論的には$\{q_i(t)\}_{i=1}^N $, $\{\lambda_j(t) \}_{j=1}^M $という$N+M$個の変数を求めることができるため、定理２.１でもって、ホロノミックな拘束条件が与えられたときの運動は解くことができるといえます。

３　拘束条件の扱い方②―変数を消去する

というように、ここまでホロノミックな拘束条件が与えられたときの運動を解く方法を考えてきましたが、こうは思わなかったでしょうか。例えば、図Ａ.２.４の糸につながった運動であれば、$-\lambda (\rho-l)$の項を追加せずとも、そもそもラグランジアン自体に$\rho=l$を代入してしまえばよいのではないか、、と。
拘束条件としての$M$本の式$G_j(\boldsymbol{q}, t)=0 \quad (j=1,2,…,M)$を使うと、$N$個の変数は、変数消去によって$N-M$個に減らすことができるでしょう。こうしてできた$N-M$本のオイラー=ラグランジュ方程式から解いた運動が、先ほどのように未定乗数$\{\lambda_j(t) \}_{j=1}^M $をとって解いたときの運動と同じものであることを確認しておきましょう。

定理２.２
拘束条件として$M$本の式$G_j(\boldsymbol{q}, t)=0 \quad (j=1,2,…,M)$を要求するとき、力学系の一般化座標のうち拘束条件を解いて残る変数を$\boldsymbol{q}=(q_1,q_2,…,q_n)$、拘束条件を解いて消える変数を$\boldsymbol{Q}=(Q_1,Q_2,…,Q_M)$とする(ただし$N=n+M$)。
ここで、力学系に対応してラグランジアン$L(\boldsymbol{q}, \dot{\boldsymbol{q}}, \boldsymbol{Q}, \dot{\boldsymbol{Q}}, t)$が定まるならば、これに$\boldsymbol{Q}=\boldsymbol{Q}(\boldsymbol{q},t)$, $\dot{\boldsymbol{Q}}=\dot{\boldsymbol{Q}}(\boldsymbol{q},\dot{\boldsymbol{q}},t)$を代入して変数を消去した$\tilde{L}(\boldsymbol{q}, \dot{\boldsymbol{q}},t) = L(\boldsymbol{q}, \dot{\boldsymbol{q}}, \boldsymbol{Q}(\boldsymbol{q},t), \dot{\boldsymbol{Q}}(\boldsymbol{q},\dot{\boldsymbol{q}},t), t)$に対して、
$$
\frac{\partial \tilde{L}}{\partial q_i} – \frac{d}{dt} \frac{\partial \tilde{L}}{\partial \dot{q}_i} =0 \qquad (i=1,2,…n)
$$を解いて求めた運動は、定理２.１により求めた運動と同じものである。

定理２.２の証明

先に準備として(a),(b),(c),(d),(e)式を与える。
まず変数消去で消える座標$Q_k$は座標$\boldsymbol{q}$と時間$t$の関数$Q_k(\boldsymbol{q}, t)$として表されるので、これを時間で微分すると、速度$\dot{Q}_k$は合成関数の微分より、
$$
\dot{Q}_k = \frac{d Q_k}{dt} = \sum_{j=1}^N \frac{\partial Q_k}{\partial q_j} \frac{d q_j}{dt} + \frac{\partial Q_k}{\partial t} \frac{dt}{dt} = \sum_{j=1}^N \frac{\partial Q_k}{\partial q_j}\dot{q}_j + \frac{\partial Q_k}{\partial t}
$$とかける。この$\dot{Q}_k$を$\dot{q}_i$以外を定数とみなして偏微分すると、$Q_k$は$\boldsymbol{q}$と時間$t$の関数であるため、$\frac{\partial Q_k}{\partial q_j}$や$\frac{\partial Q_k}{\partial t}$は$\dot{\boldsymbol{q}}$を引数に含まないから、合成関数の微分より、
$$
\frac{\partial \dot{Q}_k}{\partial \dot{q}_j} = \frac{\partial}{\partial \dot{q}_j} \left( \sum_{j=1}^N \frac{\partial Q_k}{\partial q_j}\dot{q}_j + \frac{\partial Q_k}{\partial t} \right) = \frac{\partial Q_k}{\partial q_j} \qquad \text{(a)}
$$が成り立つ。続いて、拘束条件$G_j(\boldsymbol{q}, \boldsymbol{Q}, t) = 0$を解いて得られた$\boldsymbol{Q} = \boldsymbol{Q}(\boldsymbol{q}, t)$を元の式に代入した恒等式$\tilde{G}_j(\boldsymbol{q}, t) = G_j(\boldsymbol{q}, \boldsymbol{Q}(\boldsymbol{q}, t), t) = 0$について、この両辺を独立変数$q_i$で偏微分すると、合成関数の微分を用いて、
$$
\frac{\partial \tilde{G}_j}{\partial q_i} = \frac{\partial G_j}{\partial q_i} + \sum_{k=1}^M \frac{\partial G_j}{\partial Q_k} \frac{\partial Q_k}{\partial q_i} = 0 \qquad \text{(b)}
$$となる。次に、変数を消去したラグランジアン$\tilde{L}(\boldsymbol{q}, \dot{\boldsymbol{q}}, t) = L(\boldsymbol{q}, \dot{\boldsymbol{q}}, \boldsymbol{Q}(\boldsymbol{q},t), \dot{\boldsymbol{Q}}(\boldsymbol{q},\dot{\boldsymbol{q}},t), t)$についても$q_i$と $\dot{q}_i$でそれぞれ偏微分すると、合成関数の微分を用いて、
$$
\frac{\partial \tilde{L}}{\partial q_i} = \frac{\partial L}{\partial q_i} + \sum_{k=1}^M \left( \frac{\partial L}{\partial Q_k} \frac{\partial Q_k}{\partial q_i} + \frac{\partial L}{\partial \dot{Q}_k} \frac{\partial \dot{Q}_k}{\partial q_i} \right) \qquad \text{(c)}
$$$$
\frac{\partial \tilde{L}}{\partial \dot{q}_i} = \frac{\partial L}{\partial \dot{q}_i} + \sum_{k=1}^M \frac{\partial L}{\partial \dot{Q}_k} \frac{\partial \dot{Q}_k}{\partial \dot{q}_i} = \frac{\partial L}{\partial \dot{q}_i} + \sum_{k=1}^M \frac{\partial L}{\partial \dot{Q}_k} \frac{\partial Q_k}{\partial q_i} \qquad \text{(d)}
$$となる。ただし、(d)式の１つ目の等号は$\boldsymbol{Q}(\boldsymbol{q},t)$は速度$\dot{\boldsymbol{q}}$には依存しないため、$\frac{\partial Q_k}{\partial \dot{q}_i}=0$であること、２つ目の等号は(a)式を用いている。(d)式をさらに時間$t$で全微分すると、積の微分公式を用いて、
$$
\frac{d}{dt}\left(\frac{\partial \tilde{L}}{\partial \dot{q}_i}\right) = \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{q}_i}\right) + \sum_{k=1}^M \left[ \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{Q}_k}\right) \frac{\partial Q_k}{\partial q_i} + \frac{\partial L}{\partial \dot{Q}_k} \frac{d}{dt}\left(\frac{\partial Q_k}{\partial q_i}\right) \right] \qquad \text{(e)}
$$となっている。さて、式(a),(b),(c),(d),(e)を与えたので証明に入る。定理２.１の式から定理２.２の式が矛盾なく出てくることを示す。

定理２.１は、すべての変数($q_i$と$Q_k$)に対して
$$
\frac{\partial L}{\partial q_i} – \frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i} = \sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial q_i} \qquad \text{(f)}
$$$$
\frac{\partial L}{\partial Q_k} – \frac{d}{dt}\frac{\partial L}{\partial \dot{Q}_k} = \sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial Q_k} \qquad \text{(g)}
$$が成り立つことを主張している。ここから定理２.２の式が矛盾なく出てくることを示すために、(c)式と(e)式を引き算して$\tilde{L}$のオイラー＝ラグランジュ方程式の左辺を計算すると、
$$
\frac{\partial \tilde{L}}{\partial q_i} – \frac{d}{dt}\left(\frac{\partial \tilde{L}}{\partial \dot{q}_i}\right) = \left( \frac{\partial L}{\partial q_i} – \frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i} \right) + \sum_{k=1}^M \left( \frac{\partial L}{\partial Q_k} – \frac{d}{dt}\frac{\partial L}{\partial \dot{Q}_k} \right) \frac{\partial Q_k}{\partial q_i}
$$となる。右辺に(f)式と(g)式を代入することで、
$$
\frac{\partial \tilde{L}}{\partial q_i} – \frac{d}{dt}\left(\frac{\partial \tilde{L}}{\partial \dot{q}_i}\right) = \sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial q_i} + \sum_{k=1}^M \left( \sum_{j=1}^M \lambda_j \frac{\partial G_j}{\partial Q_k} \right) \frac{\partial Q_k}{\partial q_i} = \sum_{j=1}^M \lambda_j \left[ \frac{\partial G_j}{\partial q_i} + \sum_{k=1}^M \frac{\partial G_j}{\partial Q_k} \frac{\partial Q_k}{\partial q_i} \right] = 0
$$となっている。ただし、３つ目の等号は(b)式を用いた。これは定理２.２の$\tilde{L}$のオイラー＝ラグランジュ方程式そのものであるから、示された。□

“拘束のある”力学系へのラグランジュ力学の適用として、これら２つの方法を確認したのはどちらも得手と不得手があるからです。簡単な拘束条件ならば変数を消去した方が早いですが、変数消去をしようとすると平方根が出てくる場合などはあえてそのまま残して未定乗数をとった方がいいときもあるので、どちらも確認しておきましょう。

以上、ラグランジュ力学の拘束系への拡張を説明してみました。お疲れさまでした。

第１章―ラグランジュ力学を復習する

１ 最小作用の原理

２ オイラー=ラグランジュ方程式

第２章―ラグランジュ力学を拘束系に拡張する

１ 拘束系とはなにか

２ 拘束条件の扱い方①―未定乗数をとる

３ 拘束条件の扱い方②―変数を消去する

コメント

１　最小作用の原理

２　オイラー=ラグランジュ方程式

１　拘束系とはなにか

２　拘束条件の扱い方①―未定乗数をとる

３　拘束条件の扱い方②―変数を消去する