正準変換とは結局なんなのか

こんにちは、管理人のturtleです。
本稿はあくまで管理人の備忘録として書いておりますが、解析力学を学びたい読者ならだれでも理解できる形を目指しております。本稿はこちらの子記事となっておりますので、よければ合わせてご覧ください。
では、いきなりですが、正準変換の話をしていきます。

ラグランジュ形式でもハミルトン形式でも、位置を表す座標\(\boldsymbol{q}\)の間の変換\(\boldsymbol{q} \rightarrow \boldsymbol{Q}(\boldsymbol{q})\)に対して、方程式が変わらないことはさんざん扱ってきました。

ところで、ラグランジュ形式からハミルトン形式に移る過程で、大きく変わったこととして、”位置座標\(\boldsymbol{q}\)と運動量座標\(\boldsymbol{p}\)が完全に対等な独立変数になったこと”がありましたよね。そうすると、この対等性を利用して「\(\boldsymbol{q}\)と\(\boldsymbol{p}\)をぐちゃぐちゃに混ぜ合わせて、計算が楽になるような、全く新しい架空の位置\(\boldsymbol{Q}\)と運動量\(\boldsymbol{P}\)を作り出す変換」をしたいと思いませんか。
つまり、運動量を表す座標\(\boldsymbol{p}\)を含めた座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)を考えませんか、ということです。

ただ、この変換で正準方程式が使えなくなったら元も子もありません。そこで、正準形式が保たれる変換、つまり、

もとの変数\((\boldsymbol{q}, \boldsymbol{p})\)から新しい変数\((\boldsymbol{Q}, \boldsymbol{P})\)への座標変換であって、\(i=1,2,…,N\)に対して正準方程式
$$
\dot{Q}_i = \frac{\partial K}{\partial P_i}, \qquad \dot{P}_i = -\frac{\partial K}{\partial Q_i}
$$を成り立たせるような新しいハミルトニアン\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)が存在する座標変換

とはどういう座標変換なのか、というのが本稿のモチベーションです。

とはいえ「\(\boldsymbol{q}\)と\(\boldsymbol{p}\)をぐちゃぐちゃに混ぜ合わせて、計算が楽になるような、全く新しい架空の位置\(\boldsymbol{Q}\)と運動量\(\boldsymbol{P}\)を作り出す変換」をしたいというところが、まだ自然に思えないかもしれません。
そもそもまず、計算が楽になるような、新しい架空の位置\(\boldsymbol{Q}\)と運動量\(\boldsymbol{P}\)とはいったいどんなものでしょうか。その答えの一つには、

ハミルトニアンの表式の中に直接含まれていない変数を、位置\(Q_i\)や運動量\(P_i\)として選ぶ変換

があります。例えば、新しいハミルトニアン\(K\)が直接の変数として位置座標\(Q_i\)を含まなければ、\(\dot{P}_i = -\frac{\partial K}{\partial Q_i} = 0\)となるので、架空の運動量\(P_i\)は保存される「定数」となりますよね。

一つ具体的な例を見てみましょう。

質量が\(m=1\)、バネ定数が\(k=1\)であるような1次元調和振動子を考えて、この変位を\(q\)、対応する運動量を\(p\)とすると、ハミルトニアン\(H(q,p)\)は、
$$
H(q, p) = \frac{1}{2}p^2 + \frac{1}{2}q^2
$$とかけます。これを単純に正準方程式から解いてもいいのですが、その結果はご存じのように、位置座標\(q\)、運動量座標\(p\)ともに変化し続ける面倒な変数になります。
ところが、次のような変数変換を考えてみるとどうでしょう。
$$
q = \sqrt{2P} \sin Q \qquad p = \sqrt{2P} \cos Q
$$まだくわしい証明はしませんが、これは正しい正準変換であって、これに対応するハミルトニアンは\(K(Q, P) = P\)ですから、正準方程式として、
$$
\dot{P} = -\frac{\partial K}{\partial Q} = 0 \qquad \dot{Q} = \frac{\partial K}{\partial P} = 1
$$となります。新しい運動量座標\(P\)は定数、新しい位置座標\(Q\)は一定の速度で増加する単調増加の変数となり、微分方程式を解かなくてよいという点でずいぶん扱うのが簡単になったと思いませんか。

もっと複雑な問題になったときに、こういう変換ができるかできないかで、解く手間や問題の見方が大きく変わったりするので、正準変換はハミルトン力学を学ぶ上で大事な技術となっています。

ここまで述べたことをまとめて、以下を正準変換の定義とします。

定義2.1(正準変換の定義)
変数\((\boldsymbol{q}, \boldsymbol{p})\)から変数\(\Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)への座標変換であって、\(i=1,2,…,N\)に対して正準方程式
$$
\dot{Q}_i = \frac{\partial K}{\partial P_i}, \qquad \dot{P}_i = -\frac{\partial K}{\partial Q_i}
$$を成り立たせるような新しいハミルトニアン\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)が存在する座標変換を、正準変換と定義する。

このとき、以下が成り立ちます。

定理2.2
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は正準変換である。
(Ⅱ) \(i=1,2,…,N\)に対して、\(\sum_{i=1}^N p_i dq_i – Hdt = \sum_{i=1}^N P_i dQ_i – Kdt + dF\)を満たす関数\(F,K\)が存在する。

定理2.2の(Ⅰ)→(Ⅱ)の証明

変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)が正準変換であるならば、その定義より\(i=1,2,…,N\)に対して、
$$
\delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N p_i \dot{q}_i – H \right) dt = 0 \qquad \delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N P_i \dot{Q}_i – K \right) dt = 0
$$が成り立つ。変分をとってゼロになる関数どうしというのは完全に同じ関数である必要はなく、任意の関数\(F\)の時間による全微分\(\frac{dF}{dt}\)だけのずれが許容されるので、\(i=1,2,…,N\)に対して、
$$
\sum_{i=1}^N p_i \dot{q}_i – H = \sum_{i=1}^N P_i \dot{Q}_i – K + \frac{dF}{dt}
$$すなわち、\(\sum_{i=1}^N p_i dq_i – Hdt = \sum_{i=1}^N P_i dQ_i – Kdt + dF\)を満たす関数\(F,K\)が存在することが示された。

定理2.2の(Ⅱ)→(Ⅰ)の証明

前提として、現実の運動は最小作用の原理を満足するので作用積分の変分はゼロ、つまり、
$$
\delta S = \delta \int L dt = \delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N p_i \dot{q}_i – H \right) dt = 0 \qquad \text{(a)}
$$となるが、この変分計算からハミルトンの正準方程式を得ることができることを後で用いる。
さて、(Ⅱ)の式の両辺を微小時間\(dt\)で割ると、
$$
\sum_{i=1}^N p_i \dot{q}_i – H = \sum_{i=1}^N P_i \dot{Q}_i – K + \frac{dF}{dt}
$$となり、この式の両辺を、時間\(t_1\)から\(t_2\)まで積分すると、
$$
\int_{t_1}^{t_2} \left( \sum_{i=1}^N p_i \dot{q}_i – H \right) dt = \int_{t_1}^{t_2} \left( \sum_{i=1}^N P_i \dot{Q}_i – K \right) dt + \int_{t_1}^{t_2} \frac{dF}{dt} dt = \int_{t_1}^{t_2} \left( \sum_{i=1}^N P_i \dot{Q}_i – K \right) dt + F(t_2) – F(t_1)
$$とかける。さらに、この式の両辺の、始点\(t_1\)と終点\(t_2\)を固定したときの変分をとると、
$$
0 = \delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N p_i \dot{q}_i – H \right) dt = \delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N P_i \dot{Q}_i – K \right) dt
$$となる。ただし1つめの等号は式(a)を、2つ目の等号は\(\delta F(t_2) = \delta F(t_1) = 0\)を用いた。ここで得られた
$$
0 = \delta \int_{t_1}^{t_2} \left( \sum_{i=1}^N P_i \dot{Q}_i – K \right) dt
$$について、この変分計算から新しい変数\((\boldsymbol{Q}, \boldsymbol{P})\)とハミルトニアン\(K\)におけるハミルトンの正準方程式
$$
\dot{Q}_i = \frac{\partial K}{\partial P_i}, \qquad \dot{P}_i = -\frac{\partial K}{\partial Q_i} \qquad (i=1,2,…,N)
$$を得ることができるので、示された。

ではここからは、実際の正準変換をパターン化していきましょう。

その前に、正準変換をしたときに、独立な文字と従属な文字について注目してみます。
例えば、恒等変換\(\boldsymbol{Q}=\boldsymbol{q},\quad \boldsymbol{P}=\boldsymbol{p}\)みたいに、新しい位置座標\(\boldsymbol{Q}\)がもとの運動量座標\(\boldsymbol{p}\)に全く依存していないとき、\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)は従属であって、\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)は独立ですよね。
こういうふうにみていくと、どんな正準変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)も、

(Ⅰ) \(\boldsymbol{q}\)と\(\boldsymbol{Q}\)が独立な正準変換
(Ⅱ) \(\boldsymbol{q}\)と\(\boldsymbol{P}\)が独立な正準変換
(Ⅲ) \(\boldsymbol{p}\)と\(\boldsymbol{Q}\)が独立な正準変換
(Ⅳ) \(\boldsymbol{p}\)と\(\boldsymbol{P}\)が独立な正準変換

のうち、少なくとも2つにはあてはまるわけです。ちなみに、第1章の2節の例で行った正準変換は、
$$
q = \sqrt{2P} \sin Q \qquad p = \sqrt{2P} \cos Q
$$というものでしたが、これは(Ⅰ)(Ⅱ)(Ⅲ)(Ⅳ)のすべてにあてはまっていますし、先ほどみた恒等変換は(Ⅱ)と(Ⅲ)にあてはまっていますね。
ここからは、正準変換を以上の4パターンに分けて見ていくことになります。まずは、\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)が独立な正準変換についてです。

定理2.3
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は、ハミルトニアンを\(H(\boldsymbol{q}, \boldsymbol{p}, t)\)から\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)に移す正準変換であって、\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)は独立である。
(Ⅱ) \(i=1,2,…,N\)に対して、次を満たす関数\(W(\boldsymbol{q},\boldsymbol{Q},t)\)が存在する。
$$
p_i= \frac{\partial W}{\partial q_i} \qquad P_i= -\frac{\partial W}{\partial Q_i} \qquad K = H + \frac{\partial W}{\partial t}
$$

定理2.3の(Ⅰ)→(Ⅱ)の証明

(Ⅰ)の仮定よりこの変換は正準変換であるので、定理2.2より、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + dF
$$を満たす関数\(F\)が必ず存在する。これを移項すると、
$$
dF = \sum_{i=1}^N p_i dq_i – \sum_{i=1}^N P_i dQ_i + (K – H) dt \qquad \text{(a)}
$$となる。一方で、\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)は独立であるから、\(F\)の引数として\((\boldsymbol{q}, \boldsymbol{Q}, t)\)の組を選ぶことができるので、数学的に関数\(F(\boldsymbol{q}, \boldsymbol{Q}, t)\)の全微分\(dF\)は
$$
dF = \sum_{i=1}^N \frac{\partial F}{\partial q_i} dq_i + \sum_{i=1}^N \frac{\partial F}{\partial Q_i} dQ_i + \frac{\partial F}{\partial t} dt \qquad \text{(b)}
$$とかける。(a)式と(b)式の係数を比較することで、
$$
p_i= \frac{\partial F}{\partial q_i} \qquad P_i= -\frac{\partial F}{\partial Q_i} \qquad K = H + \frac{\partial F}{\partial t}
$$となるから、\(W=F\)として示された。

定理2.3の(Ⅱ)→(Ⅰ)の証明

(Ⅱ)の仮定において、関数\(W\)が\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)と\(t\)を変数に持っており、偏微分\(\partial W/\partial q_i\)や\(\partial W/\partial Q_i\)がそれぞれ意味を持って定義されていることから、変数\(\boldsymbol{q}\)と\(\boldsymbol{Q}\)は互いに独立に動かせる変数である。よって、関数\(W(\boldsymbol{q}, \boldsymbol{Q}, t)\)の全微分は、
$$
dW = \sum_{i=1}^N \frac{\partial W}{\partial q_i} dq_i + \sum_{i=1}^N \frac{\partial W}{\partial Q_i} dQ_i + \frac{\partial W}{\partial t} dt = \sum_{i=1}^N p_i dq_i – \sum_{i=1}^N P_i dQ_i + (K-H) dt
$$とかける。ただし、2つめの等号は(Ⅱ)の仮定を用いた。この式を移項すると、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + dW
$$とかけるから、定理2.2の\(F\)を\(W\)としたものとして、示された。


次に、\(\boldsymbol{q}\)と\(\boldsymbol{P}\)が独立な正準変換についてです。

定理2.4
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は、ハミルトニアンを\(H(\boldsymbol{q}, \boldsymbol{p}, t)\)から\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)に移す正準変換であって、\(\boldsymbol{q}\)と\(\boldsymbol{P}\)は独立である。
(Ⅱ) \(i=1,2,…,N\)に対して、次を満たす関数\(W(\boldsymbol{q},\boldsymbol{P},t)\)が存在する。
$$
p_i= \frac{\partial W}{\partial q_i} \qquad Q_i= \frac{\partial W}{\partial P_i} \qquad K = H + \frac{\partial W}{\partial t}
$$

定理2.4の(Ⅰ)→(Ⅱ)の証明

(Ⅰ)の仮定よりこの変換は正準変換であるので、定理2.2より、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + dF
$$を満たす関数\(F\)が必ず存在する。これを移項すると、
$$
dF = \sum_{i=1}^N p_i dq_i – \sum_{i=1}^N P_i dQ_i + (K – H) dt
$$となるから、新たに関数\(G=F-\sum_{i=1}^N P_iQ_i\)を定義すると、
$$
dG = \sum_{i=1}^N p_i dq_i + \sum_{i=1}^N Q_i dP_i + (K – H) dt \qquad \text{(a)}
$$となる。一方で、\(\boldsymbol{q}\)と\(\boldsymbol{P}\)は独立であるから、\(G\)の引数として\((\boldsymbol{q}, \boldsymbol{P}, t)\)の組を選ぶことができるので、数学的に関数\(G(\boldsymbol{q}, \boldsymbol{P}, t)\)の全微分\(dG\)は
$$
dG = \sum_{i=1}^N \frac{\partial G}{\partial q_i} dq_i + \sum_{i=1}^N \frac{\partial G}{\partial P_i} dP_i + \frac{\partial G}{\partial t} dt \qquad \text{(b)}
$$とかける。(a)式と(b)式の係数を比較することで、
$$
p_i= \frac{\partial G}{\partial q_i} \qquad Q_i= \frac{\partial G}{\partial P_i} \qquad K = H + \frac{\partial G}{\partial t}
$$となるから、\(W=G\)として示された。

定理2.4の(Ⅱ)→(Ⅰ)の証明

(Ⅱ)の仮定において、関数\(W\)が\(\boldsymbol{q}\)と\(\boldsymbol{P}\)と\(t\)を変数に持っており、偏微分\(\partial W/\partial q_i\)や\(\partial W/\partial P_i\)がそれぞれ意味を持って定義されていることから、変数\(\boldsymbol{q}\)と\(\boldsymbol{P}\)は互いに独立に動かせる変数である。よって、関数\(W(\boldsymbol{q}, \boldsymbol{P}, t)\)の全微分は、
$$
dW = \sum_{i=1}^N \frac{\partial W}{\partial q_i} dq_i + \sum_{i=1}^N \frac{\partial W}{\partial P_i} dP_i + \frac{\partial W}{\partial t} dt = \sum_{i=1}^N p_i dq_i + \sum_{i=1}^N Q_i dP_i + (K-H) dt
$$とかける。ただし、2つめの等号は(Ⅱ)の仮定を用いた。この式を整理して移項すると、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + d\left( W – \sum_{i=1}^N P_i Q_i \right)
$$とかけるから、定理2.2の\(F\)を\(W – \sum_{i=1}^N P_i Q_i\)としたものとして、示された。


続いて、\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)が独立な正準変換についてです。

定理2.5
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は、ハミルトニアンを\(H(\boldsymbol{q}, \boldsymbol{p}, t)\)から\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)に移す正準変換であって、\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)は独立である。
(Ⅱ) \(i=1,2,…,N\)に対して、次を満たす関数\(W(\boldsymbol{p},\boldsymbol{Q},t)\)が存在する。
$$
q_i= -\frac{\partial W}{\partial p_i} \qquad P_i= -\frac{\partial W}{\partial Q_i} \qquad K = H + \frac{\partial W}{\partial t}
$$

定理2.5の(Ⅰ)→(Ⅱ)の証明

(Ⅰ)の仮定よりこの変換は正準変換であるので、定理2.2より、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + dF
$$を満たす関数\(F\)が必ず存在する。これを移項すると、
$$
dF = \sum_{i=1}^N p_i dq_i – \sum_{i=1}^N P_i dQ_i + (K – H) dt
$$となるから、新たに関数\(G=F-\sum_{i=1}^N p_iq_i\)を定義すると、
$$
dG = \sum_{i=1}^N -q_i dp_i – \sum_{i=1}^N P_i dQ_i + (K – H) dt \qquad \text{(a)}
$$となる。一方で、\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)は独立であるから、\(G\)の引数として\((\boldsymbol{p}, \boldsymbol{Q}, t)\)の組を選ぶことができるので、数学的に関数\(G(\boldsymbol{p}, \boldsymbol{Q}, t)\)の全微分\(dG\)は
$$
dG = \sum_{i=1}^N \frac{\partial G}{\partial p_i} dp_i + \sum_{i=1}^N \frac{\partial G}{\partial Q_i} dQ_i + \frac{\partial G}{\partial t} dt \qquad \text{(b)}
$$とかける。(a)式と(b)式の係数を比較することで、
$$
q_i= -\frac{\partial G}{\partial p_i} \qquad P_i= -\frac{\partial G}{\partial Q_i} \qquad K = H + \frac{\partial G}{\partial t}
$$となるから、\(W=G\)として示された。

定理2.5の(Ⅱ)→(Ⅰ)の証明

(Ⅱ)の仮定において、関数\(W\)が\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)と\(t\)を変数に持っており、偏微分\(\partial W/\partial p_i\)や\(\partial W/\partial Q_i\)がそれぞれ意味を持って定義されていることから、変数\(\boldsymbol{p}\)と\(\boldsymbol{Q}\)は互いに独立に動かせる変数である。よって、関数\(W(\boldsymbol{p}, \boldsymbol{Q}, t)\)の全微分は、
$$
dW = \sum_{i=1}^N \frac{\partial W}{\partial p_i} dp_i + \sum_{i=1}^N \frac{\partial W}{\partial Q_i} dQ_i + \frac{\partial W}{\partial t} dt = \sum_{i=1}^N -q_i dp_i + \sum_{i=1}^N -P_i dQ_i + (K-H) dt
$$とかける。ただし、2つめの等号は(Ⅱ)の仮定を用いた。この式を整理して移項すると、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + d\left( W – \sum_{i=1}^N p_i q_i \right)
$$とかけるから、定理2.2の\(F\)を\(W – \sum_{i=1}^N p_i q_i\)としたものとして、示された。


最後に、\(\boldsymbol{p}\)と\(\boldsymbol{P}\)が独立な正準変換についてです。

定理2.6
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は、ハミルトニアンを\(H(\boldsymbol{q}, \boldsymbol{p}, t)\)から\(K(\boldsymbol{Q}, \boldsymbol{P}, t)\)に移す正準変換であって、\(\boldsymbol{p}\)と\(\boldsymbol{P}\)は独立である。
(Ⅱ) \(i=1,2,…,N\)に対して、次を満たす関数\(W(\boldsymbol{p},\boldsymbol{P},t)\)が存在する。
$$
q_i= -\frac{\partial W}{\partial p_i} \qquad Q_i= \frac{\partial W}{\partial P_i} \qquad K = H + \frac{\partial W}{\partial t}
$$

定理2.6の(Ⅰ)→(Ⅱ)の証明

(Ⅰ)の仮定よりこの変換は正準変換であるので、定理2.2より、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + dF
$$を満たす関数\(F\)が必ず存在する。これを移項すると、
$$
dF = \sum_{i=1}^N p_i dq_i – \sum_{i=1}^N P_i dQ_i + (K – H) dt
$$となるから、新たに関数\(G=F-\sum_{i=1}^N P_iQ_i-\sum_{i=1}^N p_iq_i\)を定義すると、
$$
dG = \sum_{i=1}^N -q_i dp_i + \sum_{i=1}^N Q_i dP_i + (K – H) dt \qquad \text{(a)}
$$となる。一方で、\(\boldsymbol{p}\)と\(\boldsymbol{P}\)は独立であるから、\(G\)の引数として\((\boldsymbol{p}, \boldsymbol{P}, t)\)の組を選ぶことができるので、数学的に関数\(G(\boldsymbol{p}, \boldsymbol{P}, t)\)の全微分\(dG\)は
$$
dG = \sum_{i=1}^N \frac{\partial G}{\partial p_i} dp_i + \sum_{i=1}^N \frac{\partial G}{\partial P_i} dP_i + \frac{\partial G}{\partial t} dt \qquad \text{(b)}
$$とかける。(a)式と(b)式の係数を比較することで、
$$
q_i= -\frac{\partial G}{\partial p_i} \qquad Q_i= \frac{\partial G}{\partial P_i} \qquad K = H + \frac{\partial G}{\partial t}
$$となるから、\(W=G\)として示された。

定理2.6の(Ⅱ)→(Ⅰ)の証明

(Ⅱ)の仮定において、関数\(W\)が\(\boldsymbol{p}\)と\(\boldsymbol{P}\)と\(t\)を変数に持っており、偏微分\(\partial W/\partial p_i\)や\(\partial W/\partial P_i\)がそれぞれ意味を持って定義されていることから、変数\(\boldsymbol{p}\)と\(\boldsymbol{P}\)は互いに独立に動かせる変数である。よって、関数\(W(\boldsymbol{p}, \boldsymbol{P}, t)\)の全微分は、
$$
dW = \sum_{i=1}^N \frac{\partial W}{\partial p_i} dp_i + \sum_{i=1}^N \frac{\partial W}{\partial P_i} dP_i + \frac{\partial W}{\partial t} dt = \sum_{i=1}^N -q_i dp_i + \sum_{i=1}^N Q_i dP_i + (K-H) dt
$$とかける。ただし、2つめの等号は(Ⅱ)の仮定を用いた。この式を整理して移項すると、
$$
\sum_{i=1}^N p_i dq_i – H dt = \sum_{i=1}^N P_i dQ_i – K dt + d\left( W -\sum_{i=1}^N P_iQ_i- \sum_{i=1}^N p_i q_i \right)
$$とかけるから、定理2.2の\(F\)を\(W -\sum_{i=1}^N P_iQ_i- \sum_{i=1}^N p_i q_i\)としたものとして、示された。

以上が、具体的な正準変換の作り方です。これをもとに、実際に物理のどういうところで正準変換をどう使うのか、簡単な具体例を通して見ていきましょう。

では、先に述べた単振動の例をもう一度振り返って、正準変換の使い方を見ていきます。

質量が\(m=1\)、バネ定数が\(k=1\)であるような1次元調和振動子を考えて、この変位を\(q\)、対応する運動量を\(p\)とすると、ハミルトニアン\(H(q,p)\)は、
$$
H(q, p) = \frac{1}{2}p^2 + \frac{1}{2}q^2
$$とかけます。このハミルトニアンは時間非依存のため定数\(E\)でありますから、この運動を横軸を\(q\)、縦軸を\(p\)とした位相空間上に描いてみると、半径が\(\sqrt{2E}\)の円になり、時間が経つにつれて位相空間上の状態\((q, p)\)はこの円周上をグルグルと回り続けます。よって、位相空間上の極座標で表せば、半径はずっと一定で、角度は単調に増えていくだけなので、これを新しい変数\(Q\)と\(P\)に変換する、つまり
$$
q = \sqrt{2P} \sin Q \qquad p = \sqrt{2P} \cos Q \qquad \text{(a)}
$$とすると、複雑な微分方程式を解かなくても解析できそうだと思い至るわけです。

しかし思いついたはいいですが、これが本当に正準変換として認められるためには、関数\(W\)の存在を示さなければなりません。ここでは定理2.3を用いて、
$$
p= \frac{\partial W}{\partial q} \qquad P= -\frac{\partial W}{\partial Q} \qquad K = H + \frac{\partial W}{\partial t}
$$を満たす関数\(W(q,Q,t)\)が存在することを示してみましょう。(a)式を\(p\)と\(P\)について解くと、
$$
P = \frac{q^2}{2 \sin^2 Q} \qquad p = \frac{q}{\tan Q} q
$$となりますから、\(q\)で偏微分したら\(q/ \tan Q\)、\(Q\)で偏微分したら\(-q^2/2 \sin^2 Q\)になる関数として、
$$
W(q, Q) = \frac{q^2}{2 \tan Q}
$$がありますね。これに対応するハミルトニアンは定理2.3より、\(K(Q, P) =H + \partial W/\partial t = P\)とかけますから、正準方程式として、
$$
\dot{P} = -\frac{\partial K}{\partial Q} = 0 \qquad \dot{Q} = \frac{\partial K}{\partial P} = 1
$$が成り立ち、複雑な微分方程式を出さなくとも非常に簡単に解けてしまうわけです。

もっと複雑な問題で例を見たい方は、こちらの第3章の8節をご覧ください。

第3章の本題に入る前に、正準変換であることと同値な条件をもう一つ伝えておきます。

定理3.1
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は正準変換である。
(Ⅱ) 古い変数から新しい変数への変換におけるヤコビ行列\(M\)および、\(N \times N\)の単位行列\(I\)と零行列\(O\)に対する\(2N \times 2N\)の反対称行列(シンプレティック行列)\(J\)を、次のように定義したとき、\(M J {}^t \! M^T = J\)
$$
M =\begin{pmatrix} \frac{\partial \boldsymbol{Q}_i}{\partial \boldsymbol{q}_j} & \frac{\partial \boldsymbol{Q}_i}{\partial \boldsymbol{p}_j} \\ \frac{\partial \boldsymbol{P}_i}{\partial \boldsymbol{q}_j} & \frac{\partial \boldsymbol{P}_i}{\partial \boldsymbol{p}_j} \end{pmatrix} \qquad J = \begin{pmatrix} 0 & I \\ -I & 0 \end{pmatrix}
$$

定理3.1の(Ⅰ)→(Ⅱ)の証明

\(2N\)個の古い変数\((\boldsymbol{q}, \boldsymbol{p})\)と、新しい変数\((\boldsymbol{Q}, \boldsymbol{P})\)を、それぞれ縦ベクトル\(\boldsymbol{x}\)と\(\boldsymbol{X}\)にまとめて
$$
\boldsymbol{x} = \begin{pmatrix} \boldsymbol{q} \\ \boldsymbol{p} \end{pmatrix}, \quad \boldsymbol{X} = \begin{pmatrix} \boldsymbol{Q} \\ \boldsymbol{P} \end{pmatrix}
$$とかくと、このとき古い変数におけるハミルトンの正準方程式\(\dot{q}_i = \frac{\partial H}{\partial p_i}, \dot{p}_i = -\frac{\partial H}{\partial q_i}\)は、
$$
\dot{\boldsymbol{x}} = J (\nabla_{\boldsymbol{x}} H) \qquad \text{(a)}
$$だけでかける。また、変換\(\boldsymbol{x} \rightarrow \boldsymbol{X}\)が正準変換であるとすると、新しい変数\(\boldsymbol{X}\)においても、新しいハミルトニアン\(K\)に対してハミルトンの正準方程式の形が保たれるということなので、同様にして、
$$
\dot{\boldsymbol{X}} = J (\nabla_{\boldsymbol{X}} K) \qquad \text{(b)}
$$が成り立っている。さて、合成関数の微分より、\(\dot{\boldsymbol{X}} = M \dot{\boldsymbol{x}}\)および\((\nabla_{\boldsymbol{x}} H) = {}^t \! M (\nabla_{\boldsymbol{X}} K)\)であることを、(a)式に代入すると、
$$
\dot{\boldsymbol{X}} = M J {}^t \! M (\nabla_{\boldsymbol{X}} K) \qquad \text{(c)}
$$とかけるので、(b)式と(c)式の係数を比較して、\(M J {}^t \! M = J\)が得られた。

定理3.1の(Ⅱ)→()の証明

先の証明と同様に、\(2N\)個の古い変数\((\boldsymbol{q}, \boldsymbol{p})\)と、新しい変数\((\boldsymbol{Q}, \boldsymbol{P})\)を、それぞれ縦ベクトル\(\boldsymbol{x}\)と\(\boldsymbol{X}\)にまとめて
$$
\boldsymbol{x} = \begin{pmatrix} \boldsymbol{q} \\ \boldsymbol{p} \end{pmatrix}, \quad \boldsymbol{X} = \begin{pmatrix} \boldsymbol{Q} \\ \boldsymbol{P} \end{pmatrix}
$$とかくと、このとき古い変数におけるハミルトンの正準方程式\(\dot{q}_i = \frac{\partial H}{\partial p_i}, \dot{p}_i = -\frac{\partial H}{\partial q_i}\)は、
$$
\dot{\boldsymbol{x}} = J (\nabla_{\boldsymbol{x}} H)
$$だけでかける。合成関数の微分より、\(\dot{\boldsymbol{X}} = M \dot{\boldsymbol{x}}, \quad (\nabla_{\boldsymbol{x}} H) = {}^t \! M (\nabla_{\boldsymbol{X}} K)\)であること、および(Ⅱ)の仮定である\(M J {}^t \! M = J\)を用いると、新しい変数における正準方程式\(\dot{\boldsymbol{X}} = J (\nabla_{\boldsymbol{X}} K)\)が導かれるため、示された。

さてこれをふまえて、正準変換とポアソン括弧の話に移りましょう。

ここからは、正準変換でポアソン括弧がどう変わるか、という話です。結論から言うと、正準変換の前と後において、ポアソン括弧は保存されることが知られています。
それを認めるために、まずは次の定理を示しましょう。

定理3.2(基本ポアソン括弧の不変性)
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は正準変換である。
(Ⅱ) \(i,j=1,2,…,N\)に対して、\(\{Q_i,Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_{ij}\)

定理3.2の(Ⅰ)→(Ⅱ)の証明

定理3.1をふまえて、定理3.1の(Ⅱ)→定理3.2の(Ⅱ)を示す、つまり、「定理3.1で定義した行列に対して\(M J {}^t \! M^T = J\)が成り立っているとき、\(i,j=1,2,…,N\)に対して、\(\{Q_i,Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_{ij}\)が成り立つこと」を示すことにする。
新しい変数同士のポアソン括弧\(\{X_i, X_j\}\)をすべての\(i, j\)の組み合わせで計算し、行列の形に並べたものは、数学の定義から自動的に\(M J {}^t \! M^T\)という行列になるので、\(M J M^T = J\)より、
\(\{Q_i, Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}\)は行列\(M J M^T = J\)の左上のブロックの成分なのでたしかに0
\(\{P_i, P_j\}_{(\boldsymbol{q},\boldsymbol{p})}\)は行列\(M J M^T = J\)の右下のブロックの成分なのでたしかに0
\(\{Q_i, P_j\}_{(\boldsymbol{q},\boldsymbol{p})}\)は行列\(M J M^T = J\)の右上のブロックの成分なのでたしかに\(\delta_{ij}\)であることが示された。

定理3.2の(Ⅱ)→(Ⅰ)の証明

定理3.1をふまえて、定理3.2の(Ⅱ)→定理3.1の(Ⅱ)を示す、つまり、「\(i,j=1,2,…,N\)に対して、\(\{Q_i,Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_{ij}\)が成り立っているとき、定理3.1で定義した行列に対して\(M J {}^t \! M^T = J\)が成り立つこと」を示すことにする。
新しい変数同士のポアソン括弧\(\{X_i, X_j\}\)をすべての\(i, j\)の組み合わせで計算し、行列の形に並べたものは、数学の定義から自動的に\(M J {}^t \! M^T\)という行列になる。一方で、定理3.2の(Ⅱ)の仮定より、新しい変数同士のポアソン括弧\(\{X_i, X_j\}\)を\(2N \times 2N\)の行列の形に並べると、左上と右下のブロックは\(O\)、右上のブロックは単位行列\(I\)、左下のブロックは\(-I\)である行列\(J\)になるので、たしかに\(M J {}^t \! M^T = J\)となる。

ここから直ちに、正準変換の前と後において、ポアソン括弧は保存されることを示すことができます。

系3.3(ポアソン括弧の不変性)
次の(Ⅰ)と(Ⅱ)は同値である。
(Ⅰ) 座標変換\((\boldsymbol{q}, \boldsymbol{p}) \rightarrow \Big(\boldsymbol{Q}(\boldsymbol{q}, \boldsymbol{p},t), \boldsymbol{P}(\boldsymbol{q}, \boldsymbol{p},t) \Big)\)は正準変換である。
(Ⅱ) 任意の関数\(A,B\)について、\(\{A,B\}_{(\boldsymbol{Q},\boldsymbol{P})}=\{A,B\}_{(\boldsymbol{q},\boldsymbol{p})}\)

定理3.3の(Ⅰ)→(Ⅱ)の証明

定理3.1をふまえて、定理3.1の(Ⅱ)→定理3.3の(Ⅱ)を示す、つまり、「定理3.1で定義した行列に対して\(M J {}^t \! M^T = J\)が成り立っているとき、任意の関数\(A,B\)について、\(\{A,B\}_{(\boldsymbol{Q},\boldsymbol{P})}=\{A,B\}_{(\boldsymbol{q},\boldsymbol{p})}\)が成り立つこと」を示すことにする。
任意の関数\(A,B\)について、古い変数同士のポアソン括弧\(\{A, B\}_{(\boldsymbol{q},\boldsymbol{p})}\)は、数学の定義から自動的に\({}^t \! (\nabla_{\boldsymbol{x}}A)J(\nabla_{\boldsymbol{x}}B)\)とかけ、同様に、新しい変数同士のポアソン括弧\(\{A, B\}_{(\boldsymbol{Q},\boldsymbol{P})}\)は、\({}^t \! (\nabla_{\boldsymbol{X}}A)J(\nabla_{\boldsymbol{X}}B)\)とかける。さて、合成関数の微分より、\((\nabla_{\boldsymbol{x}} A) = {}^t \! M (\nabla_{\boldsymbol{X}} A)\)および\((\nabla_{\boldsymbol{x}} B) = {}^t \! M (\nabla_{\boldsymbol{X}} B)\)であることを用いると、
$$
\{A, B\}_{(\boldsymbol{q},\boldsymbol{p})} = {}^t \! \left( {}^t \! M (\nabla_{\boldsymbol{X}} A) \right) J \left( {}^t \! M (\nabla_{\boldsymbol{X}} B) \right) = {}^t \! (\nabla_{\boldsymbol{X}} A) M J {}^t \! M (\nabla_{\boldsymbol{X}} B) = {}^t \! (\nabla_{\boldsymbol{X}} A) J (\nabla_{\boldsymbol{X}} B) = \{A, B\}_{(\boldsymbol{Q},\boldsymbol{P})}
$$とかけるので示された。ただし、2つ目の等号は定理3.1の(Ⅱ)の仮定、3つ目の等号は先に述べた\(\{A, B\}_{(\boldsymbol{Q},\boldsymbol{P})}\)の数学的書き換えを用いている。

定理3.3の(Ⅱ)→(Ⅰ)の証明

定理3.2をふまえて、定理3.3の(Ⅱ)→定理3.2の(Ⅱ)を示す、つまり、「任意の関数\(A,B\)について、\(\{A,B\}_{(\boldsymbol{Q},\boldsymbol{P})}=\{A,B\}_{(\boldsymbol{q},\boldsymbol{p})}\)が成り立っているとき、\(i,j=1,2,…,N\)に対して、\(\{Q_i,Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_{ij}\)が成り立つこと」を示すことにする。
\(A\)として新しい座標\(Q_i\)、\(B\)として新しい座標\(Q_j\)を選ぶことにすると、
$$
\{Q_i, Q_j\}_{(\boldsymbol{q},\boldsymbol{p})} = \{Q_i, Q_j\}_{(\boldsymbol{Q},\boldsymbol{P})} = \sum_{k=1}^N \left( \frac{\partial Q_i}{\partial Q_k} \frac{\partial Q_j}{\partial P_k} – \frac{\partial Q_i}{\partial P_k} \frac{\partial Q_j}{\partial Q_k} \right) = \sum_{k=1}^N (\delta_{ik} \cdot 0 – 0 \cdot \delta_{jk}) = 0
$$となる。ただし、1つ目の等号は定理3.3の(Ⅱ)の仮定を、3つ目の等号は新しい座標系の中において、\(Q\)と\(P\)がそれぞれ独立した変数であるため、自分自身で微分すれば\(1\)、違う変数で微分すれば\(0\)になることを用いている。同様にして、\(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_ij\)が成り立つので、示される。

なかなか定理が多くなってしまったので最後にまとめておきましょう。本稿であげた、正準変換と同値な定義には、

  • \(i=1,2,…,N\)に対して、\(\sum_{i=1}^N p_i dq_i – Hdt = \sum_{i=1}^N P_i dQ_i – Kdt + dF\)を満たす関数\(F,K\)が存在する
  • 古い変数から新しい変数への変換におけるヤコビ行列\(M\)および、\(N \times N\)の単位行列\(I\)と零行列\(O\)に対する\(2N \times 2N\)の反対称行列(シンプレティック行列)\(J\)を、
    $$
    M =\begin{pmatrix} \frac{\partial \boldsymbol{Q}_i}{\partial \boldsymbol{q}_j} & \frac{\partial \boldsymbol{Q}_i}{\partial \boldsymbol{p}_j} \\ \frac{\partial \boldsymbol{P}_i}{\partial \boldsymbol{q}_j} & \frac{\partial \boldsymbol{P}_i}{\partial \boldsymbol{p}_j} \end{pmatrix} \qquad J = \begin{pmatrix} 0 & I \\ -I & 0 \end{pmatrix}
    $$のように定義したとき、\(M J {}^t \! M^T = J\)が成り立つ
  • \(i,j=1,2,…,N\)に対して、\(\{Q_i,Q_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{P_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})}=0\), \(\{Q_i,P_j\}_{(\boldsymbol{q},\boldsymbol{p})} =\delta_{ij}\)が成り立つ
  • 任意の関数\(A,B\)について、\(\{A,B\}_{(\boldsymbol{Q},\boldsymbol{P})}=\{A,B\}_{(\boldsymbol{q},\boldsymbol{p})}\)が成り立つ

のようなものがありましたね。正準変換は物理学を学ぶうえでどこまでも大切な概念なので、ぜひしっかり理解してみてください。


以上、正準変換を整理してみました。お疲れさまでした。

コメント

タイトルとURLをコピーしました