機械学習基礎理論独習

誤りがあればご指摘いただけると幸いです。数式が整うまで少し時間かかります。リンクフリーです。

勉強ログです。リンクフリーです
目次へ戻る

解析力学とは?

なぜ学ぶのか

力学という名前がついている通り、元々は力学から出発しています。
それで、解析力学は何かというと、
力学の再定式化といって、ニュートン力学運動方程式ma=Fをもう1回数学的にメタな観点から、
構成したものです。
これは力学にとどまりません。物理学のあらゆる分野に通底する考え方や使える道具を与えます。
ですので、解析力学は物理学の全分野に出てくると思って差し支えないです。
あらゆる分野というのは、力学、電磁気学、熱力学、統計力学量子力学相対性理論(相対性理論は特に特殊相対性理論)で、
大学で学ぶ物理学の基礎科目の全てに顔を出します。

特に何に顔を出すかというと、

などがキーワードとなります。

作用、ラグランジアンハミルトニアンは用語なので、(後で)定義して、説明します。

対称性と保存則はおそらく解析力学におけるクライマックスです。
保存則って、高校で運動量保存則を教わりますし、大学に入ると、角運動量保存則を学びます。
とにかく世の中にはいろんな保存則があるわけです。
で、なんで保存則が大事かっていうと、問題を解くための道具であるからです。
例えば、力学の目標ってx(t),v(t)を知ることです。
一番オーソドックスな方法はv(t)積分したものがx(t)であり、a(t)積分したものがv(t)なので、
a(t)が分かればよいということになります。
それで、a(t)を知るための方法として、ニュートン力学では、運動方程式ma=FF,mがわかればa(t)が分かります。
他にも運動量保存則によって、初期状態の運動量が分かっていれば、x(t),v(t)が分かります。

で、なんで保存則が成り立つんだろうってことはあまり触れられません。
エネルギー保存則が成り立つことは、当たり前だと思えます。エネルギーが無限に湧き出てくることなんてないんだから、保存則が成り立つべきだよなって思います。
ですが、運動量はなんで保存するんだろうって思いませんか?大学では計算によってそれを示せますが、結構頑張って計算しないと運動量の保存則は出てきません。

保存則ってとても便利なものですが、どんな時に保存して、どんな時に保存しないのか、保存則っていくつあるのかとかそういうことってどうやったら分かるんだろうっていうと、
対称性がヒントになります。
実は、保存則が成り立つには理由があります。
かっこいい言い方をすると、保存則がなりたつのは、「自然界が美しい時」です。
自然界がある種の美しさを持っている時に保存則は成立します。
物理で言う美しさとは、対称性で、左右対称性、回転対象性、並進対象性です。
並進対象性があるときに、運動量は保存します。
力学的エネルギー保存則は何の対称性の現れかというと、これは時間並進対象性の現れです。
時間並進対象性とは、時間の原点をどこに定めても構わないということです。
なので、もし時間の原点があるとしたら、時間並進対象性が破れて、力学的エネルギー保存則は成り立たなくなります。

その汎用性

最小作用の原理の例 - 力学

\begin{eqnarray}
&&S=\int_{t1}^{t2}{{\rm d}t}L\tag{1}\\
&&L=T-U\tag{2}
\end{eqnarray}

Sが作用で、Lラグランジアンで、Tが運動エネルギーで、U位置エネルギー(ポテンシャルエネルギー)です。
ここで、Sを最小にするという条件を課します。
そうすると、以下の数式が出てきます。(今回の記事では導出はしません)

\begin{eqnarray}
\frac{{\rm d}}{{\rm d}t}\left(\frac{\partial L}{\partial\dot{q^i}}\right)=\frac{\partial L}{\partial q^i}\tag{3}
\end{eqnarray}

\dot{}(ドット)は\dfrac{{\rm d}}{{\rm d}t}であり、時間微分を表し(表すことが多い)、例えば、\dot{x}=\dfrac{\rm d}{{\rm d}t}です。
'(プライム)は空間微分を表し(表すことが多い)、例えば、(xによる微分は)f'=\dfrac{{\rm d}f}{\rm d}xです。
q^iqi乗ではなく、iqの通し番号(添え字)で、例えば、3次元のデカルト座標なら、q^1=x,q^2=y,q^3=zです。
q^iはの記事で書きますが、一般化座標といいます。
例えば、物体が2つあるときに、q^1,q^2,q^3を物体1のx,y,zとし、q^4,q^5,q^6を物体2のx,y,zというような書き方をします。
※右肩に添え字を書くことが解析力学の場合多いようです。

(3)には名前がついていて、オイラーラグランジュ方程式といいます。
オイラーラグランジュ方程式運動方程式で、m{\bf a}={\bf F}\ \left(m\dfrac{{\rm d}^2{\bf r}}{{\rm d}t^2}={\bf F}\right)と等価です。全然そうとは見えないと思いまが、オイラーラグランジュ方程式運動方程式の一般的なバージョンです。
様々な力学の運動方程式オイラーラグランジュ方程式で書くことができるので、ある意味無敵の方程式です。

他の最小作用の原理の例として、(数式は省略します)
電磁気学の場合は、(電磁気学の)S定めて、Sを最小にするという条件を課すと、マクスウェル方程式が出てきます。
相対性理論の場合は、(相対性理論の)S定めて、Sを最小にするという条件を課すと、アインシュタイン方程式が出てきます。

以上より、「Sを最小する」という考え方が物理学の様々な分野の根底にありそうです。

物理学を図形的に捉える

解析力学は何がしたかったのかというと、「物理学の幾何学化」です。
幾何学化とは、図形的に捕らえるってことだと思ってもらってよいです。

例:斜方投射の解の軌跡

図1
f:id:olj611:20211010090334p:plain:h200

以降、運動方程式をeom(equation of motion)と書きます。
ニュートンのeomは

\begin{eqnarray}
m{\bf a}={\bf F}\Leftrightarrow m\frac{{\rm d}^2{\bf r}}{{\rm d}t^2}={\bf F}\tag{4}
\end{eqnarray}

tの2階微分方程式であり、位置を求める場合、tで2回積分する必要があり、積分定数が2つ出てきます。
この積分定数を決めるのに、普通、初期位置と初速度を使いますが、2個あればなんでもよいので、
始点の位置(初期位置)と終点の位置を使っても構いません。
初期位置と初速度を決めれば、軌跡が決まります。始点の位置と終点の位置を決めても、軌跡が決まります。
なので、運動方程式の解き方は2種類あります。それを解いた結果が図1の軌跡(放物線)です。

図2
f:id:olj611:20211010092417p:plain:h200
図2の黄色の線は、eomの解として正しく、黒色の線は、eomの解として正しくありません。

黄色の線が選ばれる理由は、普通(従来の力学では)、飛んでいる物体に働いている力を考えます。
垂直方向に重力が働き、水平方向に力が働かないとし(図3参照)、その下で運動すると斜方投射になると考えます。

図3
f:id:olj611:20211010093817p:plain:h100

解析力学では、様々な経路(軌跡)がある中で黄色の軌跡が選ばれるのは特殊な理由があるはずだ、
結論を言うと、作用が最小になるような経路が黄色の線であると考えます。

黄色の線が「正しい」理由のとして、
物体に働く力学で考えるというのが、局所的な見方で従来の力学の考え方です。
黄色の線の図形的な特徴から考えるというのが、大局的な見方で解析力学の考え方です。

反射の法則と最短距離

図4
f:id:olj611:20211010100223p:plain:h200

Aにある光が鏡で反射して、Bに到達することを考えます。
反射の法則は、「入射角と反射角が等しい」こと、すなわち図4においてi=jです。

図5
f:id:olj611:20211010100527p:plain:h200

AとBの様々な経路(図5の黄色と黒色の経路)を考えます。
様々な経路がある中で、黄色の経路が最短経路になっています。

最短経路の黄色の線を求めてみます。

図6
f:id:olj611:20211010105214p:plain:h250

Bの鏡に対して対象な点をB'とします。
線分ABと鏡の交点をCとします。
鏡の上の任意の点をDとします。
線分BB'と鏡の交点をEとします。

\triangle DB'E\triangle DBEは合同なので、DB=DB'であり、ADBの経路はAD+DB=AD+DB'です。
よって、ADBの経路はADB'の経路と等しいことが分かります。
ADB'の最短経路はD=Cのときなので、ACB'となります。\cdots(5)
\triangle CB'E\triangle CBEは合同なので、B'C=BCとなります。\cdots(6)

(5),(6)より、Aが鏡で反射して、Bに到達するときの最短経路は、ACBです。

この最短経路が、反射の法則と同じことを言っていることを示します。

図7
f:id:olj611:20211010125416p:plain:h250

Cを通る鏡の垂線上の点をGとおきます。
鏡上のCより左側にある点をFとおきます。
\angle BCE\alphaとおきます。
\triangle CBE\triangle CB'Eは合同なので、\angle BCE = \angle B'CE=\alphaです。
対頂角なので、\angle ACF = \angle BCE = \alphaです。

\angle ACG\betaとおきます。
このとき、\angle ACG=\beta={90}^{\circ}-\alpha,\ \angle ACG={90}^{\circ}-\alpha=\betaです。
よって、\angle ACG=\angle BCGが成り立ちます。\cdots(7)

(7)より、入射角と反射角が等しいので、反射の法則が示せました。

今示したのは、最短経路⇒反射の法則です。省略しますが、反射の法則⇒最短経路も示せます。

反射する点で考えるのが、反射の法則であり、局所的な考え方です。
様々な経路を考えて、その中で最短となる経路を見つけるというのは、大局的な考え方、解析力学の考え方です。

屈折の法則と最短時間

媒質1から媒質2へ光が進むことを考えます。
媒質1、媒質2の絶対屈折率をn_1,n_2とし、その媒質で進む光の速さをv_1,v_2とします。
この時n_1=c/v_1が成り立ちます。cは光の速さです。
媒質1を空気、媒質2を水とイメージすると分かりやすいです。
この時、光は以下の図8のように屈折します。

図8
f:id:olj611:20211010130254p:plain:h250

この屈折に関して、以下のスネルの法則(屈折の法則)が成り立ちます。

\begin{eqnarray}
&&n_1\sin\theta_1=n_2\sin\theta_2\\
&&\Leftrightarrow \frac{\sin\theta_1}{\sin\theta_2}=\frac{n_2}{n_1}=\frac{v_1}{v_2}\tag{8}
\end{eqnarray}

この時、媒質1のある点Aから、媒質2のある点Bまでの到達する時間を最短にすることを考えてみます。
そうすると、先ほどの屈折の例と同様、最短時間からスネルの法則が導けます。

以下の図のように、点A,B,Cを導入します。

図9
f:id:olj611:20211010151017p:plain:h300

まず、AからBまでの距離を求めてみます。
確認ですが、v_1=\dfrac{c}{n_1},v_2=\dfrac{c}{n_2}です。
AC=\sqrt{x^2+\alpha^2},CB=\sqrt{(\beta-x)^2+\gamma^2}なので、ACBにかかる時間T(x)は、以下のように表せます。

\begin{eqnarray}
T(x)&=&\frac{AC}{v_1}+\frac{CB}{v_2}\\
&=&\frac{\sqrt{x^2+\alpha^2}}{\dfrac{c}{n_1}}+\frac{\sqrt{(\beta-x)^2+\gamma^2}}{\dfrac{c}{n_2}}\\
&=&\frac{1}{c}\left(n_1\sqrt{x^2+\alpha^2}+n_2(\sqrt{(\beta-x)^2+\gamma^2})\right)\tag{9}
\end{eqnarray}

\dfrac{{\rm d}T}{{\rm d}x}=0となるとき、T(x)が最小になります。
(これは最小値持つための必要条件なので、本来は極値が最小値であることを示さなければなりませんが、今回は割愛します。)

\begin{eqnarray}
&&\frac{{\rm d}T}{{\rm d}x}=0\\
&&\Leftrightarrow\frac{1}{c}\frac{{\rm d}}{{\rm d}x}\left(n_1\sqrt{x^2+\alpha^2}+n_2(\sqrt{(\beta-x)^2+\gamma^2})\right)=0\\
&&\Leftrightarrow n_1\frac{x}{\sqrt{x^2+\alpha^2}}+n_2\frac{-(\beta-\gamma)}{\sqrt{(\beta-x)^2+\gamma^2}}=0\\
&&\Leftrightarrow n_1\frac{x}{\sqrt{x^2+\alpha^2}}=n_2\frac{\beta-\gamma}{\sqrt{(\beta-x)^2+\gamma^2}}\tag{10}
\end{eqnarray}

以下の図10(図9に\theta_1,\theta_2書き足しただけの図)を見ると、

\begin{eqnarray}
&&\sin\theta_1=\frac{x}{\sqrt{x^2+\alpha^2}}\tag{11}\\
&&\sin\theta_2=\frac{\beta-\gamma}{\sqrt{(\beta-x)^2+\gamma^2}}\tag{12}\\
\end{eqnarray}

であることが分かります。

図10
f:id:olj611:20211010151150p:plain:h300

(11)と式(12)を式(10)に代入します。

\begin{eqnarray}
n_1\sin\theta_1=n_2\sin\theta_2\tag{13}
\end{eqnarray}

(13)より、スネルの法則が成り立つことが分かりました。

今示したのは、最短時間⇒スネルの法則です。省略しますが、スネルの法則⇒最短時間も示せます。

異なる媒質に入射する点で考えるのが、スネルの法則であり、局所的な考え方です。
様々な経路を考えて、その中で最短時間となる経路を見つけるというのは、大局的な考え方、解析力学の考え方です。

偉人の名言

f:id:olj611:20211010152439p:plain:w300
創造力は知識よりも重要だ。知識には限界があるが、創造力は世界を覆う。
アインシュタイン

目次へ戻る