機械学習基礎理論独習

誤りがあればご指摘いただけると幸いです。数式が整うまで少し時間かかります。リンクフリーです。

勉強ログです。リンクフリーです
目次へ戻る

オイラー・ラグランジュ方程式

大局的な見方と座標に依らない物理

大局的な見方の例として、距離を最小にするとか、掛かる時間が最小にする例を見ました。
これを幾何学(図形的)的な見方とも言いました。

図形的な見方をすると、座標に依らない物理が出てきます。

物理現象、例えば、斜方投射は座標を張らなくても、起こります。
座標を張ることで、それが放物線であることを数学的に説明することができますが、それは現象とは関係ありません。
座標は物理現象を確認するときに導入するオマケみたいなものです。

自然現象って本来座標に依らないはずです。
もし、座標に依らない物理があるのなら、それが本来自然現象の持つ本質みたいな抜き出すことにことにつながるんじゃないだろうか?
こういう解析力学の考え方が18世紀頃に生まれました。

ニュートン力学はこの性質が少し見えにくいです。
一番わかりやすい例はeomです。
質量mの物体があって、力\bf Fを加えると、加速度\bf aが発生します。

\begin{eqnarray}
{\bf a}=\frac{\bf F}{m}\ \left(\frac{{\rm d}{\bf P}}{{\rm d}t}={\bf F}\right)\tag{1}
\end{eqnarray}

図1
f:id:olj611:20211010162212p:plain:w150

この段階では、座標は入っていません。
図1を見ると、ベクトルでは書いているが、座標軸は張っていません。
これは座標に関係ない表し方になっています。
本来のeomは座標に依らない物理に依らない形になっています。

ではこれに、2次元のデカルト座標で導入してみましょう。

図2
f:id:olj611:20211010172112p:plain:h250

eomは以下で表されます。

\begin{eqnarray}
\left\{
    \begin{array}{l}
    m\ddot{x}=F^x\\
    m\ddot{y}=F^y
    \end{array}
  \right.\tag{2}
\end{eqnarray}

位置ベクトルは{\bf r}=\displaystyle\begin{pmatrix}x\\y\end{pmatrix}です。
復習のために、力と位置ベクトルを基底ベクトル{\bf e}_x=\displaystyle\begin{pmatrix}1\\0\end{pmatrix},{\bf e}_y=\displaystyle\begin{pmatrix}0\\1\end{pmatrix}で表すと、以下です。

\begin{eqnarray}
&&{\bf r}=x{\bf e}_x+y{\bf e}_y=\begin{pmatrix}x\\y\end{pmatrix},\tag{3}\\
&&{\bf F}=F^x{\bf e}_x+F^y{\bf e}_y=\begin{pmatrix}F^x\\F^y\end{pmatrix}\tag{4}
\end{eqnarray}

これと同じeomを2次元極座標で表してみます。

図3
f:id:olj611:20211011091903p:plain:h250

まず、(x,y),(r,\theta)の関係式は、以下で表せます。

\begin{eqnarray}
\left\{
    \begin{array}{l}
    x=r\cos\theta\\
    y=r\sin\theta
    \end{array}
  \right.\tag{5}
\end{eqnarray}

ちょっとここで、考えてみます。
(2)より、以下のようにしてもよいのでしょうか?

\begin{eqnarray}
\left\{
    \begin{array}{l}
    m\ddot{r}=F^r\\
    m\ddot{\theta}=F^\theta
    \end{array}
  \right.\tag{6}
\end{eqnarray}

m\ddot{\theta}=F^\thetaは単位が加速度になっていません。
\ddot{\theta}は無次元量を時間で2階微分している、時間で微分というのは時間による割り算なので、単位を書くなら1/s^2となっています。
なので、m\ddot{\theta}=F^\thetaは少なくともおかしいことが分かります。

m\ddot{r}=F^rは次元的にはOKですが、この形でよいかはまだ分かりません。

では、正しい極座標のeomを求めてみましょう。
\dot{x}r,\thetaで表してみます。

\begin{eqnarray}
\dot{x}&=&(r\cos\theta)\dot{}\\
&=&\dot{r}\cos\theta+r(\cos\theta)\dot{}\\
&=&\dot{r}\cos\theta+r(-\sin\theta)\dot{\theta}\\
&=&\dot{r}\cos\theta-r\dot{\theta}\sin\theta\tag{7}
\end{eqnarray}

\dot{y}r,\thetaで表してみます。

\begin{eqnarray}
\dot{y}&=&(r\sin\theta)\dot{}\\
&=&\dot{r}\sin\theta+r(\sin\theta)\dot{}\\
&=&\dot{r}\sin\theta+r\dot{\theta}\cos\theta\tag{8}
\end{eqnarray}

\ddot{x}r,\thetaで表してみます。

\begin{eqnarray}
\ddot{x}&=&(\dot{r}\cos\theta-r\dot{\theta}\sin\theta)\dot{}\\
&=&\ddot{r}\cos\theta-\dot{r}\dot{\theta}\sin\theta-\dot{r}\dot{\theta}\sin\theta-r\ddot{\theta}\sin\theta-r\dot{\theta^2}\cos\theta\\
&=&(\ddot{r}-r\dot{\theta})\cos\theta-(2\dot{r}\dot{\theta}+r\ddot{\theta})\sin\theta\tag{9}
\end{eqnarray}

\ddot{y}r,\thetaで表してみます。

\begin{eqnarray}
\ddot{y}&=&(\dot{r}\sin\theta+r\dot{\theta}\cos\theta)\dot{}\\
&=&\ddot{r}\sin\theta+\dot{r}\cos\theta+\dot{r}\dot{\theta}\cos\theta+r\ddot{\theta}\cos\theta-r\dot{\theta^2}\sin\theta\\
&=&(\ddot{r}-r\dot{\theta})\sin\theta+(2\dot{r}\dot{\theta}+r\ddot{\theta})\cos\theta\tag{10}
\end{eqnarray}

(9),(10)をまとめて書いてみます。

\begin{eqnarray}
\begin{pmatrix}
\ddot{x}\\ \ddot{y}\end{pmatrix} &=& \begin{pmatrix}(\ddot{r}-r\dot{\theta})\cos\theta-(2\dot{r}\dot{\theta}+r\ddot{\theta})\sin\theta\\ (\ddot{r}-r\dot{\theta})\sin\theta+(2\dot{r}\dot{\theta}+r\ddot{\theta})\cos\theta
\end{pmatrix} \\
&=&\begin{pmatrix}
\cos\theta & -sin\theta\\
\sin\theta & \cos\theta
\end{pmatrix}
\begin{pmatrix}
\ddot{r}-r\dot{\theta}\\ 2\dot{r}\dot{\theta}+r\ddot{\theta}
\end{pmatrix}\tag{11}
\end{eqnarray}

(11)に回転行列が出てきました。
これ、どういう意味かっていうと、下の図4を見てください。

図4
f:id:olj611:20211011093406p:plain:h250

x軸とr軸を重ね合わせ、y軸と\theta軸を重ねわせたものになっています。
よって、\displaystyle\begin{pmatrix}F^r\\ F^\theta\end{pmatrix}\theta回転させたものが、\displaystyle\begin{pmatrix}F^x\\ F^y\end{pmatrix}です。
質量mは固定なので、\displaystyle\begin{pmatrix}a^r\\ a^\theta\end{pmatrix}=\displaystyle\begin{pmatrix}\ddot{r}\\ \ddot{\theta}\end{pmatrix}\theta回転させたものが、\displaystyle\begin{pmatrix}a^x\\ a^y\end{pmatrix}=\begin{pmatrix}\ddot{x}\\ \ddot{y}\end{pmatrix}であり、
(11)はまさにそれになっているので、

\begin{eqnarray}
\begin{pmatrix}\ddot{r}\\ \ddot{\theta}\end{pmatrix}&=&\begin{pmatrix}\ddot{r}-r\dot{\theta}\\ 2\dot{r}\dot{\theta}+r\ddot{\theta}\end{pmatrix}\tag{12}
\end{eqnarray}

が導けます。

以上より、極座標におけるeomは、次の式で表せます。

\begin{eqnarray}
\left\{
\begin{array}{l}
    m(\ddot{r}-r\dot{\theta})=F^r\\
    m(2\dot{r}\dot{\theta}+r\ddot{\theta})=F^\theta
\end{array}
\right.\tag{13}
\end{eqnarray}

デカルト座標のeomの形とは全然違いますね。
座標系によって、eomを使い分けるって、ちょっと嫌ですよね。

本来であれば、自然現象は人間が張っている座標系に依らないはずなので、
それを実現するのがオイラーラグランジュ方程式です。

オイラーラグランジュ方程式

以降、オイラーラグランジュ方程式(Euler-Lagrange equation)をE-L eq.と書きます。
デカルト座標のeomと極座標のeomを並べて書いてみます。

\begin{eqnarray}
\left\{
    \begin{array}{l}
    m\ddot{x}=F^x\\
    m\ddot{y}=F^y
    \end{array}
  \right.,\ \ \ 
\left\{
    \begin{array}{l}
    m(\ddot{r}-r\dot{\theta})=F^r\\
    m(2\dot{r}\dot{\theta}+r\ddot{\theta})=F^\theta
    \end{array}
  \right.\tag{14}
\end{eqnarray}

なんで、式(14)の方程式たちは形が異なるのでしょうか?
元々は、この方程式たちは形が違くないはずですよね?
なぜなら、元々は、以下のベクトル方程式で書けるからです。

\begin{eqnarray}
m\frac{{\rm d}^2{\bf r}}{{\rm d}t^2}={\bf F}\tag{15}
\end{eqnarray}

そして、式(15)のベクトル方程式は座標に依りません。
ていうか、座標の概念が入っていません。(図1参照)
この方程式に座標を導入してしまうと、途端に方程式の形が座標に依存した形になってしまいます。
なぜそういうことが起こるのかっていうと、ベクトルで書いているかです。
ベクトルで書くと、ベクトルの成分に分解したくなりますが、
その成分を求める時には、どうしても座標を張らなくてはいけません。
なので、ベクトルで書いている限りはずっと付きまとう問題です。

ところで、「座標に依らない物理」という言葉を使ってきましたが、
これは座標を使わないという意味ではなく、どんな座標を用いても成り立つという意味です。
その方程式こそが、E-L eq です。

ではそのE-L eqはどのように導出すればいよいかというと、ベクトルがネックになっているので、
座標に依存しないものは何か、それはスカラーです。
で、そのスカラーでもって、何らかの運動方程式に結び付けられないかと考えます。

1次元のeomを考えます。

\begin{eqnarray}
m\frac{{\rm d}^2x}{{\rm d}t^2}=F(=F^x)\tag{16}
\end{eqnarray}

まずは、eomの右辺Fについて考えます。

Fが保存力のとき、Fはポテンシャルエネルギーから求まります。
(以下の式は1次元ですが、後々のことを考えて、あえて偏微分で書きます。)

\begin{eqnarray}
&&F=-\frac{\partial U}{\partial x}\tag{17}\\
&&\Leftrightarrow U=-\int_{}^{x}{F}{\rm d}{x}\tag{18}
\end{eqnarray}

※ちなみに2次元以上なら、以下のように書けます。

\begin{eqnarray}
&&{\bf F}={\boldsymbol\nabla}U=\begin{pmatrix}-\dfrac{\partial U}{\partial x},-\dfrac{\partial U}{\partial y},\cdots\end{pmatrix}\tag{19}\\
&&\Leftrightarrow U({\bf r})=-\int_{}^{\bf r}{\bf F}{\rm d}{\bf r}\tag{20}
\end{eqnarray}

大事なことは、eomの右辺FはポテンシャルエネルギーUというスカラー量に関係しているということです。

次に、eomの左辺m\dfrac{{\rm d}^2x}{{\rm d}t^2}について考えます。
結論から言うと、m\dfrac{{\rm d}^2x}{{\rm d}t^2}は運動エネルギーTというスカラー量に関係しています。
以下でそれを示します。

m\dfrac{{\rm d}^2x}{{\rm d}t^2}\dfrac{{\rm d}x}{{\rm d}t}を掛けると、以下のようになります。

\begin{eqnarray}
m\frac{{\rm d}^2x}{{\rm d}t^2}\dfrac{{\rm d}x}{{\rm d}t}&=&m\frac{{\rm d}v}{{\rm d}t}v\\
&=&\frac{{\rm d}}{{\rm d}t}\left(\frac{1}{2}mv^2\right)\\
&=&\frac{{\rm d}T}{{\rm d}t}\tag{21}
\end{eqnarray}

(21)で運動エネルギー\dfrac{1}{2}mv^2Tとおきました。

この時、\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial T}{\partial v}\right)は、以下のようになります。

\begin{eqnarray}
\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial T}{\partial v}\right)&=&\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial}{\partial v}\left(\frac{1}{2}mv^2\right)\right)\\
&=&\dfrac{{\rm d}}{{\rm d}t}(mv)\\
&=&m\dfrac{{\rm d}v}{{\rm d}t}\\
&=&m\dfrac{{\rm d}^2x}{{\rm d}t^2}\tag{22}
\end{eqnarray}

(17),(22)より、eomは次のように書けます。

\begin{eqnarray}
\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial T}{\partial v}\right)=-\frac{\partial U}{\partial x}\tag{23}
\end{eqnarray}

ここで、以下のラグランジアンLを定義します。

\begin{eqnarray}
L = T(v)-U(x)\tag{24}
\end{eqnarray}

(23),(24)より、以下が成り立ちます。

\begin{eqnarray}
&&\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial L}{\partial v}\right)=\frac{\partial L}{\partial x}\\
&&\Leftrightarrow \dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial L}{\partial \dot{x}}\right)=\frac{\partial L}{\partial x}\tag{25}
\end{eqnarray}

(25)がE-L eq. です。(1次元版です。)

E-L eq. の確認

E-L eq.からma=Fを逆に導いてみます。

まず、1次元物体のラグランジアンLは以下のようになります。

\begin{eqnarray}
L=\frac{1}{2}m\dot{x}^2-U(x)\tag{26}
\end{eqnarray}

(25)の左辺を計算します。

\begin{eqnarray}
\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial L}{\partial \dot{x}}\right)&=&\dfrac{{\rm d}}{{\rm d}t}\left(\dfrac{\partial }{\partial \dot{x}}\left(\frac{1}{2}m\dot{x}^2-U(x)\right)\right)\\
&=&\dfrac{{\rm d}}{{\rm d}t}(m\dot{x})\\
&=&m\ddot{x}\tag{27}
\end{eqnarray}

(25)の左辺を計算します。

\begin{eqnarray}
\frac{\partial L}{\partial x}&=&\frac{\partial}{\partial x}\left(\frac{1}{2}m\dot{x}^2-U(x)\right)\\
&=&-\frac{\partial U}{\partial x}\\
&=&F\tag{28}
\end{eqnarray}

(27),(28)より、m\ddot{x}=Fが導けました。

偉人の名言

f:id:olj611:20211011124852p:plain:h300
おかげで気が散らなくなった。前より数学の研究に打ち込める。
オイラー(失明した後の自身の言葉)

目次へ戻る