• 勒让德变换和正则方程 设有f(x,y)f(x,y)f(x,y)，则全微分df(x,y)=udx+vdydf(x,y)=udx+vdydf(x,y)=udx+vdy，其中u=∂f(x,y)/∂x,v=∂f(x,y)/∂yu=∂f(x,y)/∂x,v=∂f(x,y)/∂yu=\partial f(x,y)/\partial x,v=\...
勒让德变换和正则方程

设有f(x,y)$f\left(x,y\right)$$f(x,y)$，则全微分df(x,y)=udx+vdy$df\left(x,y\right)=udx+vdy$$df(x,y)=udx+vdy$，其中u=∂f(x,y)/∂x,v=∂f(x,y)/∂y$u=\mathrm{\partial }f\left(x,y\right)/\mathrm{\partial }x,v=\mathrm{\partial }f\left(x,y\right)/\mathrm{\partial }y$$u=\partial f(x,y)/\partial x,v=\partial f(x,y)/\partial y$。这里的变量是x,y$x,y$$x,y$。注意u$u$$u$是x,y$x,y$$x,y$的函数，即u=u(x,y)$u=u\left(x,y\right)$$u=u(x,y)$，从这个式子出发，也可以把函数关系表示为x=x(u,y)$x=x\left(u,y\right)$$x=x(u,y)$。现在希望把变量换成u$u$$u$和y$y$$y$，也就是说把函数f(x,y)$f\left(x,y\right)$$f(x,y)$看做复合函数f(u,y)=f[x(u,y),y]$f\left(u,y\right)=f\left[x\left(u,y\right),y\right]$$f(u,y)=f[x(u,y),y]$，构造函数g(u,y)=f(u,y)−ux(u,y)$g\left(u,y\right)=f\left(u,y\right)-ux\left(u,y\right)$$g(u,y)=f(u,y)-ux(u,y)$，则dg(u,y)=df−xdu−udx=vdy−xdu$dg\left(u,y\right)=df-xdu-udx=vdy-xdu$$dg(u,y)=df-xdu-udx=vdy-xdu$，上式就成功地把变量换成了u$u$$u$和y$y$$y$，有∂g(u,y)/∂y=v,∂g(u,y)/∂u=−x$\mathrm{\partial }g\left(u,y\right)/\mathrm{\partial }y=v,\mathrm{\partial }g\left(u,y\right)/\mathrm{\partial }u=-x$$\partial g(u,y)/\partial y=v,\partial g(u,y)/\partial u=-x$。这就是勒让德变换，通过修改被全微分的函数，来把全微分式中udx$udx$$udx$换成xdu$xdu$$xdu$。

位形空间中的拉格朗日函数L(q,q˙,t)$L\left(q,\stackrel{˙}{q},t\right)$$L(q,\dot{q},t)$以q$q$$q$和q˙$\stackrel{˙}{q}$$\dot{q}$为自由变量，现在想把q˙$\stackrel{˙}{q}$$\dot{q}$换成对应的动量p=∂L/∂q˙$p=\mathrm{\partial }L/\mathrm{\partial }\stackrel{˙}{q}$$p=\partial L/\partial \dot{q}$，让自由变量变成q$q$$q$和p$p$$p$。先求其全微分dL(q,q˙,t)=∑k(∂L∂qkdqk+∂L∂q˙kdq˙k)+∂L∂tdt$dL\left(q,\stackrel{˙}{q},t\right)=\sum _{k}\left(\frac{\mathrm{\partial }L}{\mathrm{\partial }{q}_{k}}d{q}_{k}+\frac{\mathrm{\partial }L}{\mathrm{\partial }{\stackrel{˙}{q}}_{k}}d{\stackrel{˙}{q}}_{k}\right)+\frac{\mathrm{\partial }L}{\mathrm{\partial }t}dt$dL(q,\dot{q},t)=\sum_k\left(\frac{\partial L}{\partial q_k}dq_k+\frac{\partial L}{\partial\dot{q}_k}d\dot{q}_k\right)+\frac{\partial L}{\partial t}dt按照广义动量的定义pk=∂L∂qk˙${p}_{k}=\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{{q}_{k}}}$p_k=\frac{\partial L}{\partial \dot{q_k}}和拉格朗日方程pk˙=ddt∂L∂qk˙=∂L∂qk$\stackrel{˙}{{p}_{k}}=\frac{d}{dt}\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{{q}_{k}}}=\frac{\mathrm{\partial }L}{\mathrm{\partial }{q}_{k}}$\dot{p_k}=\frac{d}{dt}\frac{\partial L}{\partial \dot{q_k}}=\frac{\partial L}{\partial q_k}代入拉格朗日函数的全微分式中，得到dL(q,q˙,t)=∑k(p˙kdqk+pkdq˙k)+∂L∂tdt$dL\left(q,\stackrel{˙}{q},t\right)=\sum _{k}\left({\stackrel{˙}{p}}_{k}d{q}_{k}+{p}_{k}d{\stackrel{˙}{q}}_{k}\right)+\frac{\mathrm{\partial }L}{\mathrm{\partial }t}dt$dL(q,\dot{q},t)=\sum_k\left(\dot{p}_kdq_k+p_kd\dot{q}_k\right)+\frac{\partial L}{\partial t}dt上式中扮演自变量身份的还是qk,q˙k,t${q}_{k},{\stackrel{˙}{q}}_{k},t$$q_k,\dot{q}_k,t$三者，现在希望把上式中的pkdq˙k${p}_{k}d{\stackrel{˙}{q}}_{k}$$p_kd\dot{q}_k$换成q˙kdpk${\stackrel{˙}{q}}_{k}d{p}_{k}$$\dot{q}_kdp_k$，从而把自变量换成qk,pk,t${q}_{k},{p}_{k},t$$q_k,p_k,t$三者。为此使用勒让德变换，构造新函数H(p,q,t)=∑kpkq˙k−L(q,q˙,t)$H\left(p,q,t\right)=\sum _{k}{p}_{k}{\stackrel{˙}{q}}_{k}-L\left(q,\stackrel{˙}{q},t\right)$H(p,q,t)=\sum_kp_k\dot{q}_k-L(q,\dot{q},t)求上式全微分得到dH(p,q,t)=∑k(q˙kdpk−p˙kdqk)−∂L∂tdt$dH\left(p,q,t\right)=\sum _{k}\left({\stackrel{˙}{q}}_{k}d{p}_{k}-{\stackrel{˙}{p}}_{k}d{q}_{k}\right)-\frac{\mathrm{\partial }L}{\mathrm{\partial }t}dt$dH(p,q,t)=\sum_k(\dot{q}_kdp_k-\dot{p}_kdq_k)-\frac{\partial L}{\partial t}dt这就是说∂H∂pk∂H∂qk(∂H∂t)p,q=q˙k=−p˙k=−(∂L∂t)q˙,q$\begin{array}{rl}\frac{\mathrm{\partial }H}{\mathrm{\partial }{p}_{k}}& ={\stackrel{˙}{q}}_{k}\\ \frac{\mathrm{\partial }H}{\mathrm{\partial }{q}_{k}}& =-{\stackrel{˙}{p}}_{k}\\ {\left(\frac{\mathrm{\partial }H}{\mathrm{\partial }t}\right)}_{p,q}& =-{\left(\frac{\mathrm{\partial }L}{\mathrm{\partial }t}\right)}_{\stackrel{˙}{q},q}\end{array}$\begin{aligned}\frac{\partial H}{\partial p_k}&=\dot{q}_k\\ \frac{\partial H}{\partial q_k}&=-\dot{p}_k\\ \left(\frac{\partial H}{\partial t}\right)_{p,q}&=-\left(\frac{\partial L}{\partial t}\right)_{\dot{q},q}\end{aligned}这个新函数H$H$$H$和拉格朗日力学中的广义能量函数一样，但是这里把它写作p,q,t$p,q,t$$p,q,t$的函数（相空间），而非q,q˙,t$q,\stackrel{˙}{q},t$$q,\dot{q},t$的函数（位形空间），所以这里H$H$$H$称为哈密顿函数。前两个式子就是哈密顿正则方程。

罗斯函数

上面利用勒让德变换把所有的广义速度q˙k${\stackrel{˙}{q}}_{k}$$\dot{q}_k$换成了广义动量pk${p}_{k}$$p_k$，但是有时候只希望一部分广义坐标对应的广义速度被替换，而另一部分仍保留广义速度。这时介于拉格朗日函数和哈密顿函数之间的，叫做罗斯函数。例如假设系统有两个广义坐标q,ξ$q,\xi$$q,\xi$，现在只想把拉格朗日函数中的q˙$\stackrel{˙}{q}$$\dot{q}$换成广义动量，而ξ˙$\stackrel{˙}{\xi }$$\dot{\xi}$保留。为此构造罗斯函数R(q,p,ξ,ξ˙)=pq˙−L$R\left(q,p,\xi ,\stackrel{˙}{\xi }\right)=p\stackrel{˙}{q}-L$R(q,p,\xi,\dot{\xi})=p\dot{q}-L求其全微分为dR(q,p,ξ,ξ˙)=−p˙dq−pdq˙−∂L∂ξdξ−∂L∂ξ˙dξ˙+q˙dp+pdq˙=q˙dp−p˙dq−∂L∂ξdξ−∂L∂ξ˙dξ˙$dR\left(q,p,\xi ,\stackrel{˙}{\xi }\right)=-\stackrel{˙}{p}dq-pd\stackrel{˙}{q}-\frac{\mathrm{\partial }L}{\mathrm{\partial }\xi }d\xi -\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{\xi }}d\stackrel{˙}{\xi }+\stackrel{˙}{q}dp+pd\stackrel{˙}{q}\phantom{\rule{0ex}{0ex}}=\stackrel{˙}{q}dp-\stackrel{˙}{p}dq-\frac{\mathrm{\partial }L}{\mathrm{\partial }\xi }d\xi -\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{\xi }}d\stackrel{˙}{\xi }$dR(q,p,\xi,\dot{\xi})=-\dot{p}dq-pd\dot{q}-\frac{\partial L}{\partial \xi}d\xi-\frac{\partial L}{\partial \dot{\xi}}d\dot{\xi}+\dot{q}dp+pd\dot{q}\\=\dot{q}dp-\dot{p}dq-\frac{\partial L}{\partial \xi}d\xi-\frac{\partial L}{\partial \dot{\xi}}d\dot{\xi}这表明∂R∂q=−p˙,∂R∂p=q˙∂R∂ξ=−∂L∂ξ,∂R∂ξ˙=−∂L∂ξ˙$\begin{array}{r}\frac{\mathrm{\partial }R}{\mathrm{\partial }q}=-\stackrel{˙}{p},\frac{\mathrm{\partial }R}{\mathrm{\partial }p}=\stackrel{˙}{q}\end{array}\phantom{\rule{0ex}{0ex}}\frac{\mathrm{\partial }R}{\mathrm{\partial }\xi }=-\frac{\mathrm{\partial }L}{\mathrm{\partial }\xi },\frac{\mathrm{\partial }R}{\mathrm{\partial }\stackrel{˙}{\xi }}=-\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{\xi }}$\begin{aligned}\frac{\partial R}{\partial q}=-\dot{p},\frac{\partial R}{\partial p}=\dot{q}\end{aligned}\\ \frac{\partial R}{\partial \xi}=-\frac{\partial L}{\partial \xi},\frac{\partial R}{\partial \dot{\xi}}=-\frac{\partial L}{\partial \dot{\xi}}前两式正是q$q$$q$这个广义坐标对应的哈密顿正则方程。把后两式代入ξ$\xi$$\xi$的拉格朗日方程中，有ddt∂R∂ξ˙−∂R∂ξ=0$\frac{d}{dt}\frac{\mathrm{\partial }R}{\mathrm{\partial }\stackrel{˙}{\xi }}-\frac{\mathrm{\partial }R}{\mathrm{\partial }\xi }=0$\frac{d}{dt}\frac{\partial R}{\partial \dot{\xi}}-\frac{\partial R}{\partial \xi}=0所以如果只对希望变换的广义速度进行勒让德变换，则得到的结果就是罗斯函数，罗斯函数对于已经变换的广义坐标，得到的运动方程是哈密顿正则方程形式，对于还未变换的广义坐标，得到的还是拉格朗日方程形式。如果坐标q$q$$q$是循环坐标，则原拉格朗日函数不显含q$q$$q$，则上面罗斯函数不显含q$q$$q$，又因为循环坐标，从而p$p$$p$为常数，由此上面的方程只是关于ξ$\xi$$\xi$的微分方程，循环坐标完全被消去，比ξ$\xi$$\xi$的拉格朗日方程要简单。

泊松括号和力学量随时间的变化

设力学量f(p,q,t)$f\left(p,q,t\right)$$f(p,q,t)$，则关于时间全导数为dfdt=∂f∂t+∑k(∂f∂pkp˙k+∂f∂qkq˙k)$\frac{df}{dt}=\frac{\mathrm{\partial }f}{\mathrm{\partial }t}+\sum _{k}\left(\frac{\mathrm{\partial }f}{\mathrm{\partial }{p}_{k}}{\stackrel{˙}{p}}_{k}+\frac{\mathrm{\partial }f}{\mathrm{\partial }{q}_{k}}{\stackrel{˙}{q}}_{k}\right)$\frac{df}{dt}=\frac{\partial f}{\partial t}+\sum_k\left(\frac{\partial f}{\partial p_k}\dot{p}_k+\frac{\partial f}{\partial q_k}\dot{q}_k\right)又因为q˙k=∂H/∂pk,p˙k=−∂H/∂qk${\stackrel{˙}{q}}_{k}=\mathrm{\partial }H/\mathrm{\partial }{p}_{k},{\stackrel{˙}{p}}_{k}=-\mathrm{\partial }H/\mathrm{\partial }{q}_{k}$$\dot{q}_k=\partial H/\partial p_k,\dot{p}_k=-\partial H/\partial q_k$所以dfdt=∂f∂t+∑k(∂H∂pk∂f∂qk−∂H∂qk∂f∂pk)$\frac{df}{dt}=\frac{\mathrm{\partial }f}{\mathrm{\partial }t}+\sum _{k}\left(\frac{\mathrm{\partial }H}{\mathrm{\partial }{p}_{k}}\frac{\mathrm{\partial }f}{\mathrm{\partial }{q}_{k}}-\frac{\mathrm{\partial }H}{\mathrm{\partial }{q}_{k}}\frac{\mathrm{\partial }f}{\mathrm{\partial }{p}_{k}}\right)$\frac{df}{dt}=\frac{\partial f}{\partial t}+\sum_k\left(\frac{\partial H}{\partial p_k}\frac{\partial f}{\partial q_k}-\frac{\partial H}{\partial q_k}\frac{\partial f}{\partial p_k}\right)定义泊松括号为[F,G]=∑k(∂F∂pk∂G∂qk−∂F∂qk∂G∂pk)$\left[F,G\right]=\sum _{k}\left(\frac{\mathrm{\partial }F}{\mathrm{\partial }{p}_{k}}\frac{\mathrm{\partial }G}{\mathrm{\partial }{q}_{k}}-\frac{\mathrm{\partial }F}{\mathrm{\partial }{q}_{k}}\frac{\mathrm{\partial }G}{\mathrm{\partial }{p}_{k}}\right)$[F,G]=\sum_k\left(\frac{\partial F}{\partial p_k}\frac{\partial G}{\partial q_k}-\frac{\partial F}{\partial q_k}\frac{\partial G}{\partial p_k}\right)则dfdt=∂f∂t+[H,f]$\frac{df}{dt}=\frac{\mathrm{\partial }f}{\mathrm{\partial }t}+\left[H,f\right]$\frac{df}{dt}=\frac{\partial f}{\partial t}+[H,f]这就是力学量随时间的变化。如果函数f$f$$f$不显含时间t$t$$t$，则f$f$$f$守恒的充要条件是[H,f]=0$\left[H,f\right]=0$$[H,f]=0$。

作用量函数

最小作用量原理说的是在时刻t=t1$t={t}_{1}$$t=t_1$和时刻t=t2$t={t}_{2}$$t=t_2$，系统的位置由两组坐标q(1)${q}^{\left(1\right)}$$q^{(1)}$和q(2)${q}^{\left(2\right)}$$q^{(2)}$确定，那么系统在这两个位置之间的运动使得作用量S=∫t2t1L(q,q˙,t)dt$S={\int }_{{t}_{1}}^{{t}_{2}}L\left(q,\stackrel{˙}{q},t\right)dt$S=\int_{t_1}^{t_2}L(q,\dot{q},t)dt取最小值。即δS=0$\delta S=0$$\delta S=0$。

设q(t)$q\left(t\right)$$q(t)$使得作用量S$S$$S$取最小值，现在给q(t)$q\left(t\right)$$q(t)$一个变分δq(t)$\delta q\left(t\right)$$\delta q(t)$，变分δq(t)$\delta q\left(t\right)$$\delta q(t)$满足δq(t1)=δq(t2)=0$\delta q\left({t}_{1}\right)=\delta q\left({t}_{2}\right)=0$$\delta q(t_1)=\delta q(t_2)=0$，从而系统始末状态不变，只是运动轨迹变化。则使用q(t)+δq(t)$q\left(t\right)+\delta q\left(t\right)$$q(t)+\delta q(t)$代替q(t)$q\left(t\right)$$q(t)$给S$S$$S$带来的变分为δS=δ∫t2t1L(q,q˙,t)dt=∫t2t1(∂L∂qδq+∂L∂q˙δq˙)dt$\delta S=\delta {\int }_{{t}_{1}}^{{t}_{2}}L\left(q,\stackrel{˙}{q},t\right)dt={\int }_{{t}_{1}}^{{t}_{2}}\left(\frac{\mathrm{\partial }L}{\mathrm{\partial }q}\delta q+\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{q}}\delta \stackrel{˙}{q}\right)dt$\delta S=\delta \int_{t_1}^{t_2}L(q,\dot{q},t)dt=\int_{t_1}^{t_2}\left(\frac{\partial L}{\partial q}\delta q+\frac{\partial L}{\partial \dot{q}}\delta\dot{q}\right)dt由于是等时变分，所以δq˙=d(δq)/dt$\delta \stackrel{˙}{q}=d\left(\delta q\right)/dt$$\delta \dot{q}=d(\delta q)/dt$，分部积分可得δS=∂L∂q˙δq∣∣∣t2t1+∫t2t1(∂L∂q−ddt∂L∂q˙)δqdt$\delta S=\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{q}}\delta q{|}_{{t}_{1}}^{{t}_{2}}+{\int }_{{t}_{1}}^{{t}_{2}}\left(\frac{\mathrm{\partial }L}{\mathrm{\partial }q}-\frac{d}{dt}\frac{\mathrm{\partial }L}{\mathrm{\partial }\stackrel{˙}{q}}\right)\delta qdt$\delta S=\frac{\partial L}{\partial \dot{q}}\delta q\Bigg|^{t_2}_{t_1}+\int_{t_1}^{t_2}\left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}\right)\delta q dt

现在重新考虑作用量，让积分沿着真实的运动路径，只固定t=t1$t={t}_{1}$$t=t_1$对应的q(1)${q}^{\left(1\right)}$$q^{(1)}$这一端，而让在t=t2$t={t}_{2}$$t=t_2$时刻的q(t2)$q\left({t}_{2}\right)$$q(t_2)$通过不同的位置，这样作用量S$S$$S$就是t=t2$t={t}_{2}$$t=t_2$时刻通过的不同位置的函数。观察上面δS$\delta S$$\delta S$的式子，由于沿着真实的运动路径，上式积分为零，而第一项的下限有δq(t1)=0$\delta q\left({t}_{1}\right)=0$$\delta q(t_1)=0$所以有δS=∑ipiδqi$\delta S=\sum _{i}{p}_{i}\delta {q}_{i}$\delta S=\sum_ip_i\delta q_i其中δqi$\delta {q}_{i}$$\delta q_i$是t=t2$t={t}_{2}$$t=t_2$时的δqi(t)$\delta {q}_{i}\left(t\right)$$\delta q_i(t)$，pi${p}_{i}$$p_i$是对应的广义动量。上式表明，若如此重新考虑作用量，则有∂S∂qi=pi$\frac{\mathrm{\partial }S}{\mathrm{\partial }{q}_{i}}={p}_{i}$\frac{\partial S}{\partial q_i}=p_i这是固定两端时间t=t1,t=t2$t={t}_{1},t={t}_{2}$$t=t_1,t=t_2$和一端状态q(t1)$q\left({t}_{1}\right)$$q(t_1)$，而让另一端的状态q(t2)$q\left({t}_{2}\right)$$q(t_2)$变动的情况；同样的，还可以这样重新考虑作用量，固定两个状态q(t1)$q\left({t}_{1}\right)$$q(t_1)$和q(t2)$q\left({t}_{2}\right)$$q(t_2)$，以及一端的时间t=t1$t={t}_{1}$$t=t_1$，而让另一端时间t2${t}_{2}$$t_2$变动（简记为t$t$$t$），则可设想，也会存在一个∂S/∂t$\mathrm{\partial }S/\mathrm{\partial }t$$\partial S/\partial t$，它的具体表达式求法如下：将S$S$$S$看做末端的坐标和时间的函数，则有dSdt=∂S∂t+∑i∂S∂qiq˙i=∂S∂t+∑ipiq˙i$\frac{dS}{dt}=\frac{\mathrm{\partial }S}{\mathrm{\partial }t}+\sum _{i}\frac{\mathrm{\partial }S}{\mathrm{\partial }{q}_{i}}{\stackrel{˙}{q}}_{i}=\frac{\mathrm{\partial }S}{\mathrm{\partial }t}+\sum _{i}{p}_{i}{\stackrel{˙}{q}}_{i}$\frac{dS}{dt}=\frac{\partial S}{\partial t}+\sum_i\frac{\partial S}{\partial q_i}\dot{q}_i=\frac{\partial S}{\partial t}+\sum_ip_i\dot{q}_i另一方面，按照作用量的定义，有dS/dt=L$dS/dt=L$$dS/dt=L$，两式对比，则有∂S∂t=L−∑ipiq˙i=−H$\frac{\mathrm{\partial }S}{\mathrm{\partial }t}=L-\sum _{i}{p}_{i}{\stackrel{˙}{q}}_{i}=-H$\frac{\partial S}{\partial t}=L-\sum_ip_i\dot{q}_i=-H所以如此定义的作用量的全微分可以写作dS=∑ipidqi−Hdt$dS=\sum _{i}{p}_{i}d{q}_{i}-Hdt$dS=\sum_ip_idq_i-Hdt这里的作用量S$S$$S$是末端坐标和时间的函数，又叫做哈密顿主函数。

正则变换

给s$s$$s$个广义坐标qi${q}_{i}$$q_i$做变换，Qi=Qi(q,t)${Q}_{i}={Q}_{i}\left(q,t\right)$$Q_i=Q_i(q,t)$，则s$s$$s$个Qi${Q}_{i}$$Q_i$仍然是广义坐标，从而拉格朗日方程仍然成立（因为拉格朗日方程不依赖于广义坐标的选取），这种变换称为点变换。在哈密顿力学中，p,q$p,q$$p,q$都是平等的独立变量，因此变换还可以推广到2s$2s$$2s$个，即从p,q$p,q$$p,q$到新变量P,Q$P,Q$$P,Q$ Qi=Qi(p,q,t),Pi=Pi(p,q,t)${Q}_{i}={Q}_{i}\left(p,q,t\right),\phantom{\rule{1em}{0ex}}{P}_{i}={P}_{i}\left(p,q,t\right)$Q_i=Q_i(p,q,t),\quad P_i=P_i(p,q,t)但是作该变换以后，运动方程不一定具有正则形式：Q˙i=∂H′∂Pi,P˙i=−∂H′∂Qi${\stackrel{˙}{Q}}_{i}=\frac{\mathrm{\partial }{H}^{\prime }}{\mathrm{\partial }{P}_{i}},\phantom{\rule{1em}{0ex}}{\stackrel{˙}{P}}_{i}=-\frac{\mathrm{\partial }{H}^{\prime }}{\mathrm{\partial }{Q}_{i}}$\dot{Q}_i=\frac{\partial H'}{\partial P_i},\quad \dot{P}_i=-\frac{\partial H'}{\partial Q_i}而运动方程能保持这种结构的变换称之为正则变换。可见正则变换是需要一定条件的。这个条件就是dF=∑ipidqi−∑iPidQi+(H′−H)dt$dF=\sum _{i}{p}_{i}d{q}_{i}-\sum _{i}{P}_{i}d{Q}_{i}+\left({H}^{\prime }-H\right)dt$dF=\sum_ip_idq_i-\sum_iP_idQ_i+(H'-H)dt其中Pi,Qi${P}_{i},{Q}_{i}$$P_i,Q_i$是正则变换，H′${H}^{\prime }$$H'$是变换后的哈密顿函数，F$F$$F$是一个关于新老坐标、时间的函数，称之为变换的母函数。也就是说一个变换如果是正则变换，则上式的右端一定是某个函数的全微分。由上式可以看出pi=∂F∂qi,Pi=−∂F∂Qi,H′=H+∂F∂t${p}_{i}=\frac{\mathrm{\partial }F}{\mathrm{\partial }{q}_{i}},\phantom{\rule{1em}{0ex}}{P}_{i}=-\frac{\mathrm{\partial }F}{\mathrm{\partial }{Q}_{i}},\phantom{\rule{1em}{0ex}}{H}^{\prime }=H+\frac{\mathrm{\partial }F}{\mathrm{\partial }t}$p_i=\frac{\partial F}{\partial q_i},\quad P_i=-\frac{\partial F}{\partial Q_i},\quad H'=H+\frac{\partial F}{\partial t}这里的母函数F=F(q,Q,t)$F=F\left(q,Q,t\right)$$F=F(q,Q,t)$，也可以采用勒让德变换把母函数变成q,P$q,P$$q,P$和t$t$$t$的函数，为此把上面F$F$$F$的全微分dF$dF$$dF$换成d(F+∑iPiQi)$d\left(F+\sum _{i}{P}_{i}{Q}_{i}\right)$$d(F+\sum\limits_iP_iQ_i)$得到d(F+∑iPiQi)=∑ipidqi−∑iQidPi+(H′−H)dt$d\left(F+\sum _{i}{P}_{i}{Q}_{i}\right)=\sum _{i}{p}_{i}d{q}_{i}-\sum _{i}{Q}_{i}d{P}_{i}+\left({H}^{\prime }-H\right)dt$d(F+\sum\limits_iP_iQ_i)=\sum_ip_idq_i-\sum_iQ_idP_i+(H'-H)dt上式表明左端是一个关于q,P,t$q,P,t$$q,P,t$的函数，这个母函数记为Φ(q,P,t)$\mathrm{\Phi }\left(q,P,t\right)$$\Phi(q,P,t)$，显然有pi=∂Φ∂qi,Qi=∂Φ∂Pi,H′=H+∂Φ∂t${p}_{i}=\frac{\mathrm{\partial }\mathrm{\Phi }}{\mathrm{\partial }{q}_{i}},\phantom{\rule{1em}{0ex}}{Q}_{i}=\frac{\mathrm{\partial }\mathrm{\Phi }}{\mathrm{\partial }{P}_{i}},\phantom{\rule{1em}{0ex}}{H}^{\prime }=H+\frac{\mathrm{\partial }\mathrm{\Phi }}{\mathrm{\partial }t}$p_i=\frac{\partial \Phi}{\partial q_i},\quad Q_i=\frac{\partial \Phi}{\partial P_i},\quad H'=H+\frac{\partial \Phi}{\partial t}需类似地母函数还有两个，一共四类母函数。

要注意的是，进行正则变换以后，哈密顿函数的形式会发生变化，上式最后一个式子表明母函数对时间的偏导数给出新老哈密顿函数的差值，如果选取的母函数不显含时间，则只需要将原哈密顿函数中的p,q$p,q$$p,q$代换成P,Q$P,Q$$P,Q$即可。

因为在一个正则变换Qk=Qk(p,q,t)${Q}_{k}={Q}_{k}\left(p,q,t\right)$$Q_k=Q_k(p,q,t)$中，即有动量参与，也有坐标参与，所以变换后的Q,P$Q,P$$Q,P$不在具有动量或坐标的意义，无法进行区分，所以称为正则共轭变量。另外，正则变换不改变泊松括号，即[f,g]p,q=[f,g]P,Q$\left[f,g{\right]}_{p,q}=\left[f,g{\right]}_{P,Q}$[f,g]_{p,q}=[f,g]_{P,Q}

最后，p,q$p,q$$p,q$的随时间的演化也可以归结为一种正则变换，变换的母函数就是−S$-S$$-S$。前面说，初始固定而末端变动的作用量函数S$S$$S$是末端时间和坐标的函数S=S(q,t)$S=S\left(q,t\right)$$S=S(q,t)$，由此有作用量函数的全微分dS=∑ipidqi−Hdt$dS=\sum _{i}{p}_{i}d{q}_{i}-Hdt$dS=\sum_ip_idq_i-Hdt现在如果让初始端也变动（但固定时间差τ$\tau$$\tau$），则作用量函数S$S$$S$是初始状态qt${q}_{t}$$q_t$、初始时刻t$t$$t$、末尾状态qt+τ${q}_{t+\tau }$$q_{t+\tau}$三者的函数，且明显有全微分式dS=∑i(pt+τdqt+τ−ptdqt)−(Ht+τ−Ht)dt$dS=\sum _{i}\left({p}_{t+\tau }d{q}_{t+\tau }-{p}_{t}d{q}_{t}\right)-\left({H}_{t+\tau }-{H}_{t}\right)dt$dS=\sum_i(p_{t+\tau}dq_{t+\tau}-p_tdq_t)-(H_{t+\tau}-H_t)dt对比第一类母函数，可以发现−S$-S$$-S$是从qt,pt${q}_{t},{p}_{t}$$q_t,p_t$到qt+τ,pt+τ${q}_{t+\tau },{p}_{t+\tau }$$q_{t+\tau},p_{t+\tau}$的正则变换母函数。

哈密顿-雅克比方程

对于末端变化的作用量函数，前面已经得出∂S∂t+H(q,p,t)=0∂S∂qi=pi$\frac{\mathrm{\partial }S}{\mathrm{\partial }t}+H\left(q,p,t\right)=0\phantom{\rule{0ex}{0ex}}\frac{\mathrm{\partial }S}{\mathrm{\partial }{q}_{i}}={p}_{i}$\frac{\partial S}{\partial t}+H(q,p,t)=0\\\frac{\partial S}{\partial q_i}=p_i将后一式的pi${p}_{i}$$p_i$代入前一式的哈密顿函数中去，得到∂S∂t+H(q1,⋯,qs;∂S∂q1,⋯,∂S∂qs;t)=0$\frac{\mathrm{\partial }S}{\mathrm{\partial }t}+H\left({q}_{1},\cdots ,{q}_{s};\frac{\mathrm{\partial }S}{\mathrm{\partial }{q}_{1}},\cdots ,\frac{\mathrm{\partial }S}{\mathrm{\partial }{q}_{s}};t\right)=0$\frac{\partial S}{\partial t}+H\left(q_1,\cdots,q_s;\frac{\partial S}{\partial q_1},\cdots,\frac{\partial S}{\partial q_s};t\right)=0称为哈密顿-雅克比方程。观察该方程，它是一个偏微分方程，求微分的函数是S(q,t)$S\left(q,t\right)$$S(q,t)$，自变量是qi${q}_{i}$$q_i$和时间t$t$$t$，而且是一阶的偏微分方程。考虑方程的全积分，应该含有s+1$s+1$$s+1$个任意常数，由于S(q,t)$S\left(q,t\right)$$S(q,t)$仅以其导数的形式出现在方程中，所以这s+1$s+1$$s+1$个任意常数中必然有一个是相加的：S=f(t,q1,⋯,qs;α1,⋯,αs)+A$S=f\left(t,{q}_{1},\cdots ,{q}_{s};{\alpha }_{1},\cdots ,{\alpha }_{s}\right)+A$S=f(t,q_1,\cdots,q_s;\alpha_1,\cdots,\alpha_s)+A其中α1,⋯,αs${\alpha }_{1},\cdots ,{\alpha }_{s}$$\alpha_1,\cdots,\alpha_s$和A$A$$A$是这s+1$s+1$$s+1$个任意常数。现在用αi${\alpha }_{i}$$\alpha_i$作为s$s$$s$个新动量，用f$f$$f$作为正则变换的母函数，则该母函数是第二类母函数。设正则变换带来的新坐标为β1,⋯,βs${\beta }_{1},\cdots ,{\beta }_{s}$$\beta_1,\cdots,\beta_s$，则按照正则变换，有pi=∂f∂qi,βi=∂f∂αi,H′=H+∂f∂t${p}_{i}=\frac{\mathrm{\partial }f}{\mathrm{\partial }{q}_{i}},\phantom{\rule{1em}{0ex}}{\beta }_{i}=\frac{\mathrm{\partial }f}{\mathrm{\partial }{\alpha }_{i}},\phantom{\rule{1em}{0ex}}{H}^{\prime }=H+\frac{\mathrm{\partial }f}{\mathrm{\partial }t}$p_i=\frac{\partial f}{\partial q_i},\quad\beta_i=\frac{\partial f}{\partial \alpha_i},\quad H'=H+\frac{\partial f}{\partial t}只看上面最后一个式子，∂f∂t=∂S∂t=−H$\frac{\mathrm{\partial }f}{\mathrm{\partial }t}=\frac{\mathrm{\partial }S}{\mathrm{\partial }t}=-H$$\frac{\partial f}{\partial t}=\frac{\partial S}{\partial t}=-H$所以变换后的哈密顿函数H′=0${H}^{\prime }=0$$H'=0$，从而根据哈密顿正则方程，有α˙i=0⇒αi=constβ˙i=0⇒βi=const${\stackrel{˙}{\alpha }}_{i}=0⇒{\alpha }_{i}=\text{const}\phantom{\rule{0ex}{0ex}}{\stackrel{˙}{\beta }}_{i}=0⇒{\beta }_{i}=\text{const}$\dot{\alpha}_i=0\Rightarrow\alpha_i=\text{const}\\\dot{\beta}_i=0\Rightarrow\beta_i=\text{const}再回来看第二个式子（其实是s$s$$s$个式子）βi=∂f∂αi${\beta }_{i}=\frac{\mathrm{\partial }f}{\mathrm{\partial }{\alpha }_{i}}$\beta_i=\frac{\partial f}{\partial \alpha_i}可以将s$s$$s$个坐标qi${q}_{i}$$q_i$用时间t$t$$t$和2s$2s$$2s$个常数αi,βi${\alpha }_{i},{\beta }_{i}$$\alpha_i,\beta_i$表示出来。所以哈密顿-雅克比方程也像拉格朗日方程或者哈密顿正则方程一样成为求解问题的基础方程。
展开全文
• 哈密顿-雅可比-贝尔曼方程(Hamilton-Jacobi-Bellman equation，简称H*方程)是一个偏微分方程，是最佳控制的中心。H*方程式的解是针对特定动态系统及相关成本函数下，有最小成本的实值函数。若只在某一个区域求解，H*...
哈密顿-雅可比-贝尔曼方程(Hamilton-Jacobi-Bellman equation，简称H*方程)是一个偏微分方程，是最佳控制的中心。H*方程式的解是针对特定动态系统及相关成本函数下，有最小成本的实值函数。若只在某一个区域求解，H*方程是一个必要条件，若是在整个状态空间下求解，H*方程是充份必要条件。其解是针对开回路的系统，但也允许针对闭回路系统求解。H*方程也可以扩展到随机系统。一些经典的变分问题，例如最速降线问题，可以用此方法求解。H*方程的基础是以1950年代由理查德·贝尔曼及其同仁提出的动态规划[1]。对应的离散系统方程式一般称为贝尔曼方程。在连续时间的结果可以视为由卡尔·雅可比及威廉·哈密顿提出，经典力学中哈密顿－雅可比方程的延伸。目录1 最佳控制的问题2 偏微分方程3 推导H*方程4 求解方程5 延伸到随机问题5.1 在LQG控制的应用6 相关条目7 参考资料8 延伸阅读最佳控制的问题考虑在时间[0,T]{displaystyle [0,T]}内，以下确定系统最佳控制的问题：V(x(0),0)=minu{∫0TC[x(t),u(t)]dt+D[x(T)]}{displaystyle V(x(0),0)=min _{u}left{int _{0}^{T}C[x(t),u(t)],dt+D[x(T)]right}}其中C[ ]为标量成本函数，D[ ]为计算其最终状态时效力时或经济值的函数，x(t)为系统状态向量，x(0)假设已知，及u(t)是想要求得的控制向量，在 0 ≤ t ≤ T。此系统也需满足下式：x˙(t)=F[x(t),u(t)]{displaystyle {dot {x}}(t)=F[x(t),u(t)],}其中F[ ]可以根据状态向量决定向量后续的变化。偏微分方程针对上述简单的系统，哈密顿-雅可比-贝尔曼微分方程如下：V˙(x,t)+minu{∇V(x,t)⋅F(x,u)+C(x,u)}=0{displaystyle {dot {V}}(x,t)+min _{u}left{nabla V(x,t)cdot F(x,u)+C(x,u)right}=0}需符合以下条件V(x,T)=D(x),{displaystyle V(x,T)=D(x),,}其中a⋅b{displaystyle acdot b}为向量a和b的内积，而∇{displaystyle nabla }为梯度运算子。上述PDE中的未知向量V(x,t){displaystyle V(x,t)}是贝尔曼间接效用函数(英语：間接效用函數)，表示从时间t{displaystyle t}，状态x{displaystyle x}开始控制系统，以最佳方式控制系统一直到时间T{displaystyle T}的成本。推导H*方程H*方程可以用以下的方式推导：假设V(x(t),t){displaystyle V(x(t),t)}是最佳的成本函数，则根据理查·贝尔曼的贝尔曼方程，从时间t到t + dt，可得：V(x(t),t)=minu{∫tt+dtC(x(t),u(t))dt+V(x(t+dt),t+dt)}.{displaystyle V(x(t),t)=min _{u}left{int _{t}^{t+dt}C(x(t),u(t)),dt+V(x(t+dt),t+dt)right}.}注意最后一项的泰勒展开式如下：V(x(t+dt),t+dt)=V(x(t),t)+V˙(x(t),t)dt+∇V(x(t),t)⋅x˙(t)dt+o(dt),{displaystyle V(x(t+dt),t+dt)=V(x(t),t)+{dot {V}}(x(t),t),dt+nabla V(x(t),t)cdot {dot {x}}(t),dt+o(dt),}其中o(dt)是泰勒展开式中的高阶项，若在等式两侧删除V(x(t), t)，除以dt，并取dt趋近为零的极限，可得上述定义的H*方程。求解方程H*方程一般会用逆向归纳法(英语：Backward induction)求解，也就是从t=T{displaystyle t=T}往前求解到t=0{displaystyle t=0}。若对整个状态空间求解，H*方程是最佳解的充份必要条件[2]。若可以求解V{displaystyle V}，就可以找到达到最小成本的控制u{displaystyle u}。一般而言，H*方程不会有一个传统光滑函数的解。为了这些情形发展了许多广义解的表示方式，包括皮埃尔-路易·利翁及迈克尔·克兰德尔(英语：Michael Crandall)的粘性解，Andrei Izmailovich Subbotin的极小化极大算法等。延伸到随机问题上述的作法主要是应用贝尔曼的最优化原理，以及在时间上由最终时间倒推求解，针对随机控制问题也可以用类似的作法求最佳解。考虑以下的问题min{∫0TC(t,Xt,ut)dt+D(XT)}{displaystyle min left{int _{0}^{T}C(t,X_{t},u_{t}),dt+D(X_{T})right}}此时(Xt)t∈[0,T]{displaystyle (X_{t})_{tin [0,T]},!}为随机过程，而(ut)t∈[0,T]{displaystyle (u_{t})_{tin [0,T]},!}为控制变数。首先使用贝尔曼方程，再用伊藤引理将V(Xt,t){displaystyle V(X_{t},t)}展开，可以得到以下的随机H*方程。minu{AV(x,t)+C(t,x,u)}=0,{displaystyle min _{u}left{{mathcal {A}}V(x,t)+C(t,x,u)right}=0,}其中A{displaystyle {mathcal {A}}}为随机微分运算子，以下是最终时间的限制条件。V(x,T)=D(x).{displaystyle V(x,T)=D(x),!.}注意此时已没有随机性了。此例中后者的V{displaystyle V,!}不一定是原来方程式的解，它只是可能解之一，需要再作验证。此技巧常用在财务数学中，决定在市场中的最佳投资策略(例如像默顿的投资组合问题(英语：Merton's portfolio problem))。在LQG控制的应用下例是一个有线性随机动态特性的系统，有二次式的成本。若系统动态为dxt=(axt+but)dt+σdwt,{displaystyle dx_{t}=(ax_{t}+bu_{t})dt+sigma dw_{t},}而成本以以下的速度累积C(xt,ut)=r(t)ut2/2+q(t)xt2/2{displaystyle C(x_{t},u_{t})=r(t)u_{t}^{2}/2+q(t)x_{t}^{2}/2}，则H*方程为−∂V(x,t)∂t=12q(t)x2+∂V(x,t)∂xax−b22r(t)(∂V(x,t)∂x)2+σ∂2V(x,t)∂x2.{displaystyle -{frac {partial V(x,t)}{partial t}}={frac {1}{2}}q(t)x^{2}+{frac {partial V(x,t)}{partial x}}ax-{frac {b^{2}}{2r(t)}}left({frac {partial V(x,t)}{partial x}}right)^{2}+sigma {frac {partial ^{2}V(x,t)}{partial x^{2}}}.}假设价值函数是二次式，可以将一般的Riccati方程用在价值函数的海森矩阵中，即为线性二次高斯控制(LQG控制)。相关条目贝尔曼方程，离散的哈密顿-雅可比-贝尔曼方程。Pontryagin最小值定理(英语：Pontryagin's minimum principle)，是将哈密顿量最小值，是最佳化必要但不充份的条件，和哈密顿-雅可比-贝尔曼方程相比的好处是只要考虑满足条件的单一轨迹。参考资料^ R. E. Bellman. Dynamic Programming. Princeton, NJ, 1957.^ Dimitri P Bertsekas. Dynamic programming and optimal control. Athena Scientific, 2005.延伸阅读Dimitri P. Bertsekas. Dynamic programming and optimal control. Athena Scientific. 2005.
展开全文
• 在本文中，我们将表明，可以为描述恒定负曲率表面的任何非线性演化方程定义哈密顿结构，因此守恒律的密度可以视为对应的哈密顿量。 利用逆散射法求出了一个新的五阶非线性发展方程的孤子解和守恒量。
• 文章目录前言哈密顿原理经典变分问题数学基础区别函数和泛函变分—自变量不变条件下函数自身的变化变分运算规则积分形式的泛函及其极值问题最速降线问题变分问题的欧拉方程哈密顿原理的优点哈密顿正则方程广义动量与...
文章目录前言哈密顿原理经典变分问题数学基础区别函数和泛函变分—自变量不变条件下函数自身的变化变分运算规则积分形式的泛函及其极值问题最速降线问题变分问题的欧拉方程哈密顿原理的优点哈密顿正则方程广义动量与相空间Legrand变换热力学的拉格朗日变换多元函数和Legrand变换关系哈密顿正则方程正则方程的“辛”形式正则方程的初积分Routhian及Rouh方程—混合H-L方法RouthianRouth方程泊松括号与泊松定狸Poisson括号的引入Poisson括号的性质基本性质基本Poisson括号关系（正则变量满足的关系）Poisson括号的高级性质正则变换点变换与接触变换正则变换正则变换例子—几种常见的基本正则变换判别变换为正则变换的充要条件方法1方法2方法3正则不变量：在正则变换下保持不变的量Poisson括号不变相体积不变相空间与刘维定理相空间与相轨迹庞加莱映射与庞加莱截面统计系综与相流Liouville定理及其证明Hamilton-Jacobi方程H-J方程的引入及目的H-J方程及 Hamilton主函数主函数S之物理意义：S是沿真实运动轨迹的作用量H-J方程的求解：分离变量法

前言
这篇文章是交通大学物理学院开设的理论力学的课程PPT缩略版。哈密顿力学是泛函的一大体现之一，而泛函作为如今十大数学技能应该被学习。为了方便大家的阅读，特制了本篇网页版的董兵老师的PPT。

提示：本篇文章为私人笔记，若有侵权，请联系我删除
哈密顿原理
经典变分问题

最速落径问题
在垂直平面内，连接不在同一铅直线上的两点A、B间的曲线，使质点在自重作用下无初速以最短时间从A滑至B。
最短线程问题
曲面上给定两点间的长度最短的曲线。
等周问题
长度固定的平面封闭曲线所围面积最大的曲线形状。

数学基础
区别函数和泛函

函数：$f(x)$，自变量$x$，定义域为数。
泛函：$F[f, x]=F[f(x), x]$，自变量$f(x),$ 定义域为函数。

变分—自变量不变条件下函数自身的变化

微分 \begin{aligned} &x \rightarrow x+d x \\ & f(x) \rightarrow f(x+d x) \\ d f=& f(x+d x)-f(x)=f^{\prime}(x) d x \end{aligned}
变分 $f(x) \rightarrow \bar{f}(x)$
$\delta f=\bar{f}(x)-f(x)$

变分运算规则
$\left\{\begin{array}{l}\delta\left(y_{1} \pm y_{2}\right)=\delta y_{1}+\delta y_{2} \\ \delta\left(y_{1} \cdot y_{2}\right)=y_{1} \delta y_{2}+y_{2} \delta y_{1} \\ \delta\left(\frac{y_{1}}{y_{2}}\right)=\frac{y_{2} \delta y_{1}-y_{1} \delta y_{2}}{y_{2}^{2}} \\ \delta(k y)=k \delta y \\ \delta(d y)=d(\delta y) \\ \delta\left(\frac{d y}{d x}\right)=\frac{d}{d x}(\delta y) \quad(\delta x=0) \\ \delta \int_{t_{1}}^{t_{2}} y d t=\int_{t_{1}}^{t_{2}} \delta y d t\end{array}\right.$
积分形式的泛函及其极值问题
例如泛函$F[y]=\int_{x_{1}}^{x_{2}} L\left(x, y, y^{\prime}\right) d x$为两端点固定的积分型泛函，就像在我们研究$y=f(x)$时我们希望其导数为0一样，我们也希望泛函满足条件$\delta F=0$。
最速降线问题
为了更好地明白这个问题，我们使用最速降线来举例子
在铅直平面内在所有连接两个定点A和B的曲线中，找出一 条曲线来，使得初速度为零的质点，在重力作用下，自全点沿 它无摩擦地滑下时，以最短时间到达B点。
设曲线AB方程为$y=f(x)$，我们可以得知质点沿着曲线运动的距离为
$v=\sqrt{2 g y}=\frac{d s}{d t}=\frac{\sqrt{(d x)^{2}+(d y)^{2}}}{d t}=\frac{\left(\sqrt{1 \pm y^{2}}\right)}{d t} d x$
我们可以写出质点自A沿曲线y(x)自由滑至B点所需的时间为：$T[y]=\int_{x_A}^{x_B}dt=\int_{x_A}^{x_B}\frac{\sqrt{1+y^{\prime 2}}}{\sqrt{2gy}}$可知T的值与曲线的形状有关，T是y的泛函，则我们希望$\delta T=0$
变分问题的欧拉方程
对于$F[y]=\int_{x_{1}}^{x_{2}} L\left(x, y, y^{\prime}\right) d x$我们要找到一个合适的$\delta T=0$使得$\delta F=0$。对于固定边界的问题有
$\left.\delta y\right|_{x=x_{1}}=\left.\delta y\right|_{x=x_{2}}=0$
我们由已知的变分运算法则得到
$\delta y=\bar{y}(x)-y(x),(\delta y)^{\prime}=\delta y^{\prime}=\bar{y}^{\prime}(x)-y^{\prime}(x)$
$\delta F=F[\bar{y}(x)]-F[y(x)]$
于是有
$F[\bar{y}(x)]=\int_{x_{1}}^{x_{2}} L\left(x, \bar{y}, \bar{y}^{\prime}\right) d x=\int_{x_{1}}^{x_{2}} L\left(x, y+\delta y, y^{\prime}+\delta y^{\prime}\right) d x$
对上式做Taylor展开有
$F[\bar{y}(x)]=\int_{x_{1}}^{x_{2}} L\left(x, y, y^{\prime}\right) d x+\int_{x_{1}}^{x_{2}}\left(\frac{\partial L}{\partial y} \delta y+\frac{\partial L}{\partial y^{\prime}} \delta y^{\prime}\right) d x+$higher terms
下面计算变分
$\delta F=\int_{x_{1}}^{x_{2}} L\left(x, \bar{y}, \bar{y}^{\prime}\right) d x-\int_{x_{1}}^{x_{2}} L\left(x, y, y^{\prime}\right) d x=\int_{x_{1}}^{x_{2}}\left(\frac{\partial L}{\partial y} \delta y+\frac{\partial L}{\partial y^{\prime}} \delta y^{\prime}\right) d x$
其中
$\int_{x_{1}}^{x_{2}} \frac{\partial L}{\partial y^{\prime}} \delta y^{\prime} d x=\int_{x_{1}}^{x_{2}} \frac{\partial L}{\partial y^{\prime}} \delta\left(\frac{d y}{d x}\right) d x=\int_{x_{1}}^{x_{2}} \frac{\partial L}{\partial y^{\prime}} \frac{d \delta y}{d x} d x$
$=\int_{x_{1}}^{x_{2}} \frac{d}{d x}\left(\frac{\partial L}{\partial y^{\prime}} \delta y\right) d x-\int_{x_{1}}^{x_{2}}\left(\frac{d}{d x} \frac{\partial L}{\partial y^{\prime}}\right) \delta y d x$
$=\left.\frac{\partial L}{\partial y^{\prime}} \delta y\right|_{x_{1}} ^{x_{2}}-\int_{x_{1}}^{x_{2}}\left(\frac{d}{d x} \frac{\partial L}{\partial y^{\prime}}\right) \delta y d x$
于是整理得到：$\delta F=\int_{x_{1}}^{x_{2}}\left(\frac{\partial L}{\partial y}-\frac{d}{d x} \frac{\partial L}{\partial y^{\prime}}\right) \delta y d x=0$
即有$\frac{d}{d x} \frac{\partial L}{\partial y^{\prime}}-\frac{\partial L}{\partial y}=0$，我们称其为欧拉方程
上面的问题中只有一个未知量，对于多元泛函也是差不多的处理方案。对多元泛函$\delta F=\int_{x_{1}}^{x_{2}}\left(\frac{\partial L}{\partial y}-\frac{d}{d x} \frac{\partial L}{\partial y^{\prime}}\right) \delta y d x=0$，若其边界也是固定的$\left.\delta y_{i}\right|_{x=x_{1}}=\left.\delta y_{i}\right|_{x=x_{2}}=0, i=1,2, \cdots n$，则它的极值问题由Euler方程组决定：
$\frac{d}{d x} \frac{\partial L}{\partial y_{i}^{\prime}}-\frac{\partial L}{\partial y_{i}}=0, \quad i=1,2, \cdots n$
哈密顿原理的优点

统一、简洁、完美，具有坐标变换的不变性；
具有很强的普适性可推广至无限自由度以及物理学其他领域；是积分形式的变分原理；
可用于创建新的理论。根据假设构造出拉格朗日函数，用哈密顿原理导出运动方程，由实践检验其正确性；
任何理论有一定的适用范围，这里的哈密顿原理的表述方式也并非对于任意力学系统成立，实际上对力学系统内外部的相互作用有一定的限制，要求相互作用可表示为一标量函数，一般来说，物理学通常关心的正是这种体系

哈密顿正则方程
回顾Lagrange力学：以广义坐标为独立变量，运动方程是构型空间中二阶微分方程组— Lagrange方程；在数学上为了处理问题的方便，往往将一个二阶微分方程化为两个一阶微分方程从而在相空间里讨论问题（降阶法）。对于 Lagrange方程，即将s个阶微分方程化为2s个一阶微分方程来处理，比如
$\dot{q}_{\alpha}=f_{\alpha}(q, X, t), \dot{X}_{\alpha}=g_{\alpha}(q, X, t)$
Hamilton力学：以广义坐标和广义动量为独立变量，运动方程是相空间中的一阶微分方程组——Hamilton正则方程：分析力学的第二个理论形式。
广义动量与相空间
我们首先定义广义动量$p_{\alpha} \equiv \frac{\partial L}{\partial \dot{q}_{\alpha}}, \alpha=1,2, \cdots, s$称 $q_{\alpha}, p_{\alpha}$ 为相互共轩的正则变量。 $q_{\alpha}$ 描写系统 的位置状态， $p_{\alpha}$ 描写系统的运动状态。由相互独 立的 $\left(q_{\alpha}, p_{\alpha}\right)$ 组成的2s维空间，才是系统状态 的完整描述，称为相空间（相即状态）。
一般Lagrangian $L(q, \dot{q}, t)$ 中 $q, \dot{q}$ 的地位不对 称，如果通过变换把 $\dot{q}_{\alpha}$ 变为 $p_{\alpha}=p_{\alpha}(q, \dot{q}, t)$,
即做反函数 $\dot{q}_{\alpha}=\dot{q}_{\alpha}(q, p, t)$ 并代入L，则可以 把运动微分方程降价，这可行吗？
我们并不可以直接代换，我们需要更多的操作！
Legrand变换
法国数学家与天文学家 A.M. LeGendre于1787年间在研究最小曲面的启发下提出如下问题：
有双元函数 $f(x, y),$ 其全微分为 $d f(x, y)=u d x+v d y$
我们今天希望能得到一个$g(u, y)$函数，其中$x=\frac{\partial g}{\partial u}, v=-\frac{\partial g}{\partial y}$