变分法
目录
1 泛函与变分 2
2 最小作用量原理与 Euler-Language 方程 2
3 Noether 定理与守恒量 3
3.1 对称性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.2 守恒量的推导 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3 一般对称性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 变分法的应用 6
4.1 求解最速下降线 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1
1 泛函与变分
可以简单认为泛函就是将将函数映射为数; 如定积分就是一个泛函
而变分可以认为是泛函的微分, 是函数形状的微小变化. 可以认为变分
𝛿𝑦
是一个函数值较小的任意函数, 并令其具有很好的性质 (连续性可微性等)
变分和微分的关系可以如下表示
对于路径 𝑃 𝑃
0
𝑄
0
𝑦(𝑥) + 𝛿𝑦 + 𝑑 (𝑦(𝑥) + 𝛿𝑦)
对于路径 𝑃 𝑄 𝑄
0
𝑦(𝑥) + 𝑑𝑦 + 𝛿(𝑦(𝑥) + 𝑑𝑦)
于是就有
𝑑𝛿𝑦 = 𝛿𝑑𝑦
变分和微分可以交换顺序
2 最小作用量原理与 Euler-Language 方程
若有函数 𝑓
𝑓 𝑓 (𝑦, 𝑦
0
, 𝑥)
定义作用量为泛函
𝑆
=
𝑥
2
𝑥
1
𝑓
(
𝑦, 𝑦
0
, 𝑥)𝑑𝑥
最小作用量原理即希望找到 𝑦 = 𝑦(𝑥) 使得 𝑆 取最小值. 取最小值时即取极值时, 就有
𝛿𝑆 = 0
该变分为确定端点的变分, 即有
𝛿𝑆(𝑥
1
) = 𝛿𝑆(𝑥
2
) = 0
并且横坐标的变分为零, 即有
𝛿𝑥 = 0
那么就有
𝑥
2
𝑥
1
𝛿 𝑓 (𝑦, 𝑦
0
, 𝑥)𝑑𝑥 = 0
(当它是对的!)
𝑥
2
𝑥
1
𝜕 𝑓
𝜕𝑦
𝛿𝑦 +
𝜕 𝑓
𝜕𝑦
0
𝛿𝑦
0
𝑑𝑥 = 0
对第二项分部积分 (注意可以交换变分与微分的顺序)
𝑥
2
𝑥
1
𝜕 𝑓
𝜕𝑦
0
=
𝜕 𝑓
𝜕𝑦
0
𝛿𝑦
𝑥
2
𝑥
1
𝑥
2
𝑥
1
𝑑
𝑑𝑥
𝜕 𝑓
𝜕𝑦
0
𝛿𝑦𝑑𝑥
由于是固定端点的变分, 第一项为零. 于是原式化为
𝑥
2
𝑥
1
𝜕 𝑓
𝜕𝑦
𝑑
𝑑𝑥
𝜕 𝑓
𝜕𝑦
0
𝛿𝑦𝑑𝑥 = 0
由于变分是任意的, 要使上式恒成立, 只能括号部分恒为零, 就得到了 Euler-Language 方程
𝑑
𝑑𝑥
𝜕 𝑓
𝜕𝑦
0
𝜕 𝑓
𝜕𝑦
= 0
变量的名字显然可以交换, 交换 𝑥 𝑦 就可以得到另一个 Euler-Language 方程
𝑑
𝑑𝑦
𝜕 𝑓
𝜕𝑥
0
𝜕 𝑓
𝜕𝑥
= 0
3 Noether 定理与守恒量
Noether 定理揭示了对称性与守恒量的关系, 该部分参考自 https://zhuanlan.zhihu.com/p/103841536
3.1 对称性
首先需要定义对称性. 考虑广义坐标的一个无穷小变换
(q, 𝑡) (q’, 𝑡
0
) = (q + 𝛿q, 𝑡 + 𝛿𝑡)
简记 q 𝑞. 定义对称性为作用量 𝑆 在变换前后不变, (拉格朗日量不显含时间)
𝑆
[
𝑞
0
(𝑡
0
)
]
𝑆
[
𝑞(𝑡)
]
= 0
记为
˜
𝛿𝑆 𝑆
[
𝑞
0
(𝑡
0
)
]
𝑆
[
𝑞(𝑡)
]
= 0
其中的
˜
𝛿 算符为同时考虑空间与时间变换时的变化量, 定义为
˜
𝛿 𝑓 (𝑞, 𝑡) 𝑓
(
𝑞
0
, 𝑡
0
)
𝑓
(
𝑞, 𝑡
)
与之不同的是 𝛿 算符只考虑空间
𝛿 𝑓 (𝑞, 𝑡) 𝑓
(
𝑞
0
, 𝑡
)
𝑓
(
𝑞, 𝑡
)
若给定了 𝑞 𝑡 的函数就有
˜
𝛿 𝑓 = 𝑓
(
𝑞
0
(𝑡
0
), 𝑡
0
)
𝑓
(
𝑞(𝑡), 𝑡
)
𝜕 𝑓
𝜕𝑞
˜
𝛿𝑞 +
𝜕 𝑓
𝜕𝑡
𝛿𝑡
𝛿 𝑓 = 𝑓 (𝑞
0
, 𝑡) 𝑓 (𝑞, 𝑡) =
𝜕 𝑓
𝜕𝑞
𝛿𝑞
其中又有
˜
𝛿𝑞(𝑡) = 𝑞
0
(𝑡
0
) 𝑞
0
(𝑡) + 𝑞
0
(𝑡) 𝑞(𝑡) = 𝛿𝑞(𝑡) + ¤𝑞(𝑡)𝛿𝑡
那么就得到了
˜
𝛿 𝑓 = 𝛿 𝑓 +
𝜕 𝑓
𝜕𝑞
¤𝑞(𝑡)𝛿𝑡 +
𝜕 𝑓
𝜕𝑡
𝛿𝑡
= 𝛿 𝑓 +
𝑑𝑓
𝑑𝑡
𝛿 𝑡
于是便得到了
˜
𝛿 算符的表达式 (?)
˜
𝛿 = 𝛿 + 𝛿𝑡
𝑑
𝑑𝑡
𝑓 中还含有 𝑞(𝑡) 的导数项,
𝑓 𝑓
𝑡, 𝑞(𝑡), ¤𝑞(𝑡), · · · , 𝑞
(𝑛 )
(𝑡)
由归纳法也可以推出上述表达仍然成立
一般将无穷小变换写为如下形式
𝑞
0
= 𝑞 + 𝜖Δ𝑞
𝑡
0
= 𝑡 + 𝜖Δ𝑡
需要注意的是此处的 𝜖Δ𝑞 𝜖Δ𝑡 其实是为了将大小与方向分离以便于处理. 其中 𝜖 标量, 表示扰动的
; Δ𝑞 Δ𝑡 是矢量 (𝑡 可能不是?), 表示方向, 与坐标系和具体的变换有关
若对称性对 𝜖 0 成立, 则称该对称性是续的, 反之则是离散的; 𝜖 随时间空间变化, 称该对
称性是全局的, 反之则是局域的
那么诺特定理即可表述为: 任意普遍 (对任意路径), 全局且连续的微分对称性都能得到一个对于特定路径
(指符合 Euler-Language 方程) 不变的守恒量
3.2 守恒量的推导
根据前面的讨论, 假设系统具有 Noether 定理中所述的良好的对称性,
𝑞
0
= 𝑞 + 𝜖Δ𝑞
𝑡
0
= 𝑡 + 𝜖Δ𝑡
,
˜
𝛿𝑆 𝑆
[
𝑞
0
(𝑡
0
)
]
𝑆
[
𝑞(𝑡)
]
= 0
将作用量写为拉格朗日函数积分的形式
˜
𝛿𝑆 =
𝑡
2
𝑡
1
˜
𝛿
(
𝐿𝑑𝑡
)
=
𝑡
2
𝑡
1
˜
𝛿𝐿
𝑑𝑡 + 𝐿
˜
𝛿𝑑𝑡
= 0
˜
𝛿 化为 𝛿
˜
𝛿𝑆 =
𝑡
2
𝑡
1
𝛿𝐿 + 𝛿𝑡
𝑑𝐿
𝑑𝑡
𝑑𝑡 + 𝐿 (𝛿𝑡)
=
𝑡
2
𝑡
1
𝛿𝐿𝑑𝑡 + 𝛿𝑡𝑑𝐿 + 𝐿𝑑 (𝛿𝑡)
=
𝑡
2
𝑡
1
𝛿𝐿𝑑𝑡 + 𝑑(𝐿𝛿𝑡)
=
(
𝐿𝛿𝑡
)
𝑡
2
𝑡
1
+
𝑡
2
𝑡
1
𝛿𝐿𝑑𝑡
将第二项展开 (注意此处的变分不再是端点给定的变分)
𝑡
2
𝑡
1
𝛿𝐿𝑑𝑡 =
𝑡
2
𝑡
1
Õ
𝑖
𝜕𝐿
𝜕𝑞
𝑖
𝛿𝑞
𝑖
+
𝜕𝐿
𝜕 ¤𝑞
𝑖
𝛿 ¤𝑞
𝑖
𝑑𝑡
其中的第二项变分和微分可交换, 利用分部积分得到
𝑡
2
𝑡
1
𝛿𝐿𝑑𝑡 =
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
𝛿𝑞
𝑖
!
𝑡
2
𝑡
1
+
𝑡
2
𝑡
1
Õ
𝑖
𝜕𝐿
𝜕𝑞
𝑖
𝑑
𝑑𝑡
𝜕𝐿
𝜕 ¤𝑞
𝑖
𝛿𝑞
𝑖
𝑑𝑡
运动路径是确定的, 有运动方程
𝜕𝐿
𝜕𝑞
𝑖
𝑑
𝑑𝑡
𝜕𝐿
𝜕 ¤𝑞
𝑖
= 0
将上式都代入得到
˜
𝛿𝑆 =
"
𝐿𝛿𝑡 +
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
𝛿𝑞
𝑖
#
𝑡
2
𝑡
1
=
"
𝐿𝛿𝑡 +
Õ
𝑖
(
˜
𝑞
𝑖
𝛿𝑡 ¤𝑞
𝑖
)
#
𝑡
2
𝑡
1
=
"
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
˜
𝛿𝑞
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
¤𝑞
𝑖
𝐿
𝛿 𝑡
#
𝑡
2
𝑡
1
按照能量和广义动量的定义, 将其写为
Õ
𝑖
𝑝
𝑖
˜
𝛿𝑞
𝑖
𝐸 𝛿𝑡
!
𝑡
2
𝑡
1
= 0
将变换的定义代入得到
𝜖
Õ
𝑖
𝑝
𝑖
· Δ𝑞
𝑖
𝐸Δ𝑡
!
𝑡
2
𝑡
1
= 0
由全局对称性 𝜖 为常数, 则有
Õ
𝑖
𝑝
𝑖
· Δ𝑞
𝑖
𝐸Δ𝑡
!
𝑡
2
𝑡
1
= 0
对任意的 𝑡
1
, 𝑡
2
都成立, 也就是说有守恒量
Õ
𝑖
𝑝
𝑖
· Δ𝑞
𝑖
𝐸Δ𝑡
Δ𝑡 = 𝑐𝑜𝑛𝑠𝑡 , Δ𝑞 = 0 时得到能量守恒;Δ𝑡 = 0 , Δ𝑞 = 𝑐𝑜𝑛𝑠𝑡 时得到动量守恒
3.3 一般对称性
但是, 对于某些对称性, 系统并不满足
𝑞
0
= 𝑞 + 𝜖Δ𝑞
𝑡
0
= 𝑡 + 𝜖Δ𝑡
,
˜
𝛿𝑆 𝑆
[
𝑞
0
(𝑡
0
)
]
𝑆
[
𝑞(𝑡)
]
= 0
但仍有守恒量存在. 假设
˜
𝛿𝑆 满足
˜
𝛿𝑆 𝑆
[
𝑞
0
(𝑡
0
)
]
𝑆
[
𝑞(𝑡)
]
= 𝑓
𝑡
2
𝑡
1
此时上文的推导结果仍然适用
˜
𝛿𝑆 =
"
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
˜
𝛿𝑞
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
¤𝑞
𝑖
𝐿
𝛿 𝑡
#
𝑡
2
𝑡
1
只不过
˜
𝛿𝑆 不再等于零
"
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
˜
𝛿𝑞
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
¤𝑞
𝑖
𝐿
𝛿𝑡
#
𝑡
2
𝑡
1
= 𝑓
𝑡
2
𝑡
1
舍去高阶小量保留一阶项, 𝑓 写为
˜
𝛿𝑞, 𝛿𝑡 的线性组合的形式
𝑓 =
Õ
𝑓
𝑖
˜
𝛿𝑞
𝑖
+ 𝑓
𝑡
𝛿𝑡
那么就可以将其合并到左边, 𝑅𝐻𝑆 重新变为零
"
Õ
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
𝑓
𝑖
˜
𝛿𝑞
𝑖
𝜕𝐿
𝜕 ¤𝑞
𝑖
¤𝑞
𝑖
𝐿 + 𝑓
𝑡
𝛿 𝑡
#
𝑡
2
𝑡
1
= 0
这样就又得到了新的守恒量
Õ
𝑖
(𝑝
𝑖
𝑓
𝑖
) · Δ𝑞
𝑖
(𝐸 + 𝑓
𝑡
)Δ𝑡
下面来讨论如何 𝑓 与拉格朗日函数的关系.
˜
𝛿𝑆 式写成 𝐿 的积分形式得到
𝑡
2
𝑡
1
(𝐿
0
𝐿)𝑑𝑡 =
𝑡
2
𝑡
1
𝑑𝑓
𝑑𝑡
𝑑𝑡
该式对于任意的 𝑡
1
, 𝑡
2
都要成立, 于是只能被积函数相等, 也就是
𝐿
0
𝐿 =
𝑑𝑓
𝑑𝑡
也就是说, 如果变换后的拉格朗日函数与变换前的相差一个时间的全倒数, 们也可以找到与这个变换相
对应的守恒量
4 变分法的应用
4.1 求解最速下降线
在这个问题中, 点固定, 物体在两点之间取不同的运动路径, 希望找到一条路径使得物体的运动时间
; 运动时间即为作用量
𝑡 =
𝑥
2
𝑥
1
𝑑𝑠
𝑣
其中 𝑑𝑠 为线微元长度
𝑑𝑠 =
p
𝑑𝑥
2
+ 𝑑𝑦
2
=
p
1 + 𝑦
02
𝑑𝑥
而由能量守恒可以得到
𝑣 =
p
2𝑔(𝑦
0
𝑦)
于是时间即为
𝑥
2
𝑥
1
p
1 + 𝑦
02
𝑑𝑥
p
2𝑔(𝑦
0
𝑦)
𝑥
2
𝑥
1
𝑓 (𝑦, 𝑦
0
, 𝑥)𝑑𝑥
Euler-Language 方程得到
𝑑
𝑑𝑥
𝜕 𝑓
𝜕𝑦
0
𝜕 𝑓
𝜕𝑦
= 0
代入化简即可得到
1
2(𝑦
0
𝑦)
+
𝑦
00
(1 + 𝑦
02
)
于是
(1 + 𝑦
02
)(𝑦
0
𝑦) = 𝐶
再积分得到
𝑥 = 𝐶
1
(𝜃
1
2
sin 2𝜃) + 𝐶
2
𝑦 = 𝑦
0
𝐶
1
sin
2
𝜃
代入初始值即可将常数解出