狭义相对论
目录
1 张量分析 3
1.1 张量的引入 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 上标, 下标, 协变与逆变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 爱因斯坦求和约定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1 重复指标求和 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.2 张量的线性代数表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 度规 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 逆变基与协变基 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.2 度规与基的关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.3 指标升降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.4 平直三维空间的度规 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.5 坐标变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 四维坐标 8
2.1 光速不变原理与时空间隔 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 四维时空坐标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 洛伦兹变换-时空旋转变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 四维时空的物理量 12
3.1 物理量的分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2 四维间隔 (标量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1
3.3 固有时间 (标量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4 静止质量 (标量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.5 四维坐标 (矢量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.6 四维速度 (矢量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.6.1 速度变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.6.2 四维速度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.7 四维动量 (矢量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.8 四维力 (矢量) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.9 四维微商 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4 相对论力学 16
4.1 四维动量与三维动量和三维力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.2 四维动量与能量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1 张量分析
1.1 张量的引入
张量是一种具有多个分量的物理量, 它的引入与线性代数有关
在线性代数中, 列向量表示为
𝑥
1
𝑥
2
𝑥
3
但是这么写并不方便, 需要将所有分量都写出来. 为了简化表示,暂时用下标代表所有分量,
𝑥
𝜇
𝑥
1
𝑥
2
𝑥
3
此处 𝜇 取遍所有可能的值,𝑥
1
就代表第一个分量,𝑥
2
代表第二个分量, 以此类推
矩阵也可以用下标表示,
𝑎
𝜇𝜈
=
𝑎
11
𝑎
12
𝑎
13
𝑎
21
𝑎
22
𝑎
23
𝑎
31
𝑎
32
𝑎
33
1.2 上标, 下标, 协变与逆变
张量形式上是线性代数中的矩阵和向量, 但它本质上是一个物理量, 它在不同坐标系下的形式也有所不同.
考察一个旋转变换, 设坐标系 𝑆
相对于 𝑆 逆时针旋转 𝜃 , 那么基矢的变换关系为
ˆ
x
= cos 𝜃 ˆx + sin 𝜃 ˆy
ˆ
y
= sin 𝜃 ˆx + cos 𝜃 ˆy
有逆变换
ˆx = cos 𝜃
ˆ
x
sin 𝜃
ˆ
y
ˆy = sin 𝜃
ˆ
x
+ cos 𝜃
ˆ
y
若点 𝑃 𝑆 系下的坐标为 (𝑥, 𝑦), 𝑆
系下的坐标为 (𝑥
, 𝑦
), 那么它有坐标变换关系
𝑥
= cos 𝜃𝑥 sin 𝜃𝑦
𝑦
= sin 𝜃𝑥 + cos 𝜃𝑦
这正是基矢的逆变换关系, 那么称坐标张量是一个逆变张量,
逆变张量: 坐标变换时, 张量的分量的变换遵循坐标基矢的逆变换关系
用上标表示逆变张量, 如坐标张量表示为
𝑥
𝜇
, 𝑥
1
= 𝑥, 𝑥
2
= 𝑦
可以同样定义协变张量
协变张量: 坐标变换时, 张量的分量的变换遵循坐标基矢的正变换关系
为了和逆变张量区分,用下标表示协变张量. 由于旋转变换是正交变换, 的逆变换对应的矩阵正是它正
变换对应矩阵的转置, 那么如果将坐标写为行向量, 它就会变为一个协变张量
𝑥
𝜇
= [𝑥
1
𝑥
2
], [𝑥
1
𝑦
2
] = [𝑥
1
𝑦
2
]
"
cos 𝜃 sin 𝜃
sin 𝜃 cos 𝜃
#
实际上, 个张量中既有逆变分量又有协变分量. 此时协变维度的分量用下标表示, 逆变维度的分量用
标表示,
𝑇
𝜇
𝜈
它的 𝜇 度是逆变的, 𝜈 维度是协变的. 在坐标变换时,𝜇 维度的分量遵循逆变换关, 𝜈 维度的分
量遵循协变换关系. , 若有坐标旋转变换
ˆ
x
= cos 𝜃 ˆx + sin 𝜃 ˆy
ˆ
y
= sin 𝜃 ˆx + cos 𝜃 ˆy
则变换后的张量 𝑇
𝑇
𝜇
𝜈
"
𝑇
1
1
𝑇
1
2
𝑇
2
1
𝑇
2
2
#
=
"
cos 𝜃 sin 𝜃
sin 𝜃 cos 𝜃
#"
𝑇
1
1
𝑇
1
2
𝑇
2
1
𝑇
2
2
#"
cos 𝜃 sin 𝜃
sin 𝜃 cos 𝜃
#
1.3 爱因斯坦求和约定
1.3.1 重复指标求和
爱因斯坦求和约定即对重复出现的指标遍历求和, 将其消去,
𝑠
2
= 𝑥
𝜇
𝑥
𝜇
= 𝑥
1
𝑥
1
+ 𝑥
2
𝑥
2
+ 𝑥
3
𝑥
3
𝑎
𝜇
𝜈
𝑏
𝜈
= 𝑐
𝜇
𝑎
1
1
𝑎
1
2
𝑎
1
3
𝑎
2
1
𝑎
2
2
𝑎
2
3
𝑎
3
1
𝑎
3
2
𝑎
3
3
𝑏
1
𝑏
2
𝑏
3
=
𝑐
1
𝑐
2
𝑐
3
需要注意的是, 爱因斯坦求和约定只能消去一个上标和一个下标, 这是为了保证张量的逆变与协变性质不
1.3.2 张量的线性代数表示
需要注意的是, 张量不是线性代数中的矩阵和向量, 以上两节使用的矩阵和向量仅仅是一个记号, 是利
用对应位置相等来方便地表达变换关. 利用线性代数中的向量和矩阵可以非常直观地表示一阶和二阶
张量即它们的性质. 为了更加严谨地使用线性代数的语言, 约定
将下标写为矩阵的列, 上标写为矩阵的行
那么一个一阶协变张量就能写为行向量
𝑥
𝜇
[
𝑥
1
𝑥
2
𝑥
3
]
一个一阶逆变张量就能写为列向量
𝑥
𝜇
𝑥
1
𝑥
2
𝑥
3
二阶既有逆变又有协变分量的张量就能写为矩阵
𝑇
𝜇
𝜈
𝑇
1
1
𝑇
1
2
𝑇
1
3
𝑇
2
1
𝑇
2
2
𝑇
2
3
𝑇
3
1
𝑇
3
2
𝑇
3
3
用爱因斯坦求和约定表示的张量积也能用矩阵乘法表示
𝑇
𝜈
𝜇
𝑥
𝜇
𝑇
1
1
𝑇
1
2
𝑇
1
3
𝑇
2
1
𝑇
2
2
𝑇
2
3
𝑇
3
1
𝑇
3
2
𝑇
3
3
𝑥
1
𝑥
2
𝑥
3
, 𝑇
𝜈
𝜇
𝑥
𝜈
[𝑥
1
𝑥
2
𝑥
3
]
𝑇
1
1
𝑇
1
2
𝑇
1
3
𝑇
2
1
𝑇
2
2
𝑇
2
3
𝑇
3
1
𝑇
3
2
𝑇
3
3
𝑇
𝜇
𝛼
𝐻
𝛼
𝜈
𝑇
1
1
𝑇
1
2
𝑇
1
3
𝑇
2
1
𝑇
2
2
𝑇
2
3
𝑇
3
1
𝑇
3
2
𝑇
3
3
𝐻
1
1
𝐻
1
2
𝐻
1
3
𝐻
2
1
𝐻
2
2
𝐻
2
3
𝐻
3
1
𝐻
3
2
𝐻
3
3
但是这种表示是有局限的, 比如 𝑇
𝜇𝜈
在这种约定下就无法用矩阵表示. 因而虽然在良好的约定下张量可以
用矩阵和向量表示, 但是张量绝不能理解成矩阵和向量
1.4 度规
1.4.1 逆变基与协变基
上面的讨论都是基于坐标的, 于一个空, 可以选取若干个基矢. 基矢的变换当然与基矢的变换规律相
, 因而它们拼成的张量是协变的. 此处假定空间由两个基矢张成
e
𝜇
(𝑒
1
, 𝑒
2
)
真实的位置应是基矢的线性组合, 组合系数即为坐标,
P = 𝑥
𝜇
e
𝜇
, Q = 𝑥
𝜈
e
𝜈
考虑内积
P · Q = 𝑥
𝜇
𝑥
𝜈
e
𝜇
· e
𝜈
但是由于 𝑒
𝜇
· 𝑒
𝜈
的值并不确定, 这样不便于计算. 因而引入逆变基矢 e
𝜇
, 使得
𝑒
𝜇
· 𝑒
𝜈
= 𝛿
𝜇
𝜈
若将 P 用逆变基展开, 它的坐标就是一个协变张量
P = 𝑥
𝜇
e
𝜇
内积就可以写为
P · Q = 𝑥
𝜇
𝑥
𝜈
𝑒
𝜇
· 𝑒
𝜈
= 𝛿
𝜇
𝜈
𝑥
𝜇
𝑥
𝜈
= 𝑥
𝜇
𝑥
𝜇
1.4.2 度规与基的关系
考虑协变基和逆变基的关系.
𝑒
𝜇
= 𝑔
𝜇𝜈
𝑒
𝜈
其中 𝑔
𝜇𝜈
称为度量张量的逆变分量. 希望求得 𝑔
𝜇𝜈
的表达式, 考察内积
𝑒
𝜇
· 𝑒
𝜈
= 𝑔
𝜇 𝛼
𝑒
𝛼
· 𝑒
𝜈
= 𝑔
𝜇 𝛼
𝛿
𝜈
𝛼
= 𝑔
𝜇𝜈
同理可以设
𝑒
𝜇
= 𝑔
𝜇𝜈
𝑒
𝜈
其中 𝑔
𝜇𝜈
称为度量张量的协变分量. 同样利用内积求得 𝑔
𝜇𝜈
的表达式
𝑒
𝜇
· 𝑒
𝜈
= 𝑔
𝜇 𝛼
𝑒
𝛼
· 𝑒
𝜈
= 𝑔
𝜇 𝛼
𝛿
𝛼
𝜈
= 𝑔
𝜇𝜈
由于做内积的矢量其顺序是可以交换的, 那么 𝑔
𝜇𝜈
𝑔
𝜇𝜈
应当是对称的,
𝑔
𝜇𝜈
= 𝑔
𝜈𝜇
, 𝑔
𝜇𝜈
= 𝑔
𝜈𝜇
希望得到 𝑔
𝜇𝜈
𝑔
𝜇𝜈
的关系, 考察协变基与逆变基的内积
𝑒
𝜇
· 𝑒
𝜈
= 𝑔
𝜇 𝛼
𝑒
𝛼
· 𝑒
𝜈
= 𝑔
𝜈 𝛼
𝑔
𝜇 𝛼
又有
𝑒
𝜇
· 𝑒
𝜈
= 𝛿
𝜈
𝜇
那么就有
𝑔
𝜈 𝛼
𝑔
𝜇 𝛼
= 𝛿
𝜈
𝜇
也就是说它们是互逆的关系
𝑔
𝜇𝜈
= 𝑔
1
𝜇𝜈
如果把它们写为矩阵的形式, 它们就互为对方的逆矩阵
1.4.3 指标升降
矢量 P 应该既可以按照逆变基展开, 也可以按照协变基展开. 这两种基下的坐标应当有关系. 即逆变张量
与协变张量有关系
P = 𝑥
𝜇
e
𝜇
= 𝑥
𝜈
e
𝜈
那么
P · e
𝜇
= 𝑥
𝛼
e
𝛼
· e
𝜇
= 𝑥
𝜇
P · e
𝜈
= 𝑥
𝛼
e
𝛼
· e
𝜈
= 𝑥
𝜈
也就是说
𝑥
𝜇
= P · e
𝜇
= 𝑥
𝜈
e
𝜈
· e
𝜇
= 𝑥
𝜈
𝑔
𝜈𝜇
𝑥
𝜈
= P · e
𝜈
= 𝑥
𝛼
e
𝛼
· e
𝜈
= 𝑥
𝜇
𝑔
𝜇𝜈
这就是逆变张量与协变张量的关系, 即指标的升降
1.4.4 平直三维空间的度规
对于平直的三维空间, 选取协变基为 ˆx, ˆy, ˆz, 由于
ˆx · ˆx = 1, ˆy · ˆy = 1, ˆz · ˆz = 1
ˆx · ˆy = 0, ˆx · ˆz = 0, ˆy · ˆz = 0
那么得到 𝑔
𝜇𝜈
的表达式
𝑔
𝜇𝜈
= 𝑒
𝜇
· 𝑒
𝜈
=
1 𝜇 = 𝜈
0 𝜇 𝜈
用矩阵的行代表第一个指标, 列代表第二个指标, 那么 𝑔
𝜇𝜈
就写为矩阵
𝑔
𝜇𝜈
=
1 0 0
0 1 0
0 0 1
对其求逆即可得到 𝑔
𝜇𝜈
𝑔
𝜇𝜈
=
1 0 0
0 1 0
0 0 1
1
=
1 0 0
0 1 0
0 0 1
= 𝑔
𝜇𝜈
1.4.5 坐标变换
虽然基的变换矩阵并不是一个张量, 但为了利用爱因斯坦求和约, 们可以将其写为张量的形式. 基矢
的变换用张量的符号表示为 (上标写为行, 下标写为列)
𝑎
𝜇
𝜈
"
𝑎
1
1
𝑎
1
2
𝑎
2
1
𝑎
2
2
#
=
"
cos 𝜃 sin 𝜃
sin 𝜃 cos 𝜃
#
协变基矢的变换即
𝑒
𝜇
= 𝑎
𝜈
𝜇
𝑒
𝜈
[𝑒
1
𝑒
2
] = [𝑒
1
𝑒
2
]
"
cos 𝜃 sin 𝜃
sin 𝜃 cos 𝜃
#
𝑆 𝑆
的变换就写为
𝑥
𝜇
= 𝑎
𝜇
𝜈
𝑥
𝜈
"
cos 𝜃 sin 𝜃
sin
𝜃
cos
𝜃
#"
𝑥
1
𝑥
2
#
对于一个张量 𝑇
𝜇
𝜈
, 它的变换关系为
𝑇
𝛽
𝛼
= 𝑎
𝜇
𝛼
𝑇
𝜈
𝜇
𝑎
𝛽
𝜈
2 四维坐标
2.1 光速不变原理与时空间隔
每个事件是四维时空的一个点, 称为世界点, 一个粒子的所有事件构成一条曲线, 即其世界线
光速不变原理即在任意参考系下光速不变. 希望构造一个不依赖于参考系的量来描述两个事件之间的间
, 简单起见先考察由光联系的事件, 记惯性系 𝑆 下的两事件
𝑃
1
(𝑥
1
, 𝑦
1
, 𝑧
1
, 𝑡
1
), 一束光发出
𝑃
2
(𝑥
2
, 𝑦
2
, 𝑧
2
, 𝑡
2
), 这束光被受到
那么它们之间的空间距离与时间就可以由光速联系
(𝑥
2
𝑥
1
)
2
+ (𝑦
2
𝑦
1
)
2
+ (𝑧
2
𝑧
1
)
2
= 𝑐
2
(𝑡
2
𝑡
1
)
2
由于光速在任何惯性系下都是不变的, 对于另一个惯性系 𝑆
, 新的坐标也应当满足
(𝑥
2
𝑥
1
)
2
+ (𝑦
2
𝑦
1
)
2
+ (𝑧
2
𝑧
1
)
2
= 𝑐
2
(𝑡
2
𝑡
1
)
2
若定义
𝑠
2
(𝑥
2
𝑥
1
)
2
+ (𝑦
2
𝑦
1
)
2
+ (𝑧
2
𝑧
1
)
2
𝑐
2
(𝑡
2
𝑡
1
)
2
那么对于这两个事件而言, 在任意惯性系下都有 𝑠 = 𝑠
. 实际上, 这样的定义的间隔 𝑠 与参考系无关
时空的均匀性要求同一世界点在不同惯性系下的坐标变换是线性变. 考虑两个事件 𝑃, 𝑄 𝑆 𝑆
下的坐标, 它们都是一阶逆变张量, 依照上文张量的线性代数表示, 记为列向量 X, X
, Y , Y
𝑃 : X = (𝑥
1
𝑦
1
𝑧
1
𝑖𝑐𝑡
1
)
𝑇
𝑄 : Y = (𝑥
2
𝑦
2
𝑧
2
𝑖𝑐𝑡
2
)
𝑇
𝑃
: X
= (𝑥
1
𝑦
1
𝑧
1
𝑖𝑐𝑡
1
)
𝑇
𝑄
: Y
= (𝑥
2
𝑦
2
𝑧
2
𝑖𝑐𝑡
2
)
𝑇
假定存在从 𝑆 𝑆
的坐标变换 𝑓 , 它是一个向量值函数, 那么
X
= 𝑓 (X), Y
= 𝑓 (Y )
对其作差, 得到
X
Y
= 𝑓 (X) 𝑓 (Y )
时空的均匀性表明, 坐标原点的选择并不会改变坐标差值. 那么令
X X + b, Y Y + b
𝑓 (X) 𝑓 (Y ) = 𝑓 (X + b) 𝑓 (Y + b)
X 的一个坐标分量 𝑥
𝑖
求导, Y 被消去, 得到
𝜕 𝑓 (X)
𝜕𝑥
𝑖
=
𝜕 𝑓 (X + b)
𝜕𝑥
𝑖
又由于
𝜕 𝑓 (X + b)
𝜕𝑥
𝑖
=
𝜕 𝑓 (X)
𝜕𝑥
𝑖
X=X +b
那么
𝜕 𝑓 (X)
𝜕𝑥
𝑖
=
𝜕 𝑓 (X)
𝜕𝑥
𝑖
X=X +b
由于 b 是任意的, 那么
𝜕 𝑓 (X)
𝜕𝑥
𝑖
就只能是常数, 𝑓 是线性变换
假定 𝑆 𝑆
之间的变换由一个线性变换给出
X
= AX + B, Y
= AY + B
那么它们的差值
X
Y
= A(X Y )
平方得到
(X
Y
)
𝑇
(X
Y
) = (X Y )
𝑇
A
𝑇
A(X Y )
考虑上文定义的间隔 𝑠
𝑠
2
= (X Y )
𝑇
(X Y ) (𝑥
2
𝑥
1
)
2
+ (𝑦
2
𝑦
1
)
2
+ (𝑧
2
𝑧
1
)
2
𝑐
2
(𝑡
2
𝑡
1
)
2
前面已经证明了 𝑠 若为零, 则在任意的惯性系下都为零, 那么
(X Y )
𝑇
(X Y ) = 0 (X Y )
𝑇
A
𝑇
A(X Y ) = 0
由于 𝐴
𝑇
𝐴 是一个对称阵, 右边实际上是一个二次型. 将矩阵元素展开写为
𝑥
2
1
+ 𝑥
2
2
+ 𝑥
2
3
+ 𝑥
2
4
= 𝑎
11
𝑥
2
1
+ 𝑎
22
𝑥
2
2
+ 𝑎
33
𝑥
2
3
+ 𝑎
44
𝑥
2
4
+ 2(𝑎
12
𝑥
1
𝑥
2
+ 𝑎
13
𝑥
1
𝑥
3
+ 𝑎
14
𝑥
1
𝑥
4
+ 𝑎
23
𝑥
2
𝑥
3
+ 𝑎
24
𝑥
2
𝑥
4
+ 𝑎
34
𝑥
3
𝑥
4
)
该式对任意 𝑥
2
1
+ 𝑥
2
2
+ 𝑥
2
3
+ 𝑥
2
4
= 0 都成立. 那么不妨令 𝑥
3
= 𝑥
4
= 0,𝑥
1
= 𝑖𝑥
2
𝑎
11
+ 𝑎
22
+ 2𝑖𝑎
12
= 0
𝑥
3
= 𝑥
4
= 0,𝑥
2
= 𝑖𝑥
1
𝑎
11
𝑎
22
+ 2𝑖𝑎
12
= 0
两式相加得到 𝑎
12
= 0, 代入又得到 𝑎
11
= 𝑎
22
. 同理可以证明所有非对角元为零
𝑎
12
= 𝑎
13
= 𝑎
14
= 𝑎
23
= 𝑎
24
= 𝑎
34
= 0
并且所有对角元相等
𝑎
11
= 𝑎
22
= 𝑎
33
= 𝑎
44
因而 A
𝑇
A 是一个数量阵, 那么
X
Y
2
= 𝜆
|
X Y
|
2
由于不同参考系之间仅有速度 v 的差异, 那么 𝜆 应当仅是 v 的函数,
X
Y
2
= 𝜆(v)
|
X Y
|
2
由于空间的均匀性,𝜆 应该与 𝑣 的方向无关, 而仅与大小 𝑣 有关
X
Y
2
= 𝜆(𝑣)
|
X Y
|
2
由于各参考系平权, 𝑆
系中应当看到 𝑆 系相对它的速度为 v, 那么
|
X Y
|
2
= 𝜆(𝑣)
X
Y
2
因而比例系数满足
𝜆
2
= 1
由于
|
X Y
|
是实数, 因而 𝜆 = ±1; 再考虑到 𝑣 = 0 的时候变换应当是恒等变换,𝜆 = 1. 那么
𝜆 = 1
即对于任意惯性系 𝑆 𝑆
, 其中的
时空间隔均相等
X
Y
2
=
|
X Y
|
2
2.2 四维时空坐标
若定义四维坐标
(𝑥, 𝑦, 𝑧, 𝑖𝑐𝑡) = (𝑥
1
, 𝑥
2
, 𝑥
3
, 𝑥
4
) 𝑥
𝜇
希望求解出它的度规, 利用时空间隔是两个四维坐标的内积
𝑠
2
= 𝑥
2
+ 𝑦
2
+ 𝑧
2
𝑐
2
𝑡
2
𝑥
𝜇
𝑔
𝜇𝜈
𝑥
𝜈
由此得到度规 (以第一个指标为行, 第二个指标为列)
𝑔
𝜇𝜈
=
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
因而如此定义的四维坐标满足
𝑥
𝜇
= 𝑥
𝜇
, P · Q = 𝑥
𝜇
𝑥
𝜇
一个作匀速直线运动的粒子在四维时空中的轨迹是一根直线; 静止粒子的运动速度为零, 其轨迹平行于时
间轴, 即空间坐标不变, 仅时间坐标改变
粒子在与自身静止坐标系中的轨迹是一根平行于时间轴的直线, 同惯性系的坐标变换实际上是四维空
间的旋转变换
2.3 洛伦兹变换-时空旋转变换
由于参考系变换是一个线性变换, 并且保持时空间隔不变, 那么它就应该是一个旋转变换
为方便起见, 设粒子的速度沿 𝑆 系的 𝑥
1
, 么它在 𝑆 的轨迹就在 𝑥
1
𝑥
4
平面内, 与时间轴 𝑥
4
的夹角
𝜑 满足
tan 𝜑 =
𝑥
1
𝑥
4
=
𝑥
𝑖𝑐𝑡
=
𝑣
𝑖𝑐
由于 𝜑 (90
, 90
), 得到
sin 𝜑 =
𝑖𝑣
𝑐
r
1
𝑣
2
𝑐
2
, cos 𝜑 =
1
r
1
𝑣
2
𝑐
2
为了简化公式,
𝛽 =
𝑣
𝑐
, 𝛾 =
1
p
1 𝛽
2
sin 𝜑 = 𝑖𝛽𝛾, cos 𝜑 = 𝛾
若以粒子的四维轨迹方向为 𝑥
4
, 保持 𝑥
2
, 𝑥
3
轴不变, 则对时空中同一个点而言,𝑆
系下的坐标相当于
𝑆 系下的坐标反方向旋转了 𝜑 ,
𝑥
1
= 𝑥
1
cos 𝜑 𝑥
4
sin 𝜑
𝑥
4
= 𝑥
1
sin 𝜑 + 𝑥
4
cos 𝜑
代入得到
𝑥
1
= 𝛾𝑥
1
+ 𝑖 𝛽𝛾𝑥
4
𝑥
4
= 𝛾𝑥
4
𝑖 𝛽𝛾𝑥
1
可以将其写为张量的形式
𝑥
𝜇
= 𝑎
𝜇
𝜈
𝑥
𝜈
, 𝑥
𝜇
=
˜
𝑎
𝜇
𝜈
𝑥
𝜈
其中
𝑎
𝜇
𝜈
𝛾 0 0 𝑖𝛽𝛾
0 1 0 0
0 0 1 0
𝑖𝛽𝛾 0 0 𝛾
,
˜
𝑎
𝜇
𝜈
𝛾 0 0 𝑖𝛽𝛾
0 1 0 0
0 0 1 0
𝑖𝛽𝛾 0 0 𝛾
实际上
˜
𝑎 = 𝑎
1
,
˜
𝑎 = 𝑎
𝑇
3 四维时空的物理量
3.1 物理量的分类
四维时空中的坐标系旋转就是惯性系的变换, 其中中的物理量也由同样的分类
1. 标量 (0 阶张量): 惯性系之间变换时, 数值不变
𝐴 = 𝐴
2. 矢量 (1 阶张量): 惯性系之间变换时, 按洛伦兹变换
𝐴
𝜇
= 𝑎
𝜇
𝜈
𝐴
𝜈
3. 张量 (2 阶张量): 惯性系之间变换时, 按两重洛伦兹变换
𝐴
𝜇
𝜈
= 𝑎
𝜇
𝛼
𝐴
𝛼
𝛽
𝑎
𝛽
𝜈
此处需要注意,𝑎
𝛽
𝛼
是对 𝛼 指标进行变换的张量, 𝑎
𝜇
𝜈
是对 𝜇 指标进行变换的张量, 它们不是同一个
张量
若方程中各项具有相同的类, 则经过惯性系转换后形式保持不变, 方程在洛伦兹变换下是协变的.
方程表达的物理规律符合相对性原理
𝐹
𝜇𝜈
= 𝐺
𝜇𝜈
𝐹
𝜇𝜈
= 𝑎
𝛼
𝜇
𝑎
𝛽
𝜈
𝐹
𝛼𝛽
= 𝑎
𝛼
𝜇
𝑎
𝛽
𝜈
𝐺
𝛼𝛽
= 𝐺
𝜇𝜈
正如三维矢量一样, 四维矢量的模长应当是一个标量, 这是因为
𝐴
𝜇
𝐴
𝜇
= (𝑎
𝜈
𝜇
𝐴
𝜈
)(𝑎
𝜇
𝛼
𝐴
𝛼
) = 𝐴
𝜈
𝑎
𝜈
𝜇
𝑎
𝜇
𝛼
𝐴
𝛼
由于 𝑎
𝜈
𝜇
𝑎
𝜇
𝛼
分别是对下标和上标的变换, 因而它们是互逆的关系,
𝑎
𝜈
𝜇
𝑎
𝜇
𝛼
= 𝛿
𝜈
𝛼
那么
𝐴
𝜇
𝐴
𝜇
= 𝐴
𝜈
𝛿
𝜈
𝛼
𝐴
𝛼
= 𝐴
𝜈
𝐴
𝜈
那么它就是一个标量
3.2 四维间隔 (标量)
如前文所述, 四维间隔 𝑠 与参考系无关, 显然它应该是一个标量. 让我们再次写出它的定义
𝑠
2
= 𝑥
𝜇
𝑥
𝜇
= 𝑥
2
+ 𝑦
2
+ 𝑧
2
𝑐
2
𝑡
2
3.3 固有时间 (标量)
固有时间 𝜏 定义为粒子在自身静止坐标系中的时间, 它显然与参考系无关, 因而也是一个标量
记粒子参考系为 𝑆
, 静止系为 𝑆, 那么两个参考系中的时间由洛伦兹变换联系
𝑡 = 𝛾
𝑡
+
𝑣
𝑐
2
𝑥
那么微分就有
d𝑡 = 𝛾d𝑡
+ 𝛾
𝑣
𝑐
2
d𝑥
时钟位置与物体保持相对静止, 也就是说 𝑆
系中时钟位置保持不变, d𝑥
= 0, 代入得到
d𝑡 = 𝛾d𝑡
此时 d𝑡
即为固有时间 d𝜏,
d𝜏 =
1
𝛾
d𝑡
3.4 静止质量 (标量)
静止质量 𝑚
0
是粒子在自身静止坐标系中的质量, 它显然与参考系无关, 因而也是一个标量
3.5 四维坐标 (矢量)
洛伦兹变换描述的就是四维坐标的变换, 因而四维坐标是一个矢量. 在此再次写出四维坐标的定义
𝑥
𝜇
(𝑥
1
, 𝑥
2
, 𝑥
3
, 𝑥
4
) = (𝑥, 𝑦, 𝑧, 𝑖𝑐𝑡)
3.6 四维速度 (矢量)
3.6.1 速度变换
由洛伦兹变换
𝑥
1
= 𝛾𝑥
1
+ 𝑖 𝛽𝛾𝑥
4
𝑥
4
= 𝛾𝑥
4
𝑖 𝛽𝛾𝑥
1
𝑥
= 𝛾(𝑥 𝑣𝑡), 𝑡
= 𝛾(𝑡 𝑣𝑥/𝑐
2
)
那么对其求导得到
d𝑥
= 𝛾(d𝑥 𝑣d𝑡), d𝑡
= 𝛾(d𝑡 𝑣d𝑥/𝑐
2
)
因而
d𝑥
d𝑡
=
d𝑥 𝑣d𝑡
d𝑡 𝑣d𝑥/𝑐
2
=
d𝑥
d𝑡
𝑣
1 𝑣
d𝑥
d𝑡
/𝑐
2
=
𝑢
𝑥
𝑣
1 𝑣𝑢
𝑥
/𝑐
2
同理可以得到 𝑦
, 𝑧
方向的速度, 写在一起即
𝑢
𝑥
=
𝑢
𝑥
𝑣
1 𝑣𝑢
𝑥
/𝑐
2
, 𝑢
𝑦
=
𝑢
𝑦
𝛾(1 𝑣𝑢
𝑥
/𝑐
2
)
, 𝑢
𝑧
=
𝑢
𝑧
𝛾(1 𝑣𝑢
𝑥
/𝑐
2
)
3.6.2 四维速度
传统意义上的速度并不具备四维时空物理量的性, 望找到四维速度使之在不同参考系下的变换是洛
伦兹变换
四维坐标的变换满足洛伦兹变换, 那么它的微分也应当满足洛伦兹变换
d𝑥
𝜇
(d𝑥
1
, d𝑥
2
, d𝑥
3
, d𝑥
4
) = (𝑑𝑥, 𝑑𝑦, 𝑑𝑧, 𝑖𝑐𝑑𝑡)
还需要一个时间的微分. 正好固有时间 𝜏 与参考系无关, 那么除以 d𝜏 就得到了期望中的四维速度
𝑢
𝜇
=
d𝑥
𝜇
d𝜏
由微分的传递性, 可以得到四维速度与传统意义上速度的关系
𝑢
𝜇
=
d𝑥
𝜇
d𝜏
=
d𝑥
𝜇
d𝑡
d𝑡
d𝜏
= 𝛾
d𝑥
𝜇
d𝑡
因而
𝑢
𝜇
(𝑢
1
, 𝑢
2
, 𝑢
3
, 𝑢
4
) = 𝛾(𝑢
𝑥
, 𝑢
𝑦
, 𝑢
𝑧
, 𝑖𝑐)
3.7 四维动量 (矢量)
从四维速度出发, 于静止质量与参考系无关, 么可以如下构造四维动量, 在不同参考系下的变换也
是洛伦兹变换
𝑝
𝜇
= 𝑚
0
𝑢
𝜇
它与传统意义上的动量的关系为
𝑝
𝜇
= 𝑚
0
𝑢
𝜇
= 𝑚
0
𝛾(𝑢
𝑥
, 𝑢
𝑦
, 𝑢
𝑧
, 𝑖𝑐) = 𝛾 ( 𝑝
𝑥
, 𝑝
𝑦
, 𝑝
𝑧
, 𝑖𝑚
0
𝑐)
3.8 四维力 (矢量)
类似于四维速度的构造方式, 由于四维动量的变换是洛伦兹变换, 那么四维动量的微分应当也是洛伦兹变
, 再除以固有时间的微分, 定义四维力
𝐾
𝜇
=
d𝑝
𝜇
d𝜏
3.9 四维微商
定义四维微商算符
𝜕
𝜇
=
𝜕
𝜕𝑥
𝜇
它是一个矢量, 在某个给定的的参考系下, 它写为
𝜕
𝜇
=
,
1
𝑖𝑐
𝜕
𝜕𝑡
四维微商算符作用在标量场上具有矢量性质
𝜕𝜑
𝜕𝑥
𝜇
=
𝜕𝜑
𝜕𝑥
𝜇
=
𝜕𝜑
𝜕𝑥
𝜇
=
𝜕𝜑
𝜕𝑥
𝜈
𝜕𝑥
𝜈
𝜕𝑥
𝜇
=
˜
𝑎
𝜈𝜇
𝜕𝜑
𝜕𝑥
𝜈
= 𝑎
𝜇𝜈
𝜕𝜑
𝜕𝑥
𝜈
作用在矢量场上, 各分量
𝜕 𝐴
𝜇
𝜕𝑥
𝜇
具有标量性质
𝜕 𝐴
𝜇
𝜕𝑥
𝜇
=
𝜕 𝐴
𝜇
𝜕𝑥
𝜇
=
𝜕
𝜕𝑥
𝜇
𝑎
𝜇𝜈
𝐴
𝜈
= 𝑎
𝜇𝜈
𝜕 𝐴
𝜈
𝜕𝑥
𝜆
𝜕𝑥
𝜆
𝜕𝑥
𝜇
= 𝑎
𝜇𝜈
˜
𝑎
𝜆𝜇
𝜕 𝐴
𝜈
𝜕𝑥
𝜆
= 𝐼
𝜈𝜆
𝜕 𝐴
𝜈
𝜕𝑥
𝜆
=
𝜕 𝐴
𝜈
𝜕𝑥
𝜈
作用在矢量场上,
𝜕 𝐴
𝜇
𝜕𝑥
𝜈
具有张量性质
𝜕 𝐴
𝜇
𝜕𝑥
𝜈
= 𝑎
𝜇 𝛼
𝑎
𝜈𝛽
𝜕 𝐴
𝛼
𝜕𝑥
𝛽
可以定义 d’Alembert 算符
= 𝜕
𝜇
𝜕
𝜇
=
2
1
𝑐
2
𝜕
𝜕𝑡
它是一个标量算符, 在任意惯性系下具有相同的形式
4 相对论力学
4.1 四维动量与三维动量和三维力
考察四维力
𝐾
𝜇
=
d𝑝
𝜇
d𝜏
=
d𝑝
𝜇
d𝑡
d𝑡
d𝜏
= 𝛾
d𝑝
𝜇
d𝑡
注意此处用到了
d𝑡
d𝜏
= 𝛾, 它的定义需要明确
𝛾 =
1
r
1
𝑣
2
𝑐
2
此时的两个参考系为物体静止参考系 𝑆
和观察者参考系 𝑆,
𝑣 即为物体相对于观察者的速度
由于四维动量满足
𝑝
𝜇
( 𝑝
1
, 𝑝
2
, 𝑝
3
, 𝑝
4
) = 𝑚
0
𝛾(𝑣
𝑥
, 𝑣
𝑦
, 𝑣
𝑧
, 𝑖𝑐)
前三维与传统意义上的动量相差系 𝛾. 在低速情况下 𝛾 1, 它将变为传统意义上的动量. 因而不妨认
四维动量的前三维正是三维空间中能够观测到的动量,
p = (𝑝
1
, 𝑝
2
, 𝑝
3
) = 𝛾𝑚
0
(𝑣
𝑥
, 𝑣
𝑦
, 𝑣
𝑧
) = 𝛾𝑚
0
v
若仍要采取传统的力学观点, 认为 p = 𝑚u, 那么只能认为质量发生改变
𝑚 = 𝛾𝑚
0
此时前三维的力学方程为
𝐾
𝜇
= 𝛾
dp
d𝑡
= 𝛾F , 𝜇 = 1, 2, 3
F 即为传统意义上的力, 也就是按照牛顿力学规律能测量得到的力
4.2 四维动量与能量
希望考察四维动量第四维的物理意义, 设第四维有形式
𝑝
4
= 𝑖𝑚
0
𝛾𝑐 𝑖
𝑊
𝑐
四维动量的模长是一个标量. 求其模平方为
𝑝
𝜇
𝑝
𝜇
= 𝑝
2
𝑊
2
𝑐
2
量与考系, 它的应当与相静止参考中的相同. 对静的参系中, 然有
𝑢
𝑥
= 𝑢
𝑦
= 𝑢
𝑧
= 0, 𝛾 = 1, 那么
𝑝
𝜇
𝑝
𝜇
= 𝑚
2
0
𝑐
2
因而
𝑝
2
𝑊
2
𝑐
2
= 𝑚
2
0
𝑐
2
解得
𝑊 =
q
𝑝
2
𝑐
2
+ 𝑚
2
0
𝑐
4
为了考察它的物理意义, 对其作微分
d𝑊
d𝑡
=
d
d𝑡
q
𝑝
2
𝑐
2
+ 𝑚
2
0
𝑐
4
=
d
d𝑡
q
p
2
𝑐
2
+ 𝑚
2
0
𝑐
4
=
𝑐
2
p
𝑊
·
dp
d𝑡
考虑到
𝑊 = 𝛾𝑚
0
𝑐
2
= 𝑚𝑐
2
, p = 𝑚v
那么
d𝑊
d𝑡
=
𝑚v
𝑚
·
dp
d𝑡
= v ·
dp
d𝑡
= v · F
非常显然地,𝑊 就是能量. 在与物体相对静止的参考系中,
𝑊
0
= 𝑚
0
𝑐
2
此时不应该有动能, 认为 𝑊
0
是物体的静能, 那么余下的部分就应该是物体因为运动而具有的动能
𝐸
𝑘
= 𝑊 𝑊
0
= (𝑚 𝑚
0
)𝑐
2
在低速情形下, 将其按小量 𝑣 展开并舍去高阶小量, 得到
𝐸
𝑘
=
1
2
𝑚𝑣
2
这正是牛顿力学给出的动能