von Neumann(冯·诺依曼)
目录
1 开始的开始 2
2 引言 2
3 随机矩阵 3
4 优化与偏序问题 4
5 Shur 凸函数 6
6 von Neumann 6
1
1 开始的开始
旋二分之一系讨论, 我们发现了纯态的 Bloch 向量在球面上, 混合态的 Bloch 在球
, 甚至于最大混合态的 Bloch 向量在球心. 这似乎可以作为衡量量子态 纯度 的一个指标
可惜的是, Bloch 向量仅在二能级系统中有定义. 为了 在更一般的情况下描述量子态的 纯度, 引入 von
Neumann
2 引言
考虑两个物理量 𝐴 𝐵, 它们有各自的本征值和本征矢
𝐴 :
|
𝛼
𝑖
, 𝐵 :
|
𝛽
𝑖
假定系统在某组基下展开, 那么会有密度矩阵 𝜌. 可以表示 𝐴 各个本征值的概率
𝑝
𝐴
=
𝑝
𝐴
1
𝑝
𝐴
2
· · · 𝑝
𝐴
𝑛
𝑇
=
𝛼
𝑖
|
𝜌
|
𝛼
𝑖
同理, 可以表示 𝐵 各个本征值的概率
𝑝
𝐵
=
𝑝
𝐵
1
𝑝
𝐵
2
· · · 𝑝
𝐵
𝑛
𝑇
=
𝛽
𝑖
|
𝜌
|
𝛽
𝑖
希望考察两组概率的关系, 那么可以对 𝑝
𝐵
进行变形
𝑝
𝐵
𝑗
=
𝛽
𝑗
𝜌
𝛽
𝑗
=
Õ
𝑚,𝑛
𝛽
𝑗
|𝛼
𝑚
𝛼
𝑚
|
𝜌
|
𝛼
𝑛
𝛼
𝑛
|𝛽
𝑗
为了简化, 假定在某组基下, 密度矩阵 𝜌 是对角的
𝜌 =
Õ
𝑖
𝜆
𝑖
|
𝜉
𝑖
𝜉
𝑖
|
, 𝜆
𝑖
=
𝜉
𝑖
|
𝜌
|
𝜉
𝑖
假定
|
𝜉
𝑖
是一个观测量 𝑋 的本征矢, 它具有本征值 𝑥
𝑖
𝑋 =
Õ
𝑖
𝑥
𝑖
|
𝜉
𝑖
𝜉
𝑖
|
由于 𝜌 𝑋 具有相同的本征矢, 它们应当对易
[𝑋, 𝜌] = 0
如对 𝑋 进行测量, 得到结果的概率为
𝑝
𝑋
=
(
𝜆
1
𝜆
2
· · · 𝜆
𝑛
)
𝑇
则可以将 𝑝
𝐴
表示为
𝑝
𝐴
=
Õ
𝑚,𝑛
𝛼
𝑖
|𝜉
𝑚
𝜉
𝑚
|
𝜌
|
𝜉
𝑛
𝜉
𝑛
|𝛼
𝑖
自然有
𝜉
𝑚
|
𝜌
|
𝜉
𝑛
=
𝛿
𝑚𝑛
𝜆
𝑚
那么
𝑝
𝐴
=
Õ
𝑛
|
𝛼
𝑖
|𝜉
𝑛
|
2
𝜆
𝑛
若定义一个矩阵 𝐷, 它的元素为
𝐷
𝑖 𝑗
=
𝛼
𝑖
|𝜉
𝑗
2
概率就可以表示为
𝑝
𝐴
= 𝐷 𝑝
𝑋
在继续讨论之前, 需要先了解
随机矩阵, 双随机矩阵, 酉随机矩阵
优化与偏序问题
Shur 凸函数
3 随机矩阵
随机矩阵是指矩阵的列表征着概率分布.N 行随机矩阵每列有 N 个元素, 它满足
1. 矩阵元非负
2. 矩阵的每一列元素之和为 1
双随机矩阵在随机矩阵的基础上, 要求矩阵的每一行元素之和为 1
1. 矩阵元非负
2. 矩阵的每一列元素之和为 1
3. 矩阵的每一行元素之和为 1
酉随机矩阵是该矩阵的矩阵元是某个酉矩阵的元素的模平方. 由于酉矩阵满足
𝑈
𝑈 = 𝐼
考察其对角元
Õ
𝑘
|
𝑈
𝑘𝑖
|
2
= 1
即证行是归一的; 对于列, 只需要对上式取复共轭即可
𝑈
𝑈 = 𝐼
考察其对角元
Õ
𝑘
|
𝑈
𝑖𝑘
|
2
= 1
即证列是归一的. 因此酉随机矩阵是双随机矩阵
4 优化与偏序问题
考虑两个序列 𝑥
𝑖
𝑦
𝑖
, 它们当中的元素降序排列. 若有它们的和相等
Õ
𝑖
𝑥
𝑖
=
Õ
𝑖
𝑦
𝑖
并且对于所有的 𝑘 = 1, 2, · · · , 𝑛, 都有前 𝑘 个元素的和 𝑥 𝑦
𝑘
Õ
𝑖=1
𝑥
𝑖
𝑘
Õ
𝑖=1
𝑦
𝑖
那么可以说序列 𝑦
𝑖
优于序列 𝑥
𝑖
, 记为
𝑥 < 𝑦
用下降箭头表示序列的降序性质 𝑝
, 该关系类似 , 有如下的性质
1. 𝑝
< 𝑝
2. 传递性
𝑝
< 𝑝
, 𝑝
< 𝑝
𝑝
< 𝑝
3. 可以确定序列相等
𝑝
= 𝑝
, 𝑝
< 𝑝
𝑝
= 𝑝
自然会有最不优的序列和最优的序列, 它们分别为
1
𝑛
1
𝑛
· · ·
1
𝑛
< 𝑝
<
(
1 0 · · · 0
)
此处有一个重要的定理
𝑥 < 𝑦 的充要条件是存在一个双随机矩阵 𝐵, 使得 𝑥 = 𝐵𝑦
充分性: 若存在双随机矩阵 𝐵 使得 𝑥 = 𝐵𝑦, 𝑥 𝑦
假设存在一个双随机矩阵 𝐵 使得 𝑥 = 𝐵𝑦, :
𝑥
𝑖
=
𝑛
Õ
𝑗=1
𝐵
𝑖 𝑗
𝑦
𝑗
, 对于所有𝑖 = 1, 2, . . . , 𝑛.
1)总和相等:
由于 𝐵 的行和为 1,
Í
𝑛
𝑗=1
𝐵
𝑖 𝑗
= 1, 所以:
𝑛
Õ
𝑖=1
𝑥
𝑖
=
𝑛
Õ
𝑖=1
𝑛
Õ
𝑗=1
𝐵
𝑖 𝑗
𝑦
𝑗
=
𝑛
Õ
𝑗=1
𝑦
𝑗
𝑛
Õ
𝑖=1
𝐵
𝑖 𝑗
!
=
𝑛
Õ
𝑗=1
𝑦
𝑗
· 1 =
𝑛
Õ
𝑗=1
𝑦
𝑗
.
因此,
Í
𝑛
𝑖=1
𝑥
𝑖
=
Í
𝑛
𝑖=1
𝑦
𝑖
.
2)部分和不超过:
对于任意 𝑘 = 1, 2, . . . , 𝑛, 考虑 𝑥 𝑦 的前 𝑘 项和.
首先
,
由于
𝑥
𝑖
=
Í
𝑛
𝑗=1
𝐵
𝑖 𝑗
𝑦
𝑗
,
所以
:
𝑘
Õ
𝑖=1
𝑥
𝑖
=
𝑘
Õ
𝑖=1
𝑛
Õ
𝑗=1
𝐵
𝑖 𝑗
𝑦
𝑗
=
𝑛
Õ
𝑗=1
𝑦
𝑗
𝑘
Õ
𝑖=1
𝐵
𝑖 𝑗
!
.
注意到对于每个 𝑗, 列和
Í
𝑛
𝑖=1
𝐵
𝑖 𝑗
= 1, 𝐵
𝑖 𝑗
0, 所以:
𝑘
Õ
𝑖=1
𝐵
𝑖 𝑗
𝑛
Õ
𝑖=1
𝐵
𝑖 𝑗
= 1.
由于 𝑦
1
𝑦
2
· · · 𝑦
𝑛
, 所以 𝑦
𝑗
𝑗 递减.
因此, 我们可以得到:
𝑘
Õ
𝑖=1
𝑥
𝑖
=
𝑛
Õ
𝑗=1
𝑦
𝑗
𝑘
Õ
𝑖=1
𝐵
𝑖 𝑗
!
𝑘
Õ
𝑗=1
𝑦
𝑗
· 1 =
𝑘
Õ
𝑗=1
𝑦
𝑗
.
这说明对于所有的 𝑘, 都有:
𝑘
Õ
𝑖=1
𝑥
𝑖
𝑘
Õ
𝑖=1
𝑦
𝑖
.
因此, 𝑥 𝑦. 必要性的证明是困难的, 可以通过构造的方式来证明, 此处不详细展开
5 Shur 凸函数
为了更直观判断两个序列的优劣, 引入 Shur 凸函数. 它将一个向量映射到一个实数, 并且满足
x y 𝑓 (x) 𝑓 (y)
物理学中熵函数就是一个 Shur 凸函数
𝑓 (x) =
Õ
𝑖
𝑥
𝑖
log 𝑥
𝑖
此外还有其他的 Shur 凸函数,
𝑓 (x) =
Ö
𝑖
𝑥
𝑥
𝑖
𝑖
6 von Neumann
为了引入 von Neumann , 先考虑经典的 Shannon . 𝑥 服从一个离散的概率分布
𝑝(𝑥 = 𝑥
𝑖
) = 𝑝
𝑖
那么 Shannon 熵定义为
𝐻(𝑥) =
Õ
𝑖
𝑝
𝑖
log 𝑝
𝑖
它能够表示一个经典系统观测结果的不确定性. 对于量子系统, 观测结果的概率分布与观测的物理量有关.
对于一个特定的物理量 𝐴, 它的概率分布为
𝑝
𝐴
=
𝑝
𝐴
1
𝑝
𝐴
2
· · · 𝑝
𝐴
𝑛
𝑇
它的经典 Shannon 熵为
𝐻( 𝐴) =
Õ
𝑖
𝑝
𝐴
𝑖
log 𝑝
𝐴
𝑖
希望找到个用于描量子 的量, 那么希望找到个物理量, 它的量结尽可能确,
Shannon 熵最小. 此时的 Shannon 熵即定义为 von Neumann
根据前面的讨论, 这个物理量应当与密度矩阵 𝜌 具有相同的本征矢, 即以其本征矢为基展开的密度矩阵是
对角阵, 那么此时对角元即为概率分布
𝜌 =
©
«
𝑝
1
0 · · · 0
0 𝑝
2
· · · 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 · · · 𝑝
𝑛
ª
®
®
®
®
®
®
¬
自然 von Neumann 熵为
𝑆(𝜌) = 𝑇𝑟 (𝜌 log 𝜌)
事实上进行基的变换并不会改变矩阵的迹, 因而 von Neumann 熵在任何基下都有相同的形式
纯态具有最小的 von Neumann , 其值为 0