trace-trick

将一个类似 \(x^T A y\) 的标量看作 1x1 trace 然后利用 trace 的性质可以得到 \[ x^T A y = tr(x^T A y) = tr(y x^T A). \]

例题:计算两个多元高斯分布的 KL 散度。

做法:照搬一下作业。