PageRank 敏感性分析
1. 引言
在网络世界中,PageRank 算法是衡量网页重要性的经典方法。如同人的敏感性能反映其性格一样,PageRank 模型的敏感性也能揭示其生成的网页流行度得分的许多信息。例如,当参数 α 接近 1 时,PageRank 会有显著反应。本文将深入探讨 PageRank 对不同参数变化的敏感性。
2. 敏感性分析基础
PageRank 向量的敏感性可通过分别考察 Google 矩阵 G 的各个参数来分析。G 依赖于三个特定参数:缩放参数 α、超链接矩阵 H 和个性化向量 vT。下面将依次讨论这些参数对 PageRank 向量的影响。
2.1 对参数 α 的敏感性
2.1.1 导数分析
使用导数来研究 α 的变化对 πT 的影响。导数 dπT(α)/dα 表示当 α 稍有变化时,PageRank 向量 πT 中元素的变化程度。若 dπj(α)/dα 的绝对值大,则表明 πj 对 α 的小变化很敏感;若 dπj(α)/dα > 0,α 增加时 πj 也增加;反之则减小。不过,dπT(α)/dα 只是近似描述 πT 随 α 的变化,并非精确描述。
2.1.2 定理支持
- 定理 6.1.1:PageRank 向量为 πT(α) = 1 / (∑n i=1 Di(α)) [D1(α), D2(α), …, Dn(α)],其中 Di(α) 是 I - G(α) 中 n - 1 阶的第 i 个主子式行列式。由于每个主子式 Di(α) > 0 是 I - G(α) 中数的乘积之和,所以 πT(α) 的每个分