numpy.random.dirichlet#
- random.dirichlet(alpha, size=None)#
从 Dirichlet 分布中抽取样本。
从 Dirichlet 分布中抽取维度为 k 的
size
个样本。Dirichlet 分布的随机变量可以看作是 Beta 分布的多元推广。在贝叶斯推断中,Dirichlet 分布是多项分布的共轭先验。- 参数:
- alpha浮点数序列,长度为 k
分布参数(对于长度为
k
的样本,参数长度为k
)。- sizeint 或 int 元组,可选
输出形状。如果给定的形状是例如
(m, n)
,则会抽取m * n * k
个样本。默认值为 None,在这种情况下返回长度为k
的向量。
- 返回值:
- samplesndarray,
抽取的样本,形状为
(size, k)
。
- 抛出:
- ValueError
如果
alpha
中的任何值小于或等于零
另请参阅
random.Generator.dirichlet
新代码应使用此方法。
注释
Dirichlet 分布是一种对向量 \(x\) 的分布,满足条件 \(x_i>0\) 和 \(\sum_{i=1}^k x_i = 1\)。
Dirichlet 分布随机向量 \(X\) 的概率密度函数 \(p\) 与以下表达式成比例:
\[p(x) \propto \prod_{i=1}^{k}{x^{\alpha_i-1}_i},\]其中 \(\alpha\) 是一个包含正浓度参数的向量。
该方法利用以下性质进行计算:设 \(Y\) 是一个随机向量,其分量服从标准 gamma 分布,则 \(X = \frac{1}{\sum_{i=1}^k{Y_i}} Y\) 服从 Dirichlet 分布
参考
[1]David McKay, “Information Theory, Inference and Learning Algorithms,” chapter 23, https://www.inference.org.uk/mackay/itila/
[2]Wikipedia, “Dirichlet distribution”, https://en.wikipedia.org/wiki/Dirichlet_distribution
示例
引用 Wikipedia 中的一个示例,如果你想将字符串(每个初始长度为 1.0)切成 K 段不同长度的片段,并且每个片段平均具有一个指定的平均长度,同时允许片段相对大小存在一些变化,那么可以使用此分布。
>>> s = np.random.dirichlet((10, 5, 3), 20).transpose()
>>> import matplotlib.pyplot as plt >>> plt.barh(range(20), s[0]) >>> plt.barh(range(20), s[1], left=s[0], color='g') >>> plt.barh(range(20), s[2], left=s[0]+s[1], color='r') >>> plt.title("Lengths of Strings")