numpy.random.dirichlet#

random.dirichlet(alpha, size=None)#

从狄利克雷分布中抽取样本。

从狄利克雷分布中抽取维度为 k 的 size 个样本。狄利克雷分布随机变量可以看作是贝塔分布的多元推广。在贝叶斯推理中,狄利克雷分布是多项分布的共轭先验。

注意

新的代码应该使用 dirichlet 方法,该方法属于 Generator 实例;请参阅 快速入门

参数:
alpha长度为 k 的浮点数序列

分布的参数(对于长度为 k 的样本,长度为 k)。

size整数或整数元组,可选

输出形状。如果给定的形状为,例如,(m, n),则将抽取 m * n * k 个样本。默认值为 None,在这种情况下,将返回长度为 k 的向量。

返回值:
samplesndarray,

抽取的样本,形状为 (size, k)

引发:
ValueError

如果 alpha 中的任何值小于或等于零

参见

random.Generator.dirichlet

应用于新代码。

注释

狄利克雷分布是关于满足条件 \(x_i>0\)\(\sum_{i=1}^k x_i = 1\) 的向量 \(x\) 的分布。

狄利克雷分布随机向量 \(X\) 的概率密度函数 \(p\)

\[p(x) \propto \prod_{i=1}^{k}{x^{\alpha_i-1}_i},\]

成正比,其中 \(\alpha\) 是包含正集中参数的向量。

该方法使用以下属性进行计算:令 \(Y\) 为一个随机向量,其分量遵循标准伽马分布,则 \(X = \frac{1}{\sum_{i=1}^k{Y_i}} Y\) 服从狄利克雷分布

参考文献

[1]

David McKay,“信息论、推理和学习算法”,第 23 章,https://www.inference.org.uk/mackay/itila/

[2]

维基百科,“狄利克雷分布”,https://en.wikipedia.org/wiki/Dirichlet_distribution

示例

以维基百科中引用的一個例子为例,如果想要将字符串(每个初始长度为 1.0)切割成 K 段具有不同长度的片段,其中每段平均具有指定的平均长度,但允许片段的相对大小存在一些差异,则可以使用此分布。

>>> s = np.random.dirichlet((10, 5, 3), 20).transpose()
>>> import matplotlib.pyplot as plt
>>> plt.barh(range(20), s[0])
>>> plt.barh(range(20), s[1], left=s[0], color='g')
>>> plt.barh(range(20), s[2], left=s[0]+s[1], color='r')
>>> plt.title("Lengths of Strings")
../../../_images/numpy-random-dirichlet-1.png