NumPy 基准测试#

使用 Airspeed Velocity 对 NumPy 进行基准测试。

用法#

除非另有说明,Airspeed Velocity 会自行管理构建和 Python 虚拟环境。要运行基准测试,您无需将 NumPy 的开发版本安装到当前的 Python 环境中。

开始之前,请确保已安装 airspeed velocity。默认情况下,asv 支持 anaconda 和 virtualenv。

pip install asv
pip install virtualenv

在贡献新的基准测试后,您应该在提交拉取请求之前在本地测试它们。

要运行所有基准测试,请在命令行中导航到 NumPy 根目录并执行

spin bench

这会构建 NumPy 并运行 benchmarks/ 中定义的所有可用基准测试。(注意:这可能需要一些时间。每个基准测试会运行多次以测量执行时间的分布。)

为了在本地**测试**基准,最好不进行重复运行

cd benchmarks/
export REGEXP="bench.*Ufunc"
asv run --dry-run --show-stderr --python=same --quick -b $REGEXP

其中用于匹配基准测试的正则表达式存储在 $REGEXP 中,并且使用 –quick 以避免重复。

要运行特定基准测试模块中的基准测试,例如 bench_core.py,只需附加不带扩展名的文件名

spin bench -t bench_core

要运行类中定义的基准测试,例如 bench_creation.py 中的 MeshGrid

spin bench -t bench_creation.MeshGrid

要将基准测试结果的变化与另一个版本/提交/分支进行比较,请使用 --compare 选项(或等效的 -c

spin bench --compare v1.6.2 -t bench_core
spin bench --compare 20d03bcfd -t bench_core
spin bench -c main -t bench_core

上述所有命令都在控制台中以纯文本形式显示结果,并且结果不会保存以供将来提交时进行比较。为了获得更大的控制权、图形视图以及保存结果以供将来比较,您可以运行 ASV 命令(记录结果并生成 HTML)

cd benchmarks
asv run -n -e --python=same
asv publish
asv preview

有关如何使用 asv 的更多信息,请参阅 ASV 文档。命令行帮助一如既往地可通过 asv --helpasv run --help 获取。

基准测试版本#

要在本地不同机器上仅对发布版本进行基准测试或可视化,可以在使用 asv 运行之前生成带有其提交的标签,即

cd benchmarks
# Get commits for tags
# delete tag_commits.txt before re-runs
for gtag in $(git tag --list --sort taggerdate | grep "^v"); do
git log $gtag --oneline -n1 --decorate=no | awk '{print $1;}' >> tag_commits.txt
done
# Use the last 20
tail --lines=20 tag_commits.txt > 20_vers.txt
asv run HASHFILE:20_vers.txt
# Publish and view
asv publish
asv preview

有关贡献这些内容的详细信息,请参阅基准测试结果仓库

编写基准测试#

有关如何编写基准测试的基础知识,请参阅 ASV 文档

需要考虑的一些事项

  • 基准测试套件应可导入任何 NumPy 版本。

  • 基准测试参数等不应取决于安装的 NumPy 版本。

  • 尽量保持基准测试的运行时间合理。

  • 优先使用 ASV 的 time_ 方法来测量基准测试时间,而不是通过 time.clock 来自行实现时间测量,即使这在编写基准测试时需要一些技巧。

  • 准备数组等操作通常应放在 setup 方法中,而不是 time_ 方法中,以避免将准备时间计入基准测试操作的时间。

  • 请注意,使用 np.emptynp.zeros 创建的大型数组可能直到访问内存时才会在物理内存中分配。如果这是期望的行为,请确保在您的 setup 函数中注释说明。如果您正在对某个算法进行基准测试,用户不太可能在新创建的空/零数组上执行该算法。可以通过在创建数组后调用 np.onesarr.fill(value) 来强制在 setup 阶段发生页面错误。