"""
To try the examples in the browser:
1. Type code in the input cell and press
Shift + Enter to execute
2. Or copy paste the code, and click on
the "Run" button in the toolbar
"""
# The standard way to import NumPy:
import numpy as np
# Create a 2-D array, set every second element in
# some rows and find max per row:
x = np.arange(15, dtype=np.int64).reshape(3, 5)
x[1:, ::2] = -99
x
# array([[ 0, 1, 2, 3, 4],
# [-99, 6, -99, 8, -99],
# [-99, 11, -99, 13, -99]])
x.max(axis=1)
# array([ 4, 8, 13])
# Generate normally distributed random numbers:
rng = np.random.default_rng()
samples = rng.normal(size=2500)
samples
几乎每个使用 Python 的科学家都依赖于 NumPy 的强大功能。
NumPy 将 C 和 Fortran 等语言的计算能力带到了 Python,这是一种更容易学习和使用的语言。这种能力带来了简洁性:NumPy 中的解决方案通常清晰而优雅。
当编写库以利用创新硬件、创建专门的数组类型或添加 NumPy 提供的功能之外的功能时,NumPy 的 API 是起点。
数组库 | 功能与应用领域 | |
Dask | 用于分析的分布式数组和高级并行性,实现大规模性能。 | |
CuPy | 与 NumPy 兼容的数组库,用于使用 Python 进行 GPU 加速计算。 | |
JAX | NumPy 程序的可组合转换:微分、矢量化、即时编译到 GPU/TPU。 | |
Xarray | 用于高级分析和可视化的带标签、索引的多维数组。 | |
稀疏 | 与 NumPy 兼容的稀疏数组库,与 Dask 和 SciPy 的稀疏线性代数集成。 | |
PyTorch | 深度学习框架,可加速从研究原型到生产部署的路径。 | |
TensorFlow | 一个端到端的机器学习平台,可以轻松构建和部署基于 ML 的应用程序。 | |
Arrow | 用于列式内存中数据和分析的跨语言开发平台。 | |
xtensor | 具有广播和延迟计算的多维数组,用于数值分析。 | |
Awkward Array | 使用类似 NumPy 的习惯用法操作类似 JSON 的数据。 | |
uarray | 将 API 与实现分离的 Python 后端系统;unumpy 提供 NumPy API。 | |
tensorly | 张量学习、代数和后端,以无缝使用 NumPy、PyTorch、TensorFlow 或 CuPy。 |
NumPy 位于丰富的数据科学库生态系统的核心。典型的数据科学探索工作流程可能如下所示
NumPy 是强大的机器学习库(如 scikit-learn 和 SciPy)的基础。随着机器学习的发展,构建在 NumPy 之上的库列表也在不断增长。TensorFlow 的深度学习功能具有广泛的应用,其中包括语音和图像识别、基于文本的应用程序、时间序列分析和视频检测。PyTorch 是另一个深度学习库,在计算机视觉和自然语言处理研究人员中很受欢迎。
NumPy 是蓬勃发展的 Python 可视化领域 中的重要组成部分,其中包括 Matplotlib、Seaborn、Plotly、Altair、Bokeh、Holoviz、Vispy、Napari 和 PyVista,仅举几例。
NumPy 对大型数组的加速处理使研究人员能够可视化比原生 Python 处理能力大得多的数据集。