"""
To try the examples in the browser:
1. Type code in the input cell and press
Shift + Enter to execute
2. Or copy paste the code, and click on
the "Run" button in the toolbar
"""
# The standard way to import NumPy:
import numpy as np
# Create a 2-D array, set every second element in
# some rows and find max per row:
x = np.arange(15, dtype=np.int64).reshape(3, 5)
x[1:, ::2] = -99
x
# array([[ 0, 1, 2, 3, 4],
# [-99, 6, -99, 8, -99],
# [-99, 11, -99, 13, -99]])
x.max(axis=1)
# array([ 4, 8, 13])
# Generate normally distributed random numbers:
rng = np.random.default_rng()
samples = rng.normal(size=2500)
samples
几乎所有使用 Python 的科学家都利用 NumPy 的强大功能。
NumPy 将 C 和 Fortran 等语言的计算能力带到 Python 中,Python 是一种更容易学习和使用的语言。这种能力带来了简洁性:NumPy 中的解决方案通常清晰而优雅。
NumPy 的 API 是编写库的起点,用于利用创新硬件、创建专用数组类型或添加 NumPy 提供之外的功能。
数组库 | 功能与应用领域 | |
![]() | Dask | 用于分析的分布式数组和高级并行性,实现大规模性能。 |
![]() | CuPy | 与 NumPy 兼容的数组库,用于 Python 的 GPU 加速计算。 |
![]() | JAX | NumPy 程序的组合式转换:微分、矢量化、即时编译到 GPU/TPU。 |
![]() | Xarray | 用于高级分析和可视化的标记、索引多维数组。 |
![]() | Sparse | 与 NumPy 兼容的稀疏数组库,与 Dask 和 SciPy 的稀疏线性代数集成。 |
PyTorch | 深度学习框架,加速从研究原型到生产部署的路径。 | |
TensorFlow | 一个端到端机器学习平台,可轻松构建和部署由机器学习驱动的应用程序。 | |
![]() | Arrow | 一个用于列式内存数据和分析的跨语言开发平台。 |
![]() | xtensor | 具有广播和惰性计算功能的多维数组,用于数值分析。 |
Awkward Array | 使用类似 NumPy 的惯用法操作类 JSON 数据。 | |
![]() | uarray | 将 API 与实现解耦的 Python 后端系统;unumpy 提供 NumPy API。 |
![]() | tensorly | 张量学习、代数和后端,可无缝使用 NumPy、PyTorch、TensorFlow 或 CuPy。 |
NumPy 处于丰富的数据科学库生态系统的核心。典型的数据科学探索性工作流程可能如下所示:
NumPy 构成了 scikit-learn 和 SciPy 等强大机器学习库的基础。随着机器学习的发展,基于 NumPy 构建的库列表也随之增长。TensorFlow 的深度学习功能具有广泛的应用——其中包括语音和图像识别、基于文本的应用程序、时间序列分析和视频检测。PyTorch 是另一个深度学习库,在计算机视觉和自然语言处理研究人员中很受欢迎。
NumPy 是蓬勃发展的Python 可视化领域的重要组成部分,其中包括 Matplotlib、Seaborn、Plotly、Altair、Bokeh、Holoviz、Vispy、Napari 和 PyVista 等。
NumPy 对大型数组的加速处理使研究人员能够可视化比原生 Python 所能处理的更大的数据集。