"""
To try the examples in the browser:
1. Type code in the input cell and press
Shift + Enter to execute
2. Or copy paste the code, and click on
the "Run" button in the toolbar
"""
# The standard way to import NumPy:
import numpy as np
# Create a 2-D array, set every second element in
# some rows and find max per row:
x = np.arange(15, dtype=np.int64).reshape(3, 5)
x[1:, ::2] = -99
x
# array([[ 0, 1, 2, 3, 4],
# [-99, 6, -99, 8, -99],
# [-99, 11, -99, 13, -99]])
x.max(axis=1)
# array([ 4, 8, 13])
# Generate normally distributed random numbers:
rng = np.random.default_rng()
samples = rng.normal(size=2500)
samples
几乎每个使用 Python 的科学家都依赖 NumPy 的强大功能。
NumPy 将 C 和 Fortran 等语言的计算能力带入 Python,这是一种更容易学习和使用的语言。这种强大功能带来了简洁性:NumPy 中的解决方案通常清晰而优雅。
当编写库以利用创新硬件、创建专用数组类型或添加 NumPy 未提供的功能时,NumPy 的 API 是起点。
数组库 | 功能与应用领域 | |
Dask | 用于分析的分布式数组和高级并行性,实现大规模性能。 | |
CuPy | 用于使用 Python 进行 GPU 加速计算的与 NumPy 兼容的数组库。 | |
JAX | NumPy 程序的可组合转换:微分、向量化、即时编译到 GPU/TPU。 | |
Xarray | 用于高级分析和可视化的标记、索引多维数组。 | |
稀疏 | 与 NumPy 兼容的稀疏数组库,与 Dask 和 SciPy 的稀疏线性代数集成。 | |
PyTorch | 深度学习框架,可加快从研究原型到生产部署的路径。 | |
TensorFlow | 一个端到端的机器学习平台,可以轻松构建和部署基于 ML 的应用程序。 | |
Arrow | 用于列式内存中数据和分析的跨语言开发平台。 | |
xtensor | 具有广播和延迟计算功能的多维数组,用于数值分析。 | |
Awkward Array | 使用类似 NumPy 的习惯用法操作类似 JSON 的数据。 | |
uarray | 将 API 与实现分离的 Python 后端系统;unumpy 提供 NumPy API。 | |
tensorly | 张量学习、代数和后端,可无缝使用 NumPy、PyTorch、TensorFlow 或 CuPy。 |
NumPy 是丰富的数据科学库生态系统的核心。典型探索性数据科学工作流程可能如下所示
NumPy 是强大的机器学习库(如 scikit-learn 和 SciPy)的基础。随着机器学习的发展,基于 NumPy 的库列表也在不断增长。TensorFlow 的深度学习功能具有广泛的应用,其中包括语音和图像识别、基于文本的应用程序、时间序列分析和视频检测。PyTorch 是另一个深度学习库,在计算机视觉和自然语言处理的研究人员中很受欢迎。
NumPy 是蓬勃发展的 Python 可视化领域 的一个重要组成部分,其中包括 Matplotlib、Seaborn、Plotly、Altair、Bokeh、Holoviz、Vispy、Napari 和 PyVista,仅举几例。
NumPy 对大型数组的加速处理允许研究人员可视化比原生 Python 能够处理的数据集大得多的数据集。