从 NumPy 数组中选择特定的行和列

问题描述 投票:0回答:4

我一直在疯狂地想弄清楚我在这里做错了什么愚蠢的事情。

我正在使用 NumPy,并且我有要从中选择的特定行索引和特定列索引。这是我的问题的要点:

import numpy as np

a = np.arange(20).reshape((5,4))
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [ 8,  9, 10, 11],
#        [12, 13, 14, 15],
#        [16, 17, 18, 19]])

# If I select certain rows, it works
print a[[0, 1, 3], :]
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [12, 13, 14, 15]])

# If I select certain rows and a single column, it works
print a[[0, 1, 3], 2]
# array([ 2,  6, 14])

# But if I select certain rows AND certain columns, it fails
print a[[0,1,3], [0,2]]
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# ValueError: shape mismatch: objects cannot be broadcast to a single shape

为什么会发生这种情况?我当然应该能够选择第一、第二和第四行以及第一和第三列吗?我期待的结果是:

a[[0,1,3], [0,2]] => [[0,  2],
                      [4,  6],
                      [12, 14]]
python arrays numpy multidimensional-array numpy-slicing
4个回答
141
投票

正如 Toan 所建议的,一个简单的技巧是先选择行,然后选择 that 上的列。

>>> a[[0,1,3], :]            # Returns the rows you want
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [12, 13, 14, 15]])
>>> a[[0,1,3], :][:, [0,2]]  # Selects the columns you want as well
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

[编辑]内置方法:
np.ix_

我最近发现 numpy 为您提供了一个内置的单行代码来执行 @Jaime 建议的操作,但不必使用广播语法(这缺乏可读性)。来自文档:

使用 ix_ one 可以快速构造索引数组,该索引数组将索引 叉积。
a[np.ix_([1,3],[2,5])]

返回数组

[[a[1,2] a[1,5]], [a[3,2] a[3,5]]]

所以你这样使用它:

>>> a = np.arange(20).reshape((5,4)) >>> a[np.ix_([0,1,3], [0,2])] array([[ 0, 2], [ 4, 6], [12, 14]])

它的工作方式是按照 Jaime 建议的方式对齐数组,以便正确进行广播:

>>> np.ix_([0,1,3], [0,2]) (array([[0], [1], [3]]), array([[0, 2]]))

此外,正如 MikeC 在评论中所说,
np.ix_

具有返回视图的优点,而我的第一个(预编辑)答案则没有。这意味着您现在可以

分配
到索引数组: >>> a[np.ix_([0,1,3], [0,2])] = -1 >>> a array([[-1, 1, -1, 3], [-1, 5, -1, 7], [ 8, 9, 10, 11], [-1, 13, -1, 15], [16, 17, 18, 19]])



100
投票

>>> a[[[0, 0], [1, 1], [3, 3]], [[0,2], [0,2], [0, 2]]] array([[ 0, 2], [ 4, 6], [12, 14]])

写起来当然很痛苦,所以你可以让广播来帮助你:

>>> a[[[0], [1], [3]], [0, 2]] array([[ 0, 2], [ 4, 6], [12, 14]])

如果您使用数组而不是列表进行索引,这会更简单:

>>> row_idx = np.array([0, 1, 3]) >>> col_idx = np.array([0, 2]) >>> a[row_idx[:, None], col_idx] array([[ 0, 2], [ 4, 6], [12, 14]])



10
投票

>>> a[[0,1,3]][:,[0,2]] array([[ 0, 2], [ 4, 6], [12, 14]])

或:

>>> a[[0,1,3],::2] array([[ 0, 2], [ 4, 6], [12, 14]])



7
投票
np.ix_

是最方便的方法(正如其他人回答的那样),但也可以按如下方式完成:

>>> rows = [0, 1, 3]
>>> cols = [0, 2]

>>> (a[rows].T)[cols].T

array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

© www.soinside.com 2019 - 2024. All rights reserved.