从列表或元组中显式选择项目

Question

我有以下Python列表（也可以是元组）：

myList = ['foo', 'bar', 'baz', 'quux']

我可以说

>>> myList[0:3]
['foo', 'bar', 'baz']
>>> myList[::2]
['foo', 'baz']
>>> myList[1::2]
['bar', 'quux']

如何明确挑选出索引没有特定模式的项目？例如，我想选择

[0,2,3]

。或者从 1000 个项目的非常大的列表中，我想选择

[87, 342, 217, 998, 500]

。有一些Python语法可以做到这一点吗？看起来像的东西：

>>> myBigList[87, 342, 217, 998, 500]

Answer 1

list( myBigList[i] for i in [87, 342, 217, 998, 500] )

我将答案与 python 2.5.2 进行了比较：

19.7 微秒：

[ myBigList[i] for i in [87, 342, 217, 998, 500] ]

20.6 微秒：

map(myBigList.__getitem__, (87, 342, 217, 998, 500))

22.7 微秒：

itemgetter(87, 342, 217, 998, 500)(myBigList)

24.6 微秒：

list( myBigList[i] for i in [87, 342, 217, 998, 500] )

请注意，在 Python 3 中，第 1 个已更改为与第 4 个相同。

另一种选择是从

numpy.array

开始，它允许通过列表或

numpy.array

进行索引：

>>> import numpy
>>> myBigList = numpy.array(range(1000))
>>> myBigList[(87, 342, 217, 998, 500)]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: invalid index
>>> myBigList[[87, 342, 217, 998, 500]]
array([ 87, 342, 217, 998, 500])
>>> myBigList[numpy.array([87, 342, 217, 998, 500])]
array([ 87, 342, 217, 998, 500])

tuple

的工作方式与切片不同。

Answer 2

这个怎么样：

from operator import itemgetter
itemgetter(0,2,3)(myList)
('foo', 'baz', 'quux')

Answer 3

也许列表理解是合适的：

L = ['a', 'b', 'c', 'd', 'e', 'f']
print [ L[index] for index in [1,3,5] ]

产品：

['b', 'd', 'f']

这就是您要找的吗？

Answer 4

它不是内置的，但如果您愿意，您可以创建一个列表的子类，将元组作为“索引”：

class MyList(list):

    def __getitem__(self, index):
        if isinstance(index, tuple):
            return [self[i] for i in index]
        return super(MyList, self).__getitem__(index)


seq = MyList("foo bar baaz quux mumble".split())
print seq[0]
print seq[2,4]
print seq[1::2]

印刷

foo
['baaz', 'mumble']
['bar', 'quux']

Answer 5

>>> map(myList.__getitem__, (2,2,1,3))
('baz', 'baz', 'bar', 'quux')

如果您希望能够执行

List

操作，您还可以创建自己的

__getitem__

类，该类支持元组作为

myList[(2,2,1,3)]

的参数。

Answer 6

我只是想指出，即使 itemgetter 的语法看起来也很简洁，但在大型列表上执行时有点慢。

import timeit
from operator import itemgetter
start=timeit.default_timer()
for i in range(1000000):
    itemgetter(0,2,3)(myList)
print ("Itemgetter took ", (timeit.default_timer()-start))

Itemgetter 占用了 1.065209062149279

start=timeit.default_timer()
for i in range(1000000):
    myList[0],myList[2],myList[3]
print ("Multiple slice took ", (timeit.default_timer()-start))

多个切片花费了0.6225321444745759

Answer 7

另一种可能的解决方案：

sek=[]
L=[1,2,3,4,5,6,7,8,9,0]
for i in [2, 4, 7, 0, 3]:
   a=[L[i]]
   sek=sek+a
print (sek)

Answer 8

就像经常有一个布尔 numpy 数组一样

mask

[mylist[i] for i in np.arange(len(mask), dtype=int)[mask]]

适用于任何序列或 np.array 的 lambda：

subseq = lambda myseq, mask : [myseq[i] for i in np.arange(len(mask), dtype=int)[mask]]

newseq = subseq(myseq, mask)

Answer 9

这是一个单行 lambda：

list(map(lambda x: mylist[x],indices))

地点：

mylist=['a','b','c','d','e','f','g','h','i','j']
indices = [3, 5, 0, 2, 6]

输出：

['d', 'f', 'a', 'c', 'g']

Answer 10

选择下面列表中的第一个、第三个和第四个元素。

myList = ['foo', 'bar', 'baz', 'quux']

最简单、最直接的方法是

mylist[0]+mylist[2]+myList[3]

从列表或元组中显式选择项目

问题描述投票：0回答：10

10个回答

最新问题

从列表或元组中显式选择项目

问题描述 投票：0回答：10

10个回答

最新问题

问题描述投票：0回答：10