假设我有这个清单:
text = ['Malte', 'ex', 'precio', 'empcionis', 'bovum', 'septem', 'laborancium', 'et', 'unius', 'thaurj', 'et', 'unius', 'vacce', 'cum', 'vitulo', 'sequenti', 'et', 'pecudum', 'fetancium', 'sexdecim', 'et', 'duarum', 'caprarum', 'cum', 'duobus', 'et', 'cum', 'vitulo']
我想找到'cum vitulo'开头的每个索引,即:13和26。
目前我正在接受'暨'的开始,但有时接下来是另一个词ex:'duobus'在这种情况下
一种方法是这样的:
text = ['Malte', 'ex', 'precio', 'empcionis', 'bovum', 'septem', 'laborancium', 'et', 'unius', 'thaurj', 'et', 'unius', 'vacce', 'cum', 'vitulo', 'sequenti', 'et', 'pecudum', 'fetancium', 'sexdecim', 'et', 'duarum', 'caprarum', 'cum', 'duobus', 'et', 'cum', 'vitulo']
target = 'cum vitulo'
target = tuple(target.split())
hits = [i for i, x in enumerate(zip(text, text[1:])) if x == target]
print(hits) # -> [13, 26]
这是最简单的方法恕我直言(python 2.7和3):
text = ['Malte', 'ex', 'precio', 'empcionis', 'bovum', 'septem', 'laborancium', 'et', 'unius', 'thaurj', 'et', 'unius', 'vacce', 'cum', 'vitulo', 'sequenti', 'et', 'pecudum', 'fetancium', 'sexdecim', 'et', 'duarum', 'caprarum', 'cum', 'duobus', 'et', 'cum', 'vitulo'];
result = [i for i, item in enumerate(text[:-1]) if item == 'cum' and text[i+1] == 'vitulo']
print(result) # >>> [13, 26]
text = ['Malte', 'ex', 'precio', 'empcionis', 'bovum', 'septem', 'laborancium', 'et', 'unius', 'thaurj', 'et', 'unius', 'vacce', 'cum', 'vitulo', 'sequenti', 'et', 'pecudum', 'fetancium', 'sexdecim', 'et', 'duarum', 'caprarum', 'cum', 'duobus', 'et', 'cum', 'vitulo']
result = []
for index, value in enumerate(text):
if value == 'cum':
try:
if text[index + 1] == 'vitulo':
result.append(index)
except IndexError: # reached end
break
产量
result == [13, 26]
一种奇特的方式:
from itertools import tee
# recipe from itertools
def pairwise(iterable):
"s -> (s0,s1), (s1,s2), (s2, s3), ..."
a, b = tee(iterable)
next(b, None)
return zip(a, b)
[index for (index, (first, second)) in enumerate(pairwise(text)) if first == 'cum' and second == 'vitulo']