我想提取包含特定字符串的行 - 该字符串可以是一个较大的、以空格分隔的字符串(我想计入其中)的一部分,也可以是另一个(连续)字符串(我想将其计入其中)的一部分不想算在内)。该字符串可以位于字符串值的开头、中间或结尾。
示例 - 假设我想提取包含“HC”的任何行:
df = pd.DataFrame(columns=['test'])
df['test'] = ['HC', 'CHC', 'HC RD', 'RD', 'MRD', 'CEA', 'CEA HC']
test
0 HC
1 CHC
2 HC RD
3 RD
4 MRD
5 CEA
6 CEA HC
所需输出
test
0 HC
2 HC RD
6 CEA HC
您可以将
str.contains
方法与正则表达式查询一起使用 \bHC\b
>>> df[df['test'].str.contains(r'\bHC\b')]
test
0 HC
2 HC RD
6 CEA HC
\b
:单词边界