在Python 3.x中替换字符串中的转义序列字符

Question

我使用以下代码替换字符串中的转义字符。我首先完成了\n和使用过的re.sub()的分裂，但我仍然不知道我缺少什么，代码根据期望不起作用。我是Python的新手，所以请不要判断是否存在优化问题。这是我的代码：

#import sys
import re

String = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r"
splitString = String.split('\n')
replacedStrings = []
i=0

for oneString in splitString:
    #oneString = oneString.replace(r'^(.?)*(\\[^n])+(.?)*$', "")
    oneString = re.sub(r'^(.?)*(\\[^n])+(.?)*$', "", oneString)
    print(oneString)
    replacedStrings.insert(i, oneString)

    i += 1

print(replacedStrings)

我的目标是：我只需要值（没有转义序列）作为拆分字符串。

我的方法是：

我已经通过\n拆分了字符串，它给出了单独字符串的数组列表。
然后，我使用正则表达式检查每个字符串，如果正则表达式匹配，则匹配的子字符串被替换为“”。
然后我将这些字符串推送到一个集合，认为它会将替换的字符串存储在新的数组列表中。

所以基本上，我通过1和2，但目前我被困在3.以下是我的输出：

1
2
3

4

['1\r\r\t\r', '2\r\r', '3\r\r\r\r', '\r', '\r4', '\r']

Answer 1

你几乎就在那里，我会用string.strip()在字符串的开头和结尾替换多个\r和\n

String = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r"
splitString = String.split('\n')
replacedStrings = []
i=0

for oneString in splitString:
    s = oneString.strip()
    if s != '':
        print(s)
        replacedStrings.append(s)

print(replacedStrings)

输出看起来像

1
2
3
4
['1', '2', '3', '4']

对于"jkahdjkah \r\r\t\r\nA: B\r\r\nA : B\r\r\r\r\n\r\n\r4\n\r"，输出将是['jkahdjkah', 'A: B', 'A : B', '4']

Answer 2

您可能会发现使用简单模式re.findall更容易使用\S+：

input = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r"
output = re.findall(r'\S+', input)
print(output)

['1', '2', '3', '4']

该方法将隔离并匹配一个或多个非空白字符的任何岛。

编辑：

根据您的新输入数据，我们可以尝试匹配模式[^\r\n\t]+：

input = "jkahdjkah \r\r\t\r\nA: B\r\r\nA : B\r\r\r\r\n\r\n\r4\n\r"
output = re.findall(r'[^\r\n\t]+', input)
print(output)

['jkahdjkah ', 'A: B', 'A : B', '4']

re.sub不是真正适合这里工作的工具。桌子上的内容是split或re.findall，因为你想重复匹配/隔离文本的某个部分。 re.sub对于获取字符串并将其转换为其他内容非常有用。它可用于提取文本，但对多个匹配不起作用。

Answer 3

我找到了另外一种方法，这似乎工作得很好，它可能不像其他答案那样优化，但它只是另一种方式：

import re
splitString = []
String = "jhgdf\r\r\t\r\nA  : B\r\r\nA  : B\r\r\r\r\n\r\n\rA: B\n\r"
splitString = re.compile('[\r\t\n]+').split(String)
if "" in splitString:
  splitString.remove("")
print(splitString)

我在这里添加了它，以便人们遇到与我一样的麻烦，可能也想忽略这种方法。

以下是使用上述代码后得到的输出：

['jhgdf', 'A  : B', 'A  : B', 'A: B']

在Python 3.x中替换字符串中的转义序列字符

问题描述投票：2回答：3

3个回答

最新问题

在Python 3.x中替换字符串中的转义序列字符

问题描述 投票：2回答：3

3个回答

最新问题

问题描述投票：2回答：3