如何取消转义 Pandas Series 中的 HTML 实体?

问题描述 投票:0回答:1

这个

Estamos com problema de conexão na loja Serrana Fortaleza, estamos somente por um link, Embratel. E Dnat criado não esta funcionando precisamos de ajuda por favor.

一定是这个:

Estamos com problema de conexão na loja Serrana Fortaleza, estamos somente por um link, Embratel. E Dnat criado não esta funcionando precisamos de ajuda por favor.

import html.parser
import pandas as pd

df_abertura['Descricao'] = df_abertura['Descricao'].apply(lambda x: html.unescape(x))

输出:

Estamos com problema de conexão na loja Serrana Fortaleza, estamos somente por um link, Embratel. E Dnat criado não esta funcionando precisamos de ajuda por favor.

python python-3.x pandas html-entities
1个回答
0
投票

我准备了以下测试

import html
import pandas as pd
s = pd.Series(["Estamos com problema de conexão na loja Serrana Fortaleza, estamos somente por um link, Embratel. E Dnat criado não esta funcionando precisamos de ajuda por favor."])
s2 = s.apply(html.unescape)
print(s2[0])

并获得输出(使用 python 3.10.12 和 pandas 2.0.1)

Estamos com problema de conexão na loja Serrana Fortaleza, estamos somente por um link, Embratel. E Dnat criado não esta funcionando precisamos de ajuda por favor.

符合所需的输出。

© www.soinside.com 2019 - 2024. All rights reserved.