lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

openpyxl:在没有 zipfile 的情况下获取工作表的 xml 源代码

从 openpyxl 导入 load_workbook wb = load_workbook('file.xlsx') ws = wb['Sheet1'] 有没有办法检索表示 ws 对象的 xml 代码? 注意:我想避免使用 zipfile ...

回答 1 投票 0

关于美汤4模块的问题

我很困惑,因为这段代码有时有效,有时无效。该代码基于美丽的汤模块。我想知道为什么它在某些情况下有效以及为什么它在其他情况下无效...

回答 2 投票 0

不能在带有 lxml etree 的 xpath 中使用 translate() 方法

我想使用 Python 中的 lxml 库翻译来降低我的文本。我的代码如下 r = element.xpath('./a/translate(text(), "A", "a")') 但它给了我一个例外: lxml...

回答 1 投票 0

XML : lxml.etree - findall() when document element has attributes

.findall() 在文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决? 这是代码: 从 lxml 导入 etree as et 文本 = '''\ .findall() 当文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决? 代码如下: from lxml import etree as et text = '''\ <svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">\ <text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' tree = et.fromstring(text) for elem in tree.findall(".//text"): if elem.text == "ID_NUM.47": elem.getparent().remove(elem) print(et.tostring(tree)) tree.findall(".//text") 返回一个空列表。 但是对于以下文档,其中删除了svg标签属性,找到了所有元素: text = '''\ <svg><text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' 此外,例如,当用 .findall() 替换 .xpath('//*[attribute::textLength]') 时,所有元素都在两个文档中找到。

回答 0 投票 0

在 Python 中键入提示保护/私有类的正确方法?

我这里有一个示例类,我想使用 lxml 来解析 xml 文件。 XML 解析器类: def __init__(自我,路径:海峡): self.root: etree._Element |无 = 无 然而,PyCharm

回答 1 投票 0

Mypy 函数“lxml.etree.ElementTree”作为类型无效,但为什么呢?

我正在使用 Mypy 来实现这个功能 将函数导入为 fu 从 lxml 导入 etree 从 lxml.etree 导入元素,ElementTree def find_nodes(tree: ElementTree, paths: Iterable[str]) -> Iterable[Eleme...

回答 2 投票 0

尝试使用 Pandas 并不断收到此错误:错误:lxml 的构建轮失败

我正在尝试使用 Pandas 从网络上获取表格我遇到的第一个错误是“找不到 lxml,请安装它”,通过终端安装后,我不断得到...

回答 1 投票 0

如何将 spaCy 模型结果附加到 XML - 需要 XSLT 或 Python 脚本而不损坏标签

我将此 JSON 数据附加到下面的 xml 中: { “para-num”:31, “ele-id”:“71FCC3AE”, “转换标签”:“段”, &quo...

回答 0 投票 0

如何使用 `lxml` 将所有出现的标签更改为特定文本?

我自制的解决方案可能是: 将 lxml.etree 导入为 ET def tag2text(节点,sar): """将 `sar.keys()` 中的元素替换为 `sar.values()` 中的文本。""" 对于 elem, tex...

回答 2 投票 0

如何在 Pycharm 中安装 lxml?

我对 Python 比较陌生。我正在尝试使用 BeautifulSoup 来抓取网站并想要运行代码: 来源 = requests.get(URLHERE).text 文章 = BeautifulSoup(来源,“lxml”) R...

回答 2 投票 0

XML 和可能的 LXML 问题

我有很多这样的 XML 文件 1808 ...

回答 2 投票 0

在 M1 mac 上安装 lxml 的问题

所以,我遇到了安装 lxml 的经典问题。 最初我只是 pip 安装,但是当我尝试使用 Element.clear() 释放内存时,我收到以下错误: Python(58695,0x1001...

回答 6 投票 0

在 Windows 中安装 lxml 的问题

C:\Users\home>pip install lxml 收集 lxml 使用缓存的 lxml-4.9.2.tar.gz (3.7 MB) 准备元数据(setup.py)...完成 为收集的包构建轮子:lxml 建筑轮...

回答 0 投票 0

BeautifulSoup - lxml 和 html5lib 解析器抓取差异

我正在使用 BeautifulSoup 4 和 Python 2.7。我想从网站中提取某些元素(数量,请参见下面的示例)。出于某种原因,lxml 解析器不允许我提取...

回答 2 投票 0

仅当 XML 元素使用 Python 和 XPath 显式定义任何默认命名空间时才获取它们

我正在用 Python 解析一个 XML 字符串,我正在寻找一个 XPath 表达式来只检索明确定义任何默认命名空间的元素(xmlns,没有前缀)。 我正在和...一起工作

回答 1 投票 0

如何删除与同一 HTML 的文本内容段相对应的 HTML 块(以及标签)?

我使用 lxml text_content 从 HTML 页面中提取了 text_content,并且我在其中找到了一些符合特定条件的文本,我需要从 HTML 中删除那些匹配的字符串。我必须...

回答 0 投票 0

Python lxml XPath:无效表达式(可选子项)

我需要从网站中提取文本。该网站有两种不同的结构,其中一种在正文之前有一个附加元素。 我尝试按如下方式提取文本: //div[con...

回答 1 投票 0

如何删除与同一 HTML 的文本内容段相对应的 HTML 块(以及标签)?

我已经使用 lxml text_content 从 HTML 页面中提取了 text_content,并且我在其中找到了一些符合特定条件的文本,我需要从 HTML 中删除那些匹配的字符串。我必须...

回答 0 投票 0

用 pd.read_html 抓取,返回 ValueError: No tables found

我已经尝试了几种不同的方法来产生相同的结果。我正在尝试从网上抓取一张表格并导出到 .csv,让它在其他网站上工作,但对某些人来说运气不佳......

回答 1 投票 0

如何使用缩进将 HTML 打印到文件中

我正在使用 lxml.html 生成一些 HTML。我想将我的最终结果漂亮地打印(带缩进)到一个 html 文件中。我怎么做? 这是我到目前为止所尝试和得到的 导入 lxml.htm...

回答 10 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.