lxml 相关问题

lxml是一个功能齐全的高性能Python库，用于处理XML和HTML。

我目前在 Pythonanywhere 上托管我的 python Flask 应用程序。当我运行我的抓取脚本时，它使用代码 df = pd.read_html(当前数据.内容) 我收到标题中发现的错误。跑步...

python flask lxml importerror pythonanywhere

回答 1 投票 0

<?xml version=“1.0” encoding=“UTF-8”?> 不是<?xml version='1.0' encoding='UTF-8'?>

我正在使用 lxml tree.write(xmlFileOut, Pretty_print = True, xml_declaration = True, 编码='UTF-8' 写出我打开和编辑的 xml 文件，但我绝对需要 xml 声明...

python xml lxml xml-declaration

回答 3 投票 0

如何获取lxml中元素的路径？

我正在使用Python中的lxml中的XPath在HTML文档中进行搜索。如何获取某个元素的路径？这是 ruby nokogiri 的示例： page.xpath('//text()').each 做 |textnode| ...

python xpath lxml

回答 4 投票 0

如何在Cygwin下的Python 3.8中安装lxml？

我一直在尝试在Cygwin上使用pip install安装Python3.8下的cython和lxml包。然而，这会反复失败，并出现从 python 错误到 gcc 错误等难以理解的错误

python cygwin lxml cython python-3.8

回答 2 投票 0

如何在迭代编写时强制缩进 python LXML xml 元素嵌套？

我正在使用 LXML 编写一个 xml 文件，该文件是数据库的转储。鉴于数据的大小，我必须反复编写 xml 文件。将 etree 转储到文件时，服务器内存不足

python xml iteration lxml

回答 0 投票 0

循环不是抓取多个页面，只是重复从一个页面返回数据

进口请求从 bs4 导入 BeautifulSoup 将熊猫导入为 pd headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari...

python html web-scraping web lxml

回答 0 投票 0

openpyxl：在没有 zipfile 的情况下获取工作表的 xml 源代码

从 openpyxl 导入 load_workbook wb = load_workbook('file.xlsx') ws = wb['Sheet1'] 有没有办法检索表示 ws 对象的 xml 代码？注意：我想避免使用 zipfile ...

python excel xml lxml openpyxl

回答 1 投票 0

关于美汤4模块的问题

我很困惑，因为这段代码有时有效，有时无效。该代码基于美丽的汤模块。我想知道为什么它在某些情况下有效以及为什么它在其他情况下无效...

python parsing beautifulsoup python-requests lxml

回答 2 投票 0

不能在带有 lxml etree 的 xpath 中使用 translate() 方法

我想使用 Python 中的 lxml 库翻译来降低我的文本。我的代码如下 r = element.xpath('./a/translate(text(), "A", "a")') 但它给了我一个例外： lxml...

python xpath lxml

回答 1 投票 0

XML : lxml.etree - findall() when document element has attributes

.findall() 在文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决？这是代码：从 lxml 导入 etree as et 文本 = '''\ .findall() 当文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决？代码如下： from lxml import etree as et text = '''\ <svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">\ <text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' tree = et.fromstring(text) for elem in tree.findall(".//text"): if elem.text == "ID_NUM.47": elem.getparent().remove(elem) print(et.tostring(tree)) tree.findall(".//text") 返回一个空列表。但是对于以下文档，其中删除了svg标签属性，找到了所有元素： text = '''\ <svg><text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' 此外，例如，当用 .findall() 替换 .xpath('//*[attribute::textLength]') 时，所有元素都在两个文档中找到。

svg xml-parsing lxml elementtree

回答 0 投票 0

在 Python 中键入提示保护/私有类的正确方法？

我这里有一个示例类，我想使用 lxml 来解析 xml 文件。 XML 解析器类： def __init__（自我，路径：海峡）： self.root: etree._Element |无 = 无然而，PyCharm

python annotations lxml type-hinting

回答 1 投票 0

Mypy 函数“lxml.etree.ElementTree”作为类型无效，但为什么呢？

我正在使用 Mypy 来实现这个功能将函数导入为 fu 从 lxml 导入 etree 从 lxml.etree 导入元素，ElementTree def find_nodes(tree: ElementTree, paths: Iterable[str]) -> Iterable[Eleme...

python lxml mypy typing

回答 2 投票 0

尝试使用 Pandas 并不断收到此错误：错误：lxml 的构建轮失败

我正在尝试使用 Pandas 从网络上获取表格我遇到的第一个错误是“找不到 lxml，请安装它”，通过终端安装后，我不断得到...

python jupyter lxml

回答 1 投票 0

如何将 spaCy 模型结果附加到 XML - 需要 XSLT 或 Python 脚本而不损坏标签

我将此 JSON 数据附加到下面的 xml 中： { “para-num”：31， “ele-id”：“71FCC3AE”， “转换标签”：“段”， &quo...

python-3.x xslt beautifulsoup lxml spacy-3

回答 0 投票 0

如何使用 `lxml` 将所有出现的标签更改为特定文本？

我自制的解决方案可能是：将 lxml.etree 导入为 ET def tag2text（节点，sar）： """将 `sar.keys()` 中的元素替换为 `sar.values()` 中的文本。""" 对于 elem, tex...