lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

beautifulsoup 上下文中 lxml 和 html5lib 的区别

在 beautifulsoup 的上下文中,lxml 和 html5lib 解析器的功能有区别吗?我正在尝试学习使用 BS4 并使用以下代码构造 - ret = 请求...

回答 2 投票 0

使用lxml xpath解析

我试图实现一个lxml,xpath代码来解析链接中的html:https://www.theice.com/productguide/ProductSpec.shtml?specId=251 具体来说,我试图解析

回答 3 投票 0

使用 LXML 在 Python 中查找字符串的 XPath

我正在尝试开发一个Python脚本,以便轻松提取XML或HTML文件中元素的XPath。 例如,假设我们有下面的 XML 文件 (test.xml),我们希望获得...

回答 1 投票 0

lxml 将元素转换为elementtree

以下测试代码读取文件,并使用lxml.html生成页面的DOM/Graph的叶节点。 然而,我也在试图弄清楚如何从“字符串”中获取输入......

回答 3 投票 0

AttributeError:“NoneType”对象没有属性“get_text” - 即使有一次显示价格,此错误仍不断显示

导入请求 从 bs4 导入 BeautifulSoup 导入lxml 网址 = 'https://www.amazon.com/dp/B075CYMYK6?ref_=cm_sw_r_cp_ud_ct_FM9M699VKHTT47YD50Q6&th=1' 标题={ “用户代理”:“

回答 1 投票 0

如何在 XML 文档上应用一组结构化的、通用的、嵌套的过滤器?

我有一组 XML 文档,需要根据父级上的一组条件进行过滤,以及匹配父级的后代上的一组过滤器。我希望用户能够编写一组

回答 1 投票 0

如何使用0(1)内存的lxml?

我正在尝试使用 ~72G XML 文件。我想将其转换为 CSV。 这是我假设在后台使用迭代器的代码,因为我可能在有关 lxml 的地方读过它。 来自

回答 1 投票 0

在lxml中设置默认命名空间映射

当使用 lxml 处理 XML 时,我的代码最终如下所示: 从 lxml 导入 etree NSMAP = { 'ns1': 'https://example.com/ns1/', 'ns2': 'https://example.com/ns2/', } 根= etree.p...

回答 1 投票 0

如何在Python中添加/使用库(3.5.1)

我最近一直在玩Python,现在已经扩展到做一些事情,比如抓取网站和其他很酷的东西,我需要为这些东西导入新的库,比如lxml,

回答 2 投票 0

使用lxml从href解析实际链接[重复]

使用jupyter笔记本,python 3。 我正在从网上下载一些文件,其中大部分是在本地批量下载的。这些文件列在网页上,但位于 href 属性中。我找到的代码给出了...

回答 1 投票 0

lxml iterparse 会占用 4GB XML 文件的内存,即使使用了clear() 也是如此

该脚本的目的是提取每年出版的文章/书籍的数量,并从 xml 文件 dblp-2023-10-01.xml 中的元素获取此信息。该文件可以找到...

回答 1 投票 0

添加/追加新的 xml 节点到现有 xml 文件 - python

我有一个如下所示的xml文件 a1 我有一个如下所示的 xml 文件 <add-g> <entry name="g1"> <static> <member>a1</member> </static> </entry> <entry name="g2"> <static> <member>a1</member> </static> </entry> </add-g> 我需要在同一个 xml 文件中附加另一个条目名称,例如 g3 和成员 a3,以便最终结构为: 如何使用 lxml 在 python 中执行此操作 <add-g> <entry name="g1"> <static> <member>a1</member> </static> </entry> <entry name="g2"> <static> <member>a1</member> </static> </entry> <entry name="g3"> <static> <member>a1</member> </static> </entry> </add-g> 请先尝试并在此处发布您的问题。 这就是您实现目标的方法。 from lxml import etree # Load your XML xml_string = '''<add-g> <entry name="g1"> <static> <member>a1</member> </static> </entry> <entry name="g2"> <static> <member>a1</member> </static> </entry> </add-g>''' # Parse the XML root = etree.fromstring(xml_string) # Create new entry new_entry = etree.Element("entry", name="g3") new_static = etree.SubElement(new_entry, "static") new_member = etree.SubElement(new_static, "member") new_member.text = "a3" # Append the new entry to the root element root.append(new_entry) # Convert back to string (or write to file) updated_xml = etree.tostring(root, pretty_print=True, xml_declaration=True, encoding="UTF-8") print(updated_xml.decode())

回答 1 投票 0

legacy-install-failure × 尝试安装包时遇到错误 - lxml

我正在尝试在我的 AMD win11 笔记本电脑上安装 harwest。 当我尝试使用 pip install harwest 安装它时,我得到以下输出 采集收获 使用缓存的 harwest-0.3....

回答 1 投票 0

如果我想要保留一组给定的元素,如何从 lxml 树中删除项目?

我正在编写一个Python xml(netconf)解析器,目标是从服务器获取rpc-reply xml,修改一些项目,并生成一个最小的配置.xml,然后可以将其发送到服务器。 当

回答 3 投票 0

使用 lxml 在文本前添加元素

我有一些 XML,我想在文本之前插入一个新元素。 我试过: 从 lxml 导入 etree xml =“一些文本” 根 = etree.froms...

回答 1 投票 0

在Python中从给定的html获取所有xpath列表的最佳方法是什么?

我希望从Python中的给定html中获取所有xpath的列表。我当前的实现仅使用 lxml 库为我提供相对 xpath。我需要 xpath 来使用 ids 和其他

回答 1 投票 0

无法在 Python 3.7 中导入名称“etree”,我怎样才能让它工作?

我正在学习《用 Python 自动化无聊的事情》第 13 章,但不知道如何让 python-docx 模块工作。当我尝试导入它时 ImportError: Cannot import name 'etree...

回答 1 投票 0

在 Python 中使用 request 和 LXML 抓取网站

我正在尝试抓取此网站以获取图块和正文内容(“说明”和“功能”)以及链接到该页面的 pdf。当我尝试使用 Xpath 获取文本时,我...

回答 1 投票 0

有条件地用Python替换XML(Word文档)中的节点?

如何根据附近标签的内容替换 xml? 我有一个很长的 Word 文档,其中包含许多开发人员内容字段,特别是下拉列表。我想改变选择...

回答 1 投票 0

如何在Python中使用lxml将包含XML的字符串作为XML插入(追加)到内部XML(或删除父标签但保留内容)?

我正在尝试使用 lxml 将文本插入到 XML 中。该文本包含 XML,它应该成为它所插入的 XML 的一部分。 以下代码不起作用: 从 lxml 导入 etree 树=

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.