lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

从HTML中的script元素内部提取对象键的值

window.realty = {"user_id":4243456}; <!--window.agency = < %- JSON.stringify(agency) % >;-...

回答 3 投票 2

如何使用python调整xml文件中的时间序列数据

有没有一种使用python从xml文件更改数据的简单方法?在我的例子中,我有一个包含许多时间序列的大型xml文件,看起来像;

回答 1 投票 2

为什么lxml.etree.iterparse()占用了我所有的记忆?

这最终消耗了我所有可用的内存,然后该进程被终止。我已经尝试将标签从计划更改为“较小”标签,但这并没有什么区别。我究竟做错了什么 /...

回答 3 投票 18

如何释放lxml.etree使用的内存?

我正在使用lxml.etree从一堆XML文件中加载数据,但是一旦我完成了这个初始解析,我想关闭它们。目前,以下代码中的XML_FILES列表占用了350 MiB的...

回答 4 投票 6

LXML问题在Python 3中解析XML模式

我正在尝试使用XRDTools库将Panalytical XRDML文件转换为更加数据库友好的格式,例如pandas数据帧。这里描述了XRDTools库:https:// github ....

回答 1 投票 0

Python - 大型XML到JSON到文件/ RAM和交换过载

我目前正致力于通过OpenStreetMaps省/州转储创建一种Pythonic解析方式;据我所知,只知道如何处理非常大的XML文件(对吧?)。我......

回答 2 投票 2

Python 3使用lxml编写大型(300+ mb)XML

我一直在谷歌搜索过去几天,但我根本找不到任何远程类似问题:(我在Python 3中的脚本有一个简单的目标:连接到MySQL数据库并获取数据创建XML与...

回答 1 投票 0

如何通过lxml XPath从HTML中提取img src?

我正在尝试使用python / lxml和xpath()命令提取图像URl,但是在隔离url本身时遇到了问题。这是我想要的img src的HTML:

回答 2 投票 0

lxml xpath无法导入名称etree

在这个lxml xpath教程之后使用Ubuntu 14.04 https://www.youtube.com/watch?v=PgWfF-Ut0zM更新了这个下载pip上游版本的lxml https://stackoverflow.com/a/33089634 ...

回答 1 投票 1

如何使用lxml获取XML声明字符串

我使用lxml来解析XML文档如何获取声明字符串?我想检查它是否存在,它具有什么编码以及xml版本。

回答 2 投票 1

我如何使用lxml和python遍历 of a html document along with its children

我想拿一个HTML文档并遍历 part of the document with its children. I see lots of examples to get a subtree via xpath or tag name but this doesn't seem to give ...

回答 2 投票 0

无法使用我的scraper中定义的xpath获取项目

我试图创建两个xpath来从一些元素中获取两个项目。然而,第一个是伟大的,但在第二个:我无法得到任何想法。任何有关这方面的帮助将不胜感激。

回答 1 投票 1

lxml - 从间接url转换为direct url

我使用python和lxml来收集一些网络数据。如果我有一些元素:从lxml导入请求导入html r = requests.get(url)tree = html.fromstring(r.text)file_ = tree.xpath('some_xpath'...

回答 1 投票 0

Python:如果XML标签不存在,我需要打印'Blank'和Output

忽略以下文本段落XML代码,万维网联盟(W3C)的正式建议类似于超文本标记语言(HTML)。 XML和HTML都包含标记符号......

回答 1 投票 0

美丽的汤(代码工作)现在只返回某些标签

几个星期前我正在抓取这个网站,但有些代码不再适用。此代码按预期返回所有内容:来自bs4 import BeautifulSoup导入请求url ='https:// www ....

回答 1 投票 0

解析糟糕的XHTML

我的新项目是从Naxos音乐术语词汇表中提取数据,这是一个很好的资源,我想要处理的文本数据被提取到数据库,以便在我将要创建的另一个更简单的网站上使用。 ...

回答 1 投票 0

使用POST的Flask示例

假设以下路由访问xml文件以使用给定的xpath替换特定标记的文本(?key =):@ app.route('/ resource',methods = ['POST'])def update_text(): #CODE ......

回答 3 投票 29

使用xpath和LXML或selenium从HTML表中搜索数据

我需要从这个网站从HTML表中提取数据:https://1x2.lucksport.com/result_en.shtml?dt = 2019-04-12&cid = 156我使用Python,selenium和lxml与xpath我想提取每个匹配...

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.