lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

lxml - ElementMaker:添加属性

让我们假设以下代码片段:page =(E.html(E.head(E.title(“这是一个示例文档”)),E.body(E.h1(“Hello!”,CLASS(“title”) “)),...

回答 1 投票 0

Python3 html和lxml解析器编码问题

使用BeautifulSoup或PyQuery解析一些HTML时,他们将使用像lxml或html5lib这样的解析器。假设我有一个包含以下内容的文件和'在我的...

回答 1 投票 0

webscraping:使用python:airbnb listing从html中的xpath中提取url

我正在尝试使用python 3库从AirBnb中的城市页面中提取列表的URL。我熟悉如何使用Beautifulsoup刮取更简单的网站并请求库。网址:'https:...

回答 1 投票 0

使用xpath从ul中选择li元素

我从Python3上的lxml开始使用XPATH,我无法获得正确的sintaxis来选择内容为ul的所有li元素。我正在尝试这种结构: ..... &...

回答 3 投票 1

带有LXML的标记中的多个XML命名空间

我正在尝试使用Pythons LXML库创建一个可由Garmin的Mapsource产品读取的GPX文件。它们的GPX文件上的标题如下所示

回答 1 投票 14

从(相对)父文件夹导入BeautifulSoup,并在其旁边导入html解析器

这是我的文件夹树:script / main.py dependencies / bs4 / ... requests / ...以下是我从main.py导入模块的方法:import dependencies ....

回答 1 投票 2


Python XPath不断返回空列表

Python中的XPath通过lxml让我在圈子里运行。我不能让它从HTML表中提取文本,尽管我认为它是正确的XPath。我正在使用Chrome来检查和...

回答 1 投票 0

多线程以加快下载速度

如何同时下载多个链接?我下面的脚本有效,但一次只下载一个,速度非常慢。我无法弄清楚如何在我的脚本中加入多线程。 ...

回答 3 投票 1

解析XML后,Python不会释放内存

我正在使用lxml来解析一些非常大的xml文件(每个大约15MB)。虽然我在概念上做的如下:将lxml.etree导入为ET def process_xmls():对于xml_files中的xml_file:...

回答 1 投票 3

GAE dev_appserver“没有名为lxml的模块”

似乎lxml在dev_appserver中不适用于我。我有测试项目是使用windows python sdk 1.6.6构建的导入lxml行。 “没有名为lxml的模块”。我假设有安装版本的东西......

回答 2 投票 3

加快在Python中合并多个XML文件

我正在使用xsl文件来合并多个xml文件。文件数约为100,每个文件有4000个节点。这个例子xml和xsl在这个SO问题中可用我的xmlmerge.py是......

回答 1 投票 0

ansible - 与maven_artifact模块的python lxml问题

我有ansible(v2.0.0.2)和python(v2.7.6),我正在运行'maven_artifact'模块。作为一个直接的ansible命令,它工作正常ansible localhost -m maven_artifact -a“group_id = commons -...

回答 3 投票 1

无法解析来自`th`标签的数据以及来自不同表的`td`标签

我使用xpath在python中编写了一个脚本来解析来自网页的表格数据。执行时,它能够完美地解析表中的数据。我唯一无法修复的是解析......

回答 2 投票 2

如何从没有尾部的lxml中的节点中删除标签?

示例:html = TextText2 BeautifullSoup代码[x.extract()for x in html.findAll(.// b)]在退出中我们有:html = Text2 Lxml代码:[bad ....

回答 2 投票 5

如何在xpath python中转换变量

来自lxml import html import requests pagina ='http://www.beleggen.nl/amx'page = requests.get(pagina)tree = html.fromstring(page.text)aandeel = tree.xpath('// a [ @ title =“Imtech”] / text()')打印...

回答 3 投票 5

如何使用BeautifulSoup在Python中解析谷歌搜索结果

我正在尝试解析谷歌搜索结果的第一页。具体来说,标题和提供的小摘要。以下是我到目前为止的内容:来自urllib.request import urlretrieve import ...

回答 1 投票 1

Python LXML创建具有特定命名空间和结构的xml

我正在尝试从python应用程序创建XML导出,并需要以特定方式为文件的外部收件人构建文件。根节点需要命名空间,但是......

回答 1 投票 0

lxml和python:如何设置“全局”实体

我正在使用lxml来解析python中的xml文件。 xml的目的是配置我的代码。由于我需要使用略有不同的许多不同配置,我使用的是xi:include ...

回答 1 投票 1

从嵌套的xml文件创建pandas数据帧

这是xml文件的一小部分。我想从这里创建一个数据库,每个标签都有唯一的列名和非重复数据。尝试使用lxml和我能做的最好的...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.