lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

Python。使用lxml复制xml中的节点时标签不匹配

我是一个新的xml,正试图复制一个节点。虽然它复制了节点,但当我追加它时,结尾标签不匹配。这是我正在解析的xml。

回答 1 投票 1

用Python3创建XML文件

我遇到了一个问题,不知道如何解决。我有两种类型的对象,集合和元素,它们有很多属性,我需要把它写成XML一样。

回答 1 投票 0



[使用lxml的xml文件中的节点名称

我有一个具有这样结构的xml文件: [[[----

回答 2 投票 0

TypeError:参数必须为字节或Unicode,得到'_Element'

具有此Python脚本由于某种原因而产生错误。错误是:追溯(最近一次呼叫最近):文件“ scraper2.py”,第79行,位于 etree.SubElement(coinx,“ ...

回答 1 投票 0

python3 lxml如何通过XPath之后的属性名称获取属性值

[使用xpath方法时,如何获得XPath结果的子代的属性ID的值(在下面的示例中应为“ DEF”)?从lxml从io导入etree从io导入StringIO f ...

回答 2 投票 0

使用Python解析大型复杂的专利分类XML文件

我正在尝试解析大型文件,尤其是英文版本的https://www.wipo.int/ipc/itos4ipc/ITSupport_and_download_area/20200101/MasterFiles/index.html,这是专利的分类...] >

回答 2 投票 0

XPath表达式可捕获特定根目录下的所有嵌套文本

[我有一些HTML,我希望使用Python + lxml从中提取文本内容

回答 1 投票 0


如何使用python将字典值插入html模板文件?

我有一个html模板文件,如下所示,我想用python脚本中的字典值替换标题和正文。

回答 1 投票 1

ImportError:似乎未安装cssselect。参见http://packages.python.org/cssselect/

我已经使用pip install cssselect安装了,但仍无法导入?我在Windows上。

回答 2 投票 0

使用Python / lxml.html,是否可以获取单选按钮的标签?

我在一个网页上有三个单选按钮(在一个组中),如下所示进行了检查:蓝色

回答 1 投票 -1

空列表LXML XPATH

我在提供的链接中有问题(https://www.avisosdeocasion.com/Resultados-Inmuebles.aspx?n=venta-casas-nuevo-leon&PlazaBusqueda=2&Plaza=2.html)我正在尝试得到第一个...

回答 1 投票 -1

在python 3.6中安装libxml2和libxslt

我在使用Pycharm和PIP在python 3.6 64bit中安装lxml 3.6.4时遇到一些问题。 pip install lxml == 3.6.4错误:b“'xslt-config'无法识别为内部或外部命令,\ r \ ...

回答 1 投票 1


lxml + django + uwsgi无法生成正确格式的Excel文件?

当我的项目在我的环境中安装了lxml时,当我的项目以uwsgi开头时,无法打开生成的excel文件,因为可以使用django manage.py runserver和gunicorn我的主要对象成功地打开它,] ...

回答 1 投票 2

“ bs4.FeatureNotFound:安装lxml后找不到具有您请求的功能的树生成器:lxml”

我正在尝试使用Beautiful Soup来解析XML文档。这是我实例化BeautifulSoup对象的代码:open(filename,encoding ='utf-8')as f_:content = f_.read()xml_cont = ...

回答 1 投票 0

lxml影响django + uwsgi生成的excel文件??

当我的项目在我的环境中安装了lxml时,当我的项目以uwsgi开头时,无法打开生成的excel文件,因为可以使用django manage.py runserver和gunicorn我的主要对象成功地打开它,] ...

回答 1 投票 2

在lxml Python 3中如何递归所有链接的ids

我有这样的xml: [[[[ ]]]] 尝试以下代码: from lxml import etree as et parser = et.XMLParser(remove_blank_text=True) tree = et.parse('Input.xml', parser) root = tree.getroot() cidList = ['title001'] # Your source list cidDct = { x: 0 for x in cidList } for elem in root.iter('content'): cid = elem.attrib.get('content-id', '') # print(f'{elem.tag:15} {cid}') if cid in cidDct.keys(): # print(f'Found: {cid}') for elem2 in elem.iter(): cid2 = elem2.attrib.get('content-id', '') if len(cid2) > 0: # print(f'Add: {cid2}') cidDct[cid2] = 0 对于测试,您可以在上面取消注释打印输出。 现在打印list(cidDct.keys())时,将得到想要 ids :['title001', 'Number1', 'Number2', 'Number1b']

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.