网站上的Google Sheets IMPORTXML文本字段

问题描述 投票:0回答:1

我正在努力为符合凯利蓝皮书中特定条件的汽车动态提取汽车价值。我有这个IMPORTXML查询,该查询具有指向显示汽车以旧换新值的特定页面的链接。

=IMPORTXML("https://www.kbb.com/Api/3.9.462.0/71553/vehicle/upa/PriceAdvisor/meter.svg?action=Get&intent=trade-in-sell&pricetype=FPP&zipcode=12345&vehicleid=411852&selectedoptions=6762567|true|6762674|false|6762900|false|6762905|false|6762909|false|6762913|false|6762915|true|6762926|false|6762928|false&hideMonthlyPayment=False&condition=verygood&mileage=40000", "//text[@y='-8']")

在此URL中,有一个文本字段,其y坐标为-8。我希望识别我要提取的数据(以旧换新值)就足够了。我得到了标准的“无法提取URL错误”,无法查明原因。

xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml
1个回答
0
投票

问题不在您的XPath "//text[@y='-8']"中,而在网站本身中。

基本上,您有两种选择来测试是否可以删除网站:

=IMPORTXML("URL", "//*")

XPath //*的意思是“一切可能刮擦的东西”

和直接的源代码刮取方法:

=IMPORTDATA("URL")

有时源代码非常庞大,Google表格无法对其进行处理,因此需要对此进行一些限制:

=ARRAY_CONSTRAIN(IMPORTDATA("URL"), 10000, 10)

无论如何,这些都不可以从您的网址中抓取任何内容

© www.soinside.com 2019 - 2024. All rights reserved.