我正在努力为符合凯利蓝皮书中特定条件的汽车动态提取汽车价值。我有这个IMPORTXML
查询,该查询具有指向显示汽车以旧换新值的特定页面的链接。
=IMPORTXML("https://www.kbb.com/Api/3.9.462.0/71553/vehicle/upa/PriceAdvisor/meter.svg?action=Get&intent=trade-in-sell&pricetype=FPP&zipcode=12345&vehicleid=411852&selectedoptions=6762567|true|6762674|false|6762900|false|6762905|false|6762909|false|6762913|false|6762915|true|6762926|false|6762928|false&hideMonthlyPayment=False&condition=verygood&mileage=40000", "//text[@y='-8']")
在此URL中,有一个文本字段,其y坐标为-8。我希望识别我要提取的数据(以旧换新值)就足够了。我得到了标准的“无法提取URL错误”,无法查明原因。
问题不在您的XPath "//text[@y='-8']"
中,而在网站本身中。
基本上,您有两种选择来测试是否可以删除网站:
=IMPORTXML("URL", "//*")
XPath //*
的意思是“一切可能刮擦的东西”
和直接的源代码刮取方法:
=IMPORTDATA("URL")
有时源代码非常庞大,Google表格无法对其进行处理,因此需要对此进行一些限制:
=ARRAY_CONSTRAIN(IMPORTDATA("URL"), 10000, 10)
无论如何,这些都不可以从您的网址中抓取任何内容