我需要导出房地产的批量数据。有一个选项可以用标题替换网址,但你必须在谷歌表格中一一进行。我希望看看是否有一种方法可以使用应用程序脚本更快地做到这一点。请帮忙:(
我尝试过 IMPORTXML 但它有其局限性。
我在下面尝试过这个,但它只能获取主机网站的名称。
function TitleFromURL(input) {
var regex = /^(?:https?:\/\/)?(?:w{3}\.)?([^\.]+)/;
var match = input.match(regex);
return match ? match[1] : '';
}
样本数据:
A 栏 | B 栏 |
---|---|
https://www.realtor.ca/real-estate/27633475/720b-waverley-road-dartmouth-dartmouth | 出售:720B Waverley Road, Dartmouth, Nova Scotia B2X2G4 - 202426370 |
您提供的网站受到保护,可防止网络抓取访问其内容。这是由于各种安全措施,例如验证码和 IP 阻止,旨在避免未经授权的数据提取。
可以提供的一种替代/可能的解决方案是直接从链接中提取地址。然后可以将提取的地址格式化为
720b Waverley Road Dartmouth Dartmouth
。
样本表数据:
示例代码:
function titleFromURL(url) {
const urlModif = url.split('/').pop().replaceAll("-", " ").replace(/\b(\w)/g, f => f.toUpperCase());
console.log(urlModif);
return urlModif;
}
将代码保存回工作表后,然后在
column B
中输入:
=titleFromURL(A1)
示例输出:
参考: 分割功能