假设我有一个网址,例如...
http://www.example.com/random-garbage-here-i-dont-want-12392/video2983439
是否有一个程序可以让我将这个测试字符串放入其中,突出显示/选择我想要保留的部分,然后删除其余部分并将其转换为正则表达式来使用?我只是无法弄清楚我一生的正则表达式。
我正在尝试抓取网站上的 URL,但除了一些一致的特征之外,它们都是唯一的。上面我想保留的一致特征以粗体突出显示,同时忽略所有非粗体...这样,当我爬行网站时,它将遵循与粗体部分类似的 URL。
以下代码在 TCL 中对我有用
% regexp -- {http://www.example.com/[a-zA-Z0-9-]*/video[0-9]*} http://www.example.com/random-garbage-here-i-dont-want-1
2392/video2983439
1
%