我有这样的文字
<div class="listing-details" style="outline: 1px solid blue;">
<meta itemprop="startDate" content="2016-04-11T18:30:00.000Z">
<span class="keypoint" title="old" style="outline: 1px solid blue;">
<span>2 - 3 years old</span></span>
<span class="keypoint" title="Bathrooms" style="outline: 1px solid blue;">
<span>1 Bathrooms</span></span>
<span class="keypoint" title="floor" style="outline: 1px solid blue;">
<span>1<sup>st</sup>floor</span></span>
</div>
我想从<span>
这一行中提取</span>
和<span>2 - 3 years old</span>
之间的一个单词所以我尝试了
TAG POS=1 TYPE=div ATTR=class:listing-details EXTRACT=HTM
SET txt1 {{!EXTRACT}}
SET a EVAL("var b='{{txt1}}';var c=b.split('<span>').pop().split('</span>').shift();c;")
PROMPT {{a}}
但这给了我这个输出作为1<sup>st</sup>floor
,这是从这个文本<span>1<sup>st</sup>floor</span>
任何想法我在哪里出错?
谢谢
DOMNICK。
我不熟悉iMacros,但我认为当你击中EVAL
时,你要做的第一件事就是分配
'<meta ...><span class="keypoint" ...><span>2 - 3 years old</span></span><span class="keypoint" ...><span>1 Bathrooms</span></span><span class="keypoint" ...><span>1<sup>st</sup>floor</span></span>'
到b
。在那种情况下,让我们来看看
b.split('<span>').pop().split('</span>').shift();
是在做。
在'<span>'
的每个实例中将字符串拆分为数组。现在你正在经营
[
'<meta ...><span class="keypoint" ...>',
'2 - 3 years old</span></span><span class="keypoint" ...>',
'1 Bathrooms</span></span><span class="keypoint" ...>',
'1<sup>st</sup>floor</span></span>'
]
删除数组的最后一个元素并返回它。现在你正在经营
'1<sup>st</sup>floor</span></span>'
你丢失了你关心的文字。
既然您已经表明愿意对HTML执行字符串操作,那么您也可以使用正则表达式。你可以抓住第一个'<span>'
和第一个</span>
之间的文本
var c = b.match(/<span>(.*?)<\/span>/)[1];
b.match
在b
搜索文字<span>
,然后在找到</span>
之前只匹配必要的字符。它返回一个包含两个元素的数组:正则表达式匹配的完整字符串,以及括号中的部分。你只关心括号中的部分,所以我们只使用数组的那个元素。
关于HTML和正则表达式的强制性警告:
这将不适用于一般情况和MAY SUMMON ZALGO
HTML太复杂了,无法在任何情况下都可靠地处理正则表达式。但是,如果您的HTML受到足够的限制,以至于您知道通过正则表达式发送的每个字符串将如何构建,那么您应该没问题。
如果您在浏览器环境中,那么您可以在纯JavaScript中执行此操作。
let str="<div class=\"listing-details\" style=\"outline: 1px solid blue;\"><meta itemprop=\"startDate\" content=\"2016-04-11T18:30:00.000Z\"><span class=\"keypoint\" title=\"old\" style=\"outline: 1px solid blue;\"><span>2 - 3 years old</span></span><span class=\"keypoint\" title=\"Bathrooms\" style=\"outline: 1px solid blue;\"><span>1 Bathrooms</span></span><span class=\"keypoint\" title=\"floor\" style=\"outline: 1px solid blue;\"><span>1<sup>st</sup>floor</span></span></div>";
let myDiv=document.createElement('div');
myDiv.innerHTML=str;
let spans=myDiv.querySelectorAll('.keypoint>span');
let arr=[];
spans.forEach(span=>{arr.push(span.innerText)});
console.log(arr);