我有兴趣收集关于SO最受欢迎的问题的统计数据。使用Geb,我试图提取相关的HTML:
@Integration
class PlayTestsSpec extends GebSpec {
void "check stackoverflow"() {
when: "Go to so"
go "https://stackoverflow.com/questions/1223354/undo-git-pull-how-to-bring-repos-to-old-state"
$('#sidebar.show-votes div.related.js-gps-related-questions').children()
then:
System.out.println("Done.")
}
}
我实际上最终得到一个数组(?)的div:
[<div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">, <div class="spacer">]
我如何迭代这些div中的每一个并提取投票计数器和问题标题?
创建一个RelatedQuestionModule
,然后使用children().moduleList(RelatedQuestionModule)
。
更好,使用Stack Overflow Data Explorer,这是为了这种事情。