我希望从精选的网页中获取原始维基文本(可以使用或不使用 MediaWiki 生成)。
我尝试以编程方式查看网页的 HTML,确定它是否使用 MediaWiki 并获取原始 wiki 文本,否则跳过。到目前为止,MediaWiki 页面似乎倾向于:
<meta>
标签,带有 name=generator
和 content=MediaWiki...
alt=Powered by MediaWiki
的 这是寻找其中之一并尝试使用查询参数获取原始维基文本的好方法
action=raw
还是有更好的方法来做到这一点?
谢谢
好的,尝试获取它:
http://Host of test needed/path (if have)/index. php?title=Special:Version
如果回复包含“MediaWiki”和“PHP”和“Lua”,则该网站由 MediaWiki 提供支持。