有没有可靠的方法来确定网页是否是使用MediaWiki生成的?

问题描述 投票:0回答:1

我希望从精选的网页中获取原始维基文本(可以使用或不使用 MediaWiki 生成)。

我尝试以编程方式查看网页的 HTML,确定它是否使用 MediaWiki 并获取原始 wiki 文本,否则跳过。到目前为止,MediaWiki 页面似乎倾向于:

  • a
    <meta>
    标签,带有
    name=generator
    content=MediaWiki...
  • 页脚中的
  • “由 MediaWiki 提供支持”图像,因此请查找带有 alt=Powered by MediaWiki
  • 标签

这是寻找其中之一并尝试使用查询参数获取原始维基文本的好方法

action=raw
还是有更好的方法来做到这一点?

谢谢

mediawiki
1个回答
0
投票

好的,尝试获取它:

http://Host of test needed/path (if have)/index. php?title=Special:Version

如果回复包含“MediaWiki”和“PHP”和“Lua”,则该网站由 MediaWiki 提供支持。

© www.soinside.com 2019 - 2024. All rights reserved.