防止网站被刮伤

问题描述 投票:4回答:2

http://www.vibrantneo.org有一个wordpress网站,目前正以某种方式在http://vibrantneo.123productpages.com/克隆。非常奇怪的是,这个特定的域名(http://www.123productpages.com)似乎对很多内容这样做了,但网上没有任何投诉。

此服务未被选中。它未经同意就完成了。我检查了Firebug,没有提到引用该站点的原始服务器。这是恶意网站吗?为什么没有讨论影响他人的“服务”?

*更新*事实证明,这123个产品页面实际上是以某种方式引用http://www.vibrantneo.org在主机上的实际文件。例如:将wp-config更改为无效凭据会导致两个站点崩溃。

可能是一种特洛伊木马。关于这个领域及其实践如何更加公开仍然令人困惑。希望这篇文章找到了解决失败点的同样问题的人。

*更新#2 *所以它看起来并不像我怀疑的那样恶意。虽然仍然非常不道德。它看起来像拉入内容并更改对其域的所有引用一样简单。所有内容仍然托管在真实服务器上。

例如:http://blah.123productpages.com将反映www.blah.com。当然,他们似乎必须“设置”特定域名。

我目前的修复包括添加一个简单的js片段来检查伪加密域,看看它是否是正确的域,如果不是,则重定向。

以下是blah.com的一个例子。 domain只是域名,blah.com由简单的123分隔(当然可以生成更复杂的密钥)。

<script type="text/javascript">
    var u = top.location.toString();
    var domain = 'b123l123a123h123.123c123o123o123m'.toString();
    var domain_decrypted = domain.replace(/123/gi, '');

    if (u.indexOf(domain_decrypted) == -1) {
        top.location = 'http://' + domain_decrypted;
    }
</script>
wordpress web-scraping
2个回答
3
投票

如果您以公共消费方式公开内容,则可以将其删除。您可以花时间寻找看似来自刮刀的流量,然后阻止该IP,但这是一个单调乏味的猫捉老鼠游戏。

我的建议是接受这个将内容放在网上并继续前进的现实。


1
投票

也许你可以发送123productpages.com传真,禁止他们复制你的内容?

这是他们根据whois的联系信息:

谁检查123productpages.com:

=-=-=-=

通过以下公司注册:DomainPeople,Inc。

域名:123productpages.com

注册人联系人:WhoisProtector Inc. WhoisProtector 123productpages.com()传真:100 N Riverside,Suite 800 Chicago,IL 60606 US

行政联系方式:WhoisProtector Inc. WhoisProtector 123productpages.com([email protected]) +1.3129947654传真:100 N Riverside,Suite 800 Chicago,IL 60606 US

技术联系人:WhoisProtector Inc. WhoisProtector 123productpages.com([email protected]) +1.3129947654传真:100 N Riverside,Suite 800 Chicago,IL 60606 US

状态:已锁定

名称服务器:ns1.publishergateway.net ns2.publishergateway.net创建日期:2009年6月28日18:47:26到期日:2013年6月28日18:47:00

© www.soinside.com 2019 - 2024. All rights reserved.