如何找到网站的sitemap.xml文件?
例如转到stackoverflow / sitemap.xml会得到404。
在stackoverflow / robots.txt中写入以下内容:
“这在技术上是无效的,因为出于一些遗憾的原因,站点地图路径必须是绝对的而不是相对的。站点地图:/sitemap.xml”
我认为站点地图的位置没有标准。这就是为什么当您使用Google的网站管理员工具添加网站地图时,应该为网站地图指定任意网址的原因。
没有标准,所以没有保证。话虽如此,站点地图常见的是自我标记和根目录,如下所示:
example.com/sitemap.xml
Case在某些服务器上很敏感,因此请记住这一点。如果不存在,请查看根目录中的robots文件:
example.com/robots.txt
如果您没有在漫游器文件中看到它,请前往Google并搜索:
site:example.com filetype:xml
这会将结果限制为目标域上的XML文件。此时它的反复试验和基于您正在使用的网站的细节。如果您从上面的Google搜索词组中获得了几页结果,请尝试进一步限制结果:
filetype:xml site:example.com inurl:sitemap
要么
filetype:xml site:example.com inurl:products
如果你仍然找不到它,你可以right-click > "View Source"
并为Ctrl + F
做一个搜索(又名:“control find”或.xml
),看看代码中是否有对它的引用。
站点地图的位置会影响它可以包含的URL,但是没有标准。这是一个很好的联系,更多的解释:http://www.sitemaps.org/protocol.html#location
根据protocol documentation,网站设计师可以使用至少三个选项将sitemap.xml位置告知搜索引擎:
因此,除非他们选择在robots.txt文件中发布站点地图位置,否则您无法真正知道他们将sitemap.xml文件放在何处。
使用Google搜索运算符为您找到它
使用以下代码搜索谷歌..
inurl:domain.com文件类型:xml
将domain.com更改为您要查找站点地图的域。这应该列出给定域列出的所有xml文件..包括所有站点地图:)