我正在开发 CMS,在我们对新的多语言网站的最新测试中,我可以看到 GOOGLE 搜索控制台中的某些页面被设置为“没有用户选择的规范的重复”。
例如,以下内容设为“没有用户选择的规范的重复”:
https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria
现在在该页面的 sitemap.xml 中我有:
<url>
<loc>https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria</loc>
<lastmod>2023-10-03</lastmod>
<xhtml:link rel="alternate" hreflang="en" href="https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
<xhtml:link rel="alternate" hreflang="es" href="https://www.gotomdz.com/es/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
<xhtml:link rel="alternate" hreflang="pt" href="https://www.gotomdz.com/pt/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
</url>
如您所见,我让谷歌知道同一页面有多种语言版本。内容几乎相同,但已完全翻译,所以我的目标是这些页面都被索引。
查看谷歌文档我可以阅读以下内容:
可以通过三种方式来指示多语言/区域设置版本 谷歌页面:
- HTML
- HTTP 标头
- 网站地图
这三种方法从Google的角度来说是等价的,你可以 选择对您的网站最方便的方法。当你 可以同时使用这三种方法,没有什么好处 搜索
那么,我认为我的 sitemap.xml 就足够了,对吧?
现在,关于“rel=canonical”,我认为这对我来说是不正确的,因为它们是不同的页面。我不在网站的任何部分使用“rel=canonical”。
恐怕并非所有内容都被索引。
现在,查看索引内容:
最后一个网址是错误的。这是一个旧链接,我必须看看如何在搜索控制台中删除它。
除此之外,我可以看到所有页面都已索引。
但是,如你所见
https://gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria
已编入索引,但以下内容未编入索引:
https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria
不知道如何处理这个问题
在 sitemap.xml 中,我使用完整的站点 URL (https://www.gotomdz.com),而不是不带 www 的域 (https://gotomdz.com)。
我是否还必须将“https://gotomdz.com”网址添加到 sitemap.xml 中,并用“rel=canonical”标记“https://www.gotomdz.com”?你觉得怎么样?
谢谢你
你的错误页面需要返回404 HTTP状态码来告诉Google它不存在。然后 goog 会将其报告为不在索引范围内,因为它是 404。
您应该 301 重定向您的所有 www.页面转换为不带 www 的等效页面。这将阻止您出现未编入索引的重复页面。然后他们将被报告为 301ing,这很好。
如果您使用规范标签,请让页面自行规范化。