多语言网站,某些页面标记为“重复,但没有用户选择的规范”,可能与带有 www 和无 www 的域相关的问题

问题描述 投票:0回答:1

我正在开发 CMS,在我们对新的多语言网站的最新测试中,我可以看到 GOOGLE 搜索控制台中的某些页面被设置为“没有用户选择的规范的重复”。

例如,以下内容设为“没有用户选择的规范的重复”:

https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria

现在在该页面的 sitemap.xml 中我有:

<url>
    <loc>https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria</loc>
    <lastmod>2023-10-03</lastmod>
    <xhtml:link rel="alternate" hreflang="en" href="https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
    <xhtml:link rel="alternate" hreflang="es" href="https://www.gotomdz.com/es/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
    <xhtml:link rel="alternate" hreflang="pt" href="https://www.gotomdz.com/pt/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria"/>
</url>

如您所见,我让谷歌知道同一页面有多种语言版本。内容几乎相同,但已完全翻译,所以我的目标是这些页面都被索引。

查看谷歌文档我可以阅读以下内容:

可以通过三种方式来指示多语言/区域设置版本 谷歌页面:

  • HTML
  • HTTP 标头
  • 网站地图

这三种方法从Google的角度来说是等价的,你可以 选择对您的网站最方便的方法。当你 可以同时使用这三种方法,没有什么好处 搜索

那么,我认为我的 sitemap.xml 就足够了,对吧?

现在,关于“rel=canonical”,我认为这对我来说是不正确的,因为它们是不同的页面。我不在网站的任何部分使用“rel=canonical”。

恐怕并非所有内容都被索引。

现在,查看索引内容:

最后一个网址是错误的。这是一个旧链接,我必须看看如何在搜索控制台中删除它。

除此之外,我可以看到所有页面都已索引。

但是,如你所见

https://gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria

已编入索引,但以下内容未编入索引:

https://www.gotomdz.com/en/place/detail/c5ac334a-6d5e-473b-a46f-70e81c559cf6/cerro-de-la-gloria

不知道如何处理这个问题

在 sitemap.xml 中,我使用完整的站点 URL (https://www.gotomdz.com),而不是不带 www 的域 (https://gotomdz.com)。

我是否还必须将“https://gotomdz.com”网址添加到 sitemap.xml 中,并用“rel=canonical”标记“https://www.gotomdz.com”?你觉得怎么样?

谢谢你

seo content-management-system sitemap google-search-console
1个回答
0
投票

你的错误页面需要返回404 HTTP状态码来告诉Google它不存在。然后 goog 会将其报告为不在索引范围内,因为它是 404。

您应该 301 重定向您的所有 www.页面转换为不带 www 的等效页面。这将阻止您出现未编入索引的重复页面。然后他们将被报告为 301ing,这很好。

如果您使用规范标签,请让页面自行规范化。

© www.soinside.com 2019 - 2024. All rights reserved.