我一直在阅读有关规范标签的内容,但找不到关于文件扩展名是否应包含在规范标签中的明确解释。
我的根文件夹中有三个文件,Google 控制台告诉我并非所有页面都已
索引。谷歌说:
在没有用户选择的规范的情况下进行复制。
那么我如何告诉Google爬虫
index.html
是主版本呢?
在我看到的示例中,没有提到文件名,只是文件夹名称。
在我的示例中,我使用以下虚构网站:
https://portfolio-website.example/index.html
index.html
标题中的规范应该是:
<link rel="canonical" href="https://portfolio-website.example/index.html" />
这是每个
.html
文件使用的模式吗?
index.html
永远不应该成为您网址的一部分。您的规范 URL 中应将其省略。 index.html
应该是一个隐藏文件,用于支持目录请求。用户永远不应该知道您拥有它,因此您应该从 URL 中省略它。
这意味着当您为主页选择规范时,它应该是:
<link rel="canonical" href="https://portfolio-website.example/">
当您链接到主页时,您还应该省略
index.html
。没有它链接到主页的最简单方法是 <a href="/">
(根相对链接,在您的网站内工作)或 <a href="https://portfolio-website.example/">
(绝对链接。)
index.html
是唯一应该以这种方式处理的 HTML 文档。如果您有另一个页面(如 foo.html
),文档名称和扩展名将出现在规范 URL 中。