我们正在为一个网站实现一个博客,该网站支持六种不同的语言,其中五种语言的字母表中包含非拉丁字符。我们不确定是否应该对它们进行编码(这就是我们目前正在做的事情)
Létání s potravinami: Co je dovoleno? 变为 l%c3%a9t%c3%a1n%c3%ad-s-potravinami-co-je-dovoleno 并且浏览器将其显示为 létání-s-potravinami- co-je-dovoleno.
或者我们是否应该将它们替换为拉丁语“对应项”(外观相似的字母)
Létání s potravinami:Co je dovoleno? 变为 letani-s-potravinami-co-je-dovoleno。
我无法找到从 SEO 角度来看什么更好的明确答案?搜索引擎优化对我们来说非常重要。您建议采用哪种方法?
大多数时候,搜索引擎可以很好地处理拉丁语对应词,尽管有时,
"létání"
和"letani"
的结果略有不同。
因此,就 SEO 而言,几乎不会造成任何损害 - 一旦您的网站拥有良好的内容、良好的标记和所有其他内容,您的网站就不会受到拉丁 URL 的影响。
您并不总是知道用户使用的系统浏览器和插件的组合,因此请尽可能简单地使用它们 - 所有网站都在 URL 中使用标准拉丁语,因为非拉丁符号可能会阻塞从服务器到浏览器到任何插件的任何内容。破坏用户体验。
这一点我怎么强调都不过分; SEO之前的用户!
“从 SEO 角度来看什么更好”
你的观众是谁? 美国人认为所有这些额外的字母都是错误的?
或者那些阅读(并搜索)“非 ASCII”字母的人,因为这些非 ASCII 字母是他们语言的一部分?
SEO 是一件不好追逐的事情。 完整、正确、一致和可用是您首先要构建的。
好吧,我建议你用拉丁字母替换它们,因为它是用户友好的,并且你的网站可以在每台计算机上访问(因为键盘从计算机到另一台计算机发生变化,但所有这些都有拉丁字母),但从搜索引擎优化的角度来看,我不知道我认为这不会成为问题。
Pawel,首先,您应该决定是要针对全球 Google (google.com) 还是针对波兰 Google 进行优化。
根据URI规范RFC 3986,仅允许使用7位ASCII字符,并且规范中提到的控制字符中的字符必须被正确转义。 如果您想表示其他字符或 URI 控制字符,那么您应该使用 IRI,RFC 3987。但是请记住,HTTP 与 IRI 不兼容。
当有疑问时RTFM。
另一个问题是,有些 Unicode 代码点的字形在大多数字体中看起来非常相似,这对于网络钓鱼者来说绝对是理想的选择。 坚持使用 ASCII,当字符不同时,字形会明显不同。