在 Unicode 中,为什么 क़ 被排除在组合之外,而 Å 则不然?

问题描述 投票:0回答:1

我正在查看 Unicode 规范化形式,发现梵文字母 क़ 被排除在 特定于脚本的排除下的组合之外,而拉丁字母 Å 则不然。这背后的原因是什么?

unicode unicode-normalization
1个回答
0
投票

#15的旧版本解释了原因,甚至使用 Å 作为示例。与 Unicode 中的许多内容一样,答案是“本质上是为了与某些预先存在的标准兼容”。在 #15 的新版本中,Angstrom 符号的解释已移至第 1.2 节

我认为क़被排除的原因相当清楚;拆开这封信会很尴尬。我的母语不是梵文,但我相信可以公平地说,qa 通常被认为是一个“字母”(即使是“外来字母”),而不仅仅是“ka-with-dot”。

虽然 Å 在某些语言中是字母,但它也是 Angstrom 的符号,在这种情况下它实际上是“组合”。

但很多时候,当您看到 Unicode 不一致时,这是由于某些向后兼容性细节造成的。 Unicode 吸收了许多现有的编码,并且通常希望确保可以往返它们。这经常会导致奇怪的情况,Å 就是其中之一,即使它也有一些实际原因(例如 ANGSTROM SIGN 和上面有环的拉丁文大写字母 A 是不同的字符)。

© www.soinside.com 2019 - 2024. All rights reserved.