为什么如果您在此页面中搜索 a 或 A,您将找不到 а 或 А?

问题描述 投票:0回答:0

即使您搜索 pP,您也不会找到 рР

(我想现在会有大量的反对票下雨。)

为什么 Unicode 使用不同的代码点,比如 a/A(拉丁文)а/А(西里尔文)?从 的角度来看,这有什么相关性?

让我解释一下我的好奇心所在:

  • a/A 是同一字母的小写/大写版本,用于
    • 意大利语,发音为/a/,
    • 英语,发音为 /a/、/æ/ 或 /e/(可能还有其他音调),具体取决于它出现的单词,
    • 在法语中,...;
  • 一个图形相同的字母а/А在西里尔文中使用,但它被分配给不同的代码点。

a/Aа/А 具有相同的形状,而不是完全不同的发音,那么为什么它们不是 same 代码点(好吧,相同的两个大写和小写)?

我能想到的唯一原因,也是我现在问这个问题时才想到的,是它们属于不同的字母表,如果按顺序排列,给定字母表的字符会更好,例如(在 C++ 中)

assert(u'a' + 1 == u'b')
但是
assert(u'а' + 1 == u'б')
.

这就是唯一的真实原因吗?让字母占据顺序代码?

unicode internationalization language-lawyer software-design
© www.soinside.com 2019 - 2024. All rights reserved.