即使您搜索 p 或 P,您也不会找到 р 或 Р。
(我想现在会有大量的反对票下雨。)
为什么 Unicode 使用不同的代码点,比如 a/A(拉丁文)а/А(西里尔文)?从 software-design 和 i18n 的角度来看,这有什么相关性?
让我解释一下我的好奇心所在:
a/A 和 а/А 具有相同的形状,而不是完全不同的发音,那么为什么它们不是 same 代码点(好吧,相同的两个大写和小写)?
我能想到的唯一原因,也是我现在问这个问题时才想到的,是它们属于不同的字母表,如果按顺序排列,给定字母表的字符会更好,例如(在 C++ 中)
assert(u'a' + 1 == u'b')
但是 assert(u'а' + 1 == u'б')
.
这就是唯一的真实原因吗?让字母占据顺序代码?