en_US.UTF-8的整理和比较映射的实际定义在哪里?我假设某个地方有一些标准文档,参考源代码和/或数据表?
这是Unicode。
/usr/lib/locale/en_US.utf8/LC_COLLATE
由localedef
创建。 man localedef
显示输入路径/usr/share/i18n/locales
。
/usr/share/i18n/locales/en_US
§LC_COLLATE
引用文件iso14651_t1
,该文件引用iso14651_t1_common
,这是一个file published by ISO,它告诉我们原始来源unidata-9.0.0.txt
。运行git clone git://sourceware.org/git/glibc.git
以查看这些文件的历史记录。
[http://enwp.org/ISO_14651说,ISO标准和UCA是对齐的,因此unicode.org上的对应文件是allkeys.txt。