我需要确定给定字体中的给定字符是否属于给定子范围。例如,根据 Windows 字符映射表应用程序,U+0041 属于拉丁语子范围。有没有办法使用 Python 2.7(或更准确地说是 IronPython 2.7)来实现这一点?
真诚的; 米歇尔
看起来有人已经为此构建了一个工具。请参阅以下要点中的
script_cat(chr)
函数:https://gist.github.com/anonymous/2204527。
但是,上面的要点已有 12 年历史,并且似乎没有许可证。使用 Unicode 直接提供的脚本数据库可能会更好。
您可以在以下位置下载最新版本的脚本数据库:https://www.unicode.org/Public/UCD/latest/ucd/Scripts.txt.