我想知道在Java中使用德语,日语,韩语和使用C语言的utf8处理特殊字符(如β)是否存在问题。
我们在java端使用java.text.Normalizer.Form.NFD并将字符串传递给DB,我们在C中使用自定义函数来规范化字符串。我们遇到有上升和特殊字符的名称的问题。例如:如果名字有ÄßÜ标准化DB后,将其更改为用于标准化的C函数中的“保持”。
这是在C中的UTF8的问题,还是Java和C规范化器函数之间的不匹配。我们应该如何处理这些特殊字符..
尝试使用Normalizer.Form.NFC或Normalizer.Form.NFKC,你可以找到其他信息here