日语 Windows 操作系统上的 C# 应用程序 - 将拉丁语显示为全角字符
我在上面的链接中提到了接受的答案,并使用下面的代码将日语字符串从全角转换为半角,但它返回相同的全角字符串而不进行转换。
string userInput = "チヨチヨチチヨチヨチ";
string result = userInput.Normalize(NormalizationForm.FormKC);
半宽度的预期输出:チヨチヨチチヨチヨチ 实际输出:チヨヨヨチチヨヨヨチ(全角)
但是,即使上面的代码应该将全角字符串转换为半角字符串,当我将半角字符串 (チヨチヨチチヨチヨチ) 传递给上面的代码时,它会将其转换为全角形式 (チヨチヨチチヨチヨチ).
我在这里做错了什么?
无论如何,如果我的字符串已经是半角,我不希望执行上面的代码。
如何检查字符串是半角还是全角?
根据this文档,标准化方法按预期工作。它必须将字符转换为标准字符,这样二进制比较才能正确应用。
但是,如果您想要始终将全角转换为半角的自定义转换,则可以创建一个 Dictionary 将全角字符映射到半角字符。 此链接可能有助于创建此地图。
如果您想确保字符串是半角,那么如果它包含任何全角字符,则会被拒绝。创建一个所有全角字符(拉丁文和日文)的字符串,然后在全角字符串中查找要测试字符串的所有字符。
我为此目的编写了
isHalfWidthString
方法,并添加了全角到半角转换器方法。我认为这可能会有所帮助:
public class FullWidthCharactersHandler
{
static Dictionary<char, char> fullWidth2halfWidthDic;
static FullWidthCharactersHandler()
{
fullWidth2halfWidthDic = new Dictionary<char, char>();
string fullWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
string halfWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
for (int i = 0; i < fullWidthChars.Length; i++)
{
fullWidth2halfWidthDic.Add(fullWidthChars[i], halfWidthChars[i]);
}
}
public static bool isHalfWidthString(string toTestString)
{
bool isHalfWidth = true;
foreach (char ch in toTestString)
{
if (fullWidth2halfWidthDic.ContainsKey(ch))
{
isHalfWidth = false;
break;
}
}
return isHalfWidth;
}
public static string convertFullWidthToHalfWidth(string theString)
{
StringBuilder sbResult = new StringBuilder(theString);
for (int i = 0; i < theString.Length; i++)
{
if (fullWidth2halfWidthDic.ContainsKey(theString[i]))
{
sbResult[i] = fullWidth2halfWidthDic[theString[i]];
}
}
return sbResult.ToString();
}
}
供测试使用此链接。
我更新了代码以使用
Dictionary
以获得更好的性能。
这是一个检查字符串的第一个字符是否为全角的函数。
public static bool IsFullWidthCharacter(string s)
{
// Check if the character falls within the full-width Unicode range
char c = new char();
if (!string.IsNullOrEmpty(s))
c = s[0];
return c >= '\uFF01' && c <= '\uFF5E';
}