将UTF-16文件转换为UTF-8的最佳方法是什么?我需要在cmd脚本中使用它。
有一个GNU工具recode,你也可以在Windows上使用它。例如。
recode utf16..utf8 text.txt
Ruby的另一种选择是在C#中编写一个小的.NET程序(.NET 1.0会很好,虽然2.0会更简单:) - 这是一个非常简单的代码。您是否希望在没有任何其他应用程序的情况下完成此操作?如果你想要一些代码来做,请添加评论,我会填写答案......
编辑:好的,这没有任何错误检查,但......
using System;
using System.IO;
using System.Text;
class FileConverter
{
static void Main(string[] args)
{
string inputFile = args[0];
string outputFile = args[1];
using (StreamReader reader = new StreamReader(inputFile, Encoding.Unicode))
{
using (StreamWriter writer = new StreamWriter(outputFile, false, Encoding.UTF8))
{
CopyContents(reader, writer);
}
}
}
static void CopyContents(TextReader input, TextWriter output)
{
char[] buffer = new char[8192];
int len;
while ((len = input.Read(buffer, 0, buffer.Length)) != 0)
{
output.Write(buffer, 0, len);
}
}
}
当然,最简单的方法是将脚本加载到记事本中,然后使用UTF-8编码再次保存。这是“另存为”对话框中的一个选项。
也许与iconv?
如果您安装了ruby发行版,则可以调用ruby脚本来处理转换:
Ruby script to convert file(s) character encoding
本着同样的精神:Perl script
在没有脚本支持的情况下,你必须使用WideCharToMultiByte()调用来编码它像C++ source ...
您可以使用内置的PowerShell cmdlet轻松完成此操作,您可以从cmd调用它:
C:\> powershell -c "Get-Content mytext.txt | Set-Content -Encoding utf8 mytext_utf8.txt"