使我感到好奇的东西-据说HTML5中的默认字符编码为UTF-8。但是,如果我有一个带有HTML5文档类型的普通简单HTML文件(如以下代码),则会得到:
俄语中的“ hello”:“ Ð-драÑтвуйÑÑÐе”
在Chrome 33 +,Safari 6,IE11等中,>
<!DOCTYPE html> <html> <head></head> <body> <p>"hello" in Russian is "здраствуйте"</p> </body> </html>
什么给了?浏览器是否应该利用UTF-8 Unicode标准并正确显示文本?我使用的是Coda,它默认设置为以UTF-8编码保存html文件,所以这不是问题。
使我感到好奇的东西-据说HTML5中的默认字符编码为UTF-8。但是,如果我有一个带有HTML5 doctype的普通简单HTML文件(如下面的代码),则会得到:...
示例中的文本数据是UTF-8编码的文本,被误解为window-1252编码。原因是未指定编码,浏览器被迫猜测。要解决此问题,请指定编码;请参见W3C页Character encodings。只要服务器不在HTTP标头中发送错误的编码信息,两种独立于服务器设置的简单方法即可:
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
否则,您将受到本地设置和浏览器自动化的支配。