Html 字元編碼
在編輯 html 原始碼時, 出現非 ascii 字元時(例如中文), 則我們必須要明確寫出這一個檔案的編碼資訊。
目前最被推薦的編碼方式是使用 utf-8 編碼。 也就是在 <head> ... </head> 加入:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Html 中文 亂碼
Question: 為什麼有時候,明明已經在 <head> ... </head> 裡頭明確指出使用 utf-8 編碼, 可是用瀏覽器打開卻是一堆亂碼?
Answer: 當你在原始碼裡頭指出這份文件是 utf-8 編碼, 但儲存這份文件的時卻不是使用 utf-8 編碼,就會造成瀏覽器把這份檔案當 utf-8 編碼去顯示而出現亂碼。
在 Windows 裡頭,容易會出現這種情況, 因為在使用記事本(或其他文字編輯器)編輯文字檔時, 當文字檔裡頭有中文時,在儲存檔案時,預設是使用 Big5 編碼儲存。 因此出現了這份文件在 <head> ... </head> 裡指明這份文件是 utf-8 編碼, 但實際存檔的編碼卻不是,因此在用瀏覽器打開時,就會出現亂碼。
Solution: 存檔時選擇 utf-8 編碼。 可使用 gedit 這套文字編輯器來編輯儲存,gedit [1] 在存檔時可選擇編碼方式。
- 字元編碼 Unicode
- 瞭解 Unicode
- http://python.ez2learn.com/basic/unicode.html
- 每個軟體開發者都絕對一定要會的Unicode及字元集必備知識(沒有藉口!)
- http://local.joelonsoftware.com/mediawiki/index.php/The_Joel_on_Software_Translation_Project:%E8%90%AC%E5%9C%8B%E7%A2%BC
[1] | gedit 一個跨平台的純文字編輯器 |