HHeLiBeXの日記 正道編

日々の記憶の記録とメモ‥

2012-01-10から1日間の記事一覧

MySQLで4バイトのUTF-8文字を扱ってみる

JIS X 0213:2004で追加された「叱」の異体字は、Unicodeにおいては「UTF-8で符号化すると4バイトになる」コードが割り当てられている。また、中国語をまともに扱おうと思ったら「UTF-8で4バイト」の文字を扱う必要が出てくる。 そんな文字どもをMySQLデータ…