MySQLの文字コードをutf8mb4にする
前にherokuで同じことをやった。
今度はmy.cnfとかをいじりつつ手元のMySQLに対して、文字コードをutf8mb4に設定する。絵文字を格納するために必要。
環境
$ mysql --version mysql Ver 14.14 Distrib 5.6.25, for Linux (x86_64) using EditLine wrapper $ cat /etc/redhat-release CentOS release 6.6 (Final)
現在の文字コードの確認
mysql> show variables like '%char%'; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | latin1 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | latin1 | | character_set_system | utf8 | | character_sets_dir | /usr/share/mysql/charsets/ | +--------------------------+----------------------------+ 8 rows in set (0.00 sec)
使用可能な文字コードの確認
mysql> show character set; +----------+-----------------------------+---------------------+--------+ | Charset | Description | Default collation | Maxlen | +----------+-----------------------------+---------------------+--------+ | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | | dec8 | DEC West European | dec8_swedish_ci | 1 | | cp850 | DOS West European | cp850_general_ci | 1 | | hp8 | HP West European | hp8_english_ci | 1 | | koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 | | latin1 | cp1252 West European | latin1_swedish_ci | 1 | | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 | | swe7 | 7bit Swedish | swe7_swedish_ci | 1 | | ascii | US ASCII | ascii_general_ci | 1 | | ujis | EUC-JP Japanese | ujis_japanese_ci | 3 | | sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 | | hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 | | tis620 | TIS620 Thai | tis620_thai_ci | 1 | | euckr | EUC-KR Korean | euckr_korean_ci | 2 | | koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 | | gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 | | greek | ISO 8859-7 Greek | greek_general_ci | 1 | | cp1250 | Windows Central European | cp1250_general_ci | 1 | | gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 | | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 | | armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 | | utf8 | UTF-8 Unicode | utf8_general_ci | 3 | | ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 | | cp866 | DOS Russian | cp866_general_ci | 1 | | keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 | | macce | Mac Central European | macce_general_ci | 1 | | macroman | Mac West European | macroman_general_ci | 1 | | cp852 | DOS Central European | cp852_general_ci | 1 | | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 | | utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 | | cp1251 | Windows Cyrillic | cp1251_general_ci | 1 | | utf16 | UTF-16 Unicode | utf16_general_ci | 4 | | utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 | | cp1256 | Windows Arabic | cp1256_general_ci | 1 | | cp1257 | Windows Baltic | cp1257_general_ci | 1 | | utf32 | UTF-32 Unicode | utf32_general_ci | 4 | | binary | Binary pseudo charset | binary | 1 | | geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 | | cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 | | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 | +----------+-----------------------------+---------------------+--------+ 40 rows in set (0.01 sec)
基本の設定をする
MySQLのサーバ側とクライアント側の文字コードを設定する必要がある。両者で同じものを設定しておけば文字化けの心配がない。
サーバ側の設定
/etc/my.cnfに以下を追加する。
[mysqld] character-set-server=utf8mb4
クライアント側の設定
/etc/my.cnfに以下を追加する。
[client] default-character-set=utf8mb4
以上の設定が終わったらサーバを再起動する。
確認。
mysql> show variables like '%char%'; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8mb4 | | character_set_connection | utf8mb4 | | character_set_database | utf8mb4 | | character_set_filesystem | binary | | character_set_results | utf8mb4 | | character_set_server | utf8mb4 | | character_set_system | utf8 | | character_sets_dir | /usr/share/mysql/charsets/ | +--------------------------+----------------------------+ 8 rows in set (0.00 sec)
変わった。
参考
- 文字コードの設定(default-character-set) - オプションファイル(my.ini/my.cnf) - MySQLの使い方
- 【MySQL】バージョン5.5.3以降の文字コードの設定(UTF8) - Qiita
データベースの文字コードを設定する
データベースごとに文字コードが設定されているので、すでに他の文字コードで作成したものがあれば以下のように変更する。
mysql> alter database databasename default character set utf8mb4; Query OK, 1 row affected (0.00 sec) mysql> show create database databasename; +--------------------+--------------------------------------------------------------------------------+ | Database | Create Database | +--------------------+--------------------------------------------------------------------------------+ | databasename | CREATE DATABASE `databasename` /*!40100 DEFAULT CHARACTER SET utf8mb4 */ | +--------------------+--------------------------------------------------------------------------------+ 1 row in set (0.00 sec)
変わった。
参考
テーブルとカラムの文字コードを設定する
Heroku用に設定した時にマイグレーションファイルでutf8mb4を指定していたのでこれは既にOK。
やり方は上記リンク参照。
database.ymlの文字コードを設定する(Railsの場合)
以下のようにencodingをutf8mb4に変える。
default: &default adapter: mysql2 encoding: utf8mb4 ...
まとめ
これでいけた。
理想はもう少しちゃんと公式ドキュメントとか読んで体系的に理解して設定したいところ。時間あればやろう。