摘要
在 MySQL 中直接存儲表情的時候,會出現(xiàn)無法插入數(shù)據(jù)的錯誤。
這是由于一般情況下,MySQL 的字符集是 utf8,而對于 emoji 表情的 mysql 的 utf8 字符集是不支持,需要修改設(shè)置為 utf8mb4 才行。
mysql utf8mb4與emoji表情 MYSQL 5.5 之前, UTF8 編碼只支持1-3個字節(jié),只支持BMP這部分的unicode編碼區(qū)(BMP是從哪到哪),基本就是0000~FFFF這一區(qū)。 從MYSQL5.5開始,可支持4個字節(jié)UTF編碼utf8mb4,一個字符最多能有4字節(jié),所以能支持更多的字符集。 utf8mb4 is a superset of utf8,utf8mb4兼容utf8,且比utf8能表示更多的字符。在做移動應(yīng)用時,會遇到用戶會輸入emoji表情,如果不做一定處理,就會導(dǎo)致插入數(shù)據(jù)庫異常。
修改服務(wù)器端修改數(shù)據(jù)庫配置文件/etc/my.cnf,添加下面的配置,然后重啟服務(wù)器:
[mysqld]character-set-server=utf8mb4collation_server=utf8mb4_unicode_ciinit-connect="SET NAMES utf8mb4" [mysql]default-character-set=utf8mb4重啟之后,登錄 mysql,可以通過show variables like 'character%';查看編碼是否已經(jīng)修改成功。修改成功應(yīng)該類似如下:mysql> show variables like '%char%';+--------------------------+----------------------------------+| Variable_name | Value |+--------------------------+----------------------------------+| character_set_client | utf8mb4 || character_set_connection | utf8mb4 || character_set_database | utf8mb4 || character_set_filesystem | binary || character_set_results | utf8mb4 || character_set_server | utf8mb4 || character_set_system | utf8 || character_sets_dir | /usr/local/mysql/share/charsets/ |+--------------------------+----------------------------------+8 rows in set (0.00 sec)然后再修改相應(yīng)的數(shù)據(jù)庫表的編碼為 utf8mb4:ALTER TABLE tbl_name CONVERT TO CHARACTER SET utf8mb4;轉(zhuǎn)換數(shù)據(jù)表編碼的語句格式如下: ALTER TABLE tbl_name CONVERT TO CHARACTER SET charset_name;
客戶端使用不同的編程語言的時候,可能會對 utf8mb4 不支持,不能在連接字符串中指定的,此時可以在獲取連接之后,執(zhí)行set names utf8mb4來解決這個問題。比如,對于 Thinkphp 框架,在配置文件中設(shè)置數(shù)據(jù)庫連接字符集為 utf8mb4 之后('DB_CHARSET'=>'utf8mb4'),會出現(xiàn)錯誤,提示無法使用這個字符集。此時,由于我們已經(jīng)在 mysql 的配置文件中設(shè)置了init-connect="SET NAMES utf8mb4",所以直接將 ThinkPHP 配置文件中的數(shù)據(jù)庫字符集設(shè)置為空('DB_CHARSET'=>''),則連接數(shù)據(jù)庫之后,服務(wù)器會自動設(shè)置連接字符集為 utf8mb4,此時寫入和讀取 emoji 表情就能正常了。擴(kuò)展MySQL 默認(rèn)情況下,無法存儲中文字符,其實這和 MySQL 默認(rèn)無法存儲表情字符是同樣的原因:數(shù)據(jù)庫字符編碼問題。默認(rèn)情況下,MySQL 使用的字符集是 Latin,所以無法存儲中文或者其他的一些字符。
如果要存儲中文,可以設(shè)置 MySQL 的字符集為支持中文的字符集,比如 GBK 或者 UTF-8。一般情況下,我們設(shè)置為 UTF-8,能有更好的兼容性。1.修改 MySQL 配置文件/etc/my.cnf,添加下面的配置,然后重啟服務(wù)器:
[mysqld]character-set-server=utf8 [mysql]default-character-set=utf82.重啟 mysqld 服務(wù),使剛才的修改生效3.如果數(shù)據(jù)庫中已經(jīng)建有數(shù)據(jù)表了,那么還需要將這些數(shù)據(jù)表的字符集做更改。如果數(shù)據(jù)表有很多,可以導(dǎo)出數(shù)據(jù)庫和數(shù)據(jù),然后重新建庫。ALTER TABLE tbl_name CONVERT TO CHARACTER SET utf8
新聞熱點
疑難解答