麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 數據庫 > MySQL > 正文

MySQL插入emoji表情失敗問題的解決方法

2024-07-24 13:13:13
字體:
來源:轉載
供稿:網友

前言

之前一直認為UTF-8是萬能的字符集問題解決方案,直到最近遇到這個問題。最近在做新浪微博的爬蟲, 在存庫的時候發現只要保持emoji表情,就回拋出以下異常:

Incorrect string value: '/xF0/x90/x8D/x83/xF0/x90...'

眾所周知UTF-8是3個字節, 其中已經包括我們日常能見過的絕大多數字體. 但3個字節遠遠不夠容納所有的文字, 所以便有了utf8mb4, utf8mb4是utf8的超集, 占4個字節, 向下兼容utf8. 我們日常用的emoji表情就是4個字節了.

所以在此我們像utf8的數據表插入數據就會報出Incorrect string value這個錯誤.

Google一下很容易就找到了解決方案, 具體解決辦法是如下:

一、修改數據表的字符集為utf8mb4

這點很簡單, 修改語句網上找一大堆, 不過建議重新建表, 使用 mysqldump -uusername -ppassword database_name table_name > table.sql 備份相應數據表, 并修改其中的建表語句的字符集為 utf8mb4 即可, 然后 mysql -uusername -ppassword database_name < table.sql 重新導入sql即可完成修改字符集操作.

二、MySQL數據庫版本要5.5.3及以上

網絡上所有的文章都說明要MySQL 5.5.3以上的版本才支持utf8mb4, 不過我使用的數據庫版本為5.5.18, 最終仍能解決問題, 所以同學們不要急著找運維哥哥升級數據庫先, 先試試能不能自己解決問題.

三、修改數據庫配置文件/etc/my.cnf并重啟mysql服務

主要是修改數據庫的默認字符集, 以及連接, 查詢的字符集, [Mysql支持emoji 表情符號 升級編碼為UTF8MB4][1] 這篇文章有詳細的設置方法, [深入Mysql字符集設置][2] 這篇文章有其中設置的各個字符集的作用, 大家可以科普下.

四、升級MySQL Connector到5.1.21及以上

以上所有的操作, 最關鍵的是步驟3, 修改數據庫的配置文件, 其中大概修改了

[client]# 客戶端來源數據的默認字符集default-character-set = utf8mb4[mysqld]# 服務端默認字符集character-set-server=utf8mb4# 連接層默認字符集collation-server=utf8mb4_unicode_ci[mysql]# 數據庫默認字符集default-character-set = utf8mb4

這些配置指定了數據從客戶端到服務端所經過的一條條管道使用的字符集, 其中每一個管道出現問題都可能會導致插入失敗或者亂碼.

但很多時候, 線上的數據庫是不能隨便修改數據庫文件的, 所以我們的運維同學很果斷的回絕了我修改數據庫配置文件的請求(T_T)

所以就只能用代碼解決了, 一開始是準備從JDBC連接時候就指定使用的字符集處下手.

jdbc:mysql://localhost:3306/ding?characterEncoding=UTF-8

主要把UTF-8修改為utf8mb4對于的Java Style Charset字符串應該就能解決問題吧?

不過很遺憾的是, Java JDBC并不存在utf8mb4對于的字符集. 使用UTF-8的時候可以兼容urf8mb4并自動轉換字符集.

For example, to use 4-byte UTF-8 character sets with Connector/J, configure the MySQL server with character_set_server=utf8mb4, and leave characterEncoding out of the Connector/J connection string. Connector/J will then autodetect the UTF-8 setting. – [MySQL:Using Character Sets and Unicode][3]

后來科普了一下, 在每一次查詢請求的時候, 可以顯式的指定使用的字符集, 使用 set names utf8mb4 可以指定本次鏈接的字符集為utf8mb4, 但這個設置在每次連接被釋放后都會失效.

目前的解決辦法是, 在需要插入utf8mb4的時候, 顯示地調用執行set names utf8mb4, 如:

jdbcTemplate.execute("set names utf8mb4");jdbcTempalte.execute("...");

需要注意的是, 我們在使用一下ORM框架的時候, 因為性能優化原因, 框架會延遲提交, 除非事務結束或者用戶主動調用強制提交, 負責執行的set names utf8mb4仍然不會生效.

在這里我使用的是myBatis, 以MessageDao為例

// MessageDaopublic interface MessageDao { @Update("set names utf8mb4") public void setCharsetToUtf8mb4(); @Insert("insert into tb_message ......") public void insert(Message msg);}// test codeSqlSession sqlSession = sqlSessioFactory.openSession();messageDao = sqlSession.getMapper(MessageDao.class);messageDao.setCharsetToUtf8mb4();// 強制提交sqlSession.commit();messageDao.insert(message);

至此, 問題便解決了..

哎, 如果世事能那么順利就好了, 在項目中, mybatis是實例是交由Spring去管理的, 也就是說我拿不到sqlSession, 也就是強制提交不了. 并且因為Spring事務框架的限制, 他并不允許用戶顯式調用強制提交. 目前還在糾結這個問題.

有兩個解決思路:

  • 使用AOP, 在可能插入4字節UTF8字符的時候, 前置方法執行set names utf8mb4, 但該方案還不能確定AOP的方法會被Spring進行事務管理么, 并且在前置方法中,拿到的鏈接是否和接下來拿到的連接對象是同一個session.
  • 研究Spring JDBC的創建方法, 寫一個hook在每次創建新的數據庫連接的時候, 都執行一次set names utf8mb4, 這樣就保證每一次拿到的鏈接都是設置過字符集的.

總結

以上就是這篇文章的全部內容了,待有時間再實驗一下以上兩種方案。希望本文的內容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對VeVb武林網的支持。


注:相關教程知識閱讀請移步到MYSQL教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 猫咪av在线| 国产羞羞视频在线免费观看 | 26uuu成人人网图片 | 久久亚洲国产午夜精品理论片 | 国产精品1区 | 欧美电影在线观看 | 久久亚洲线观看视频 | 成人在线视频黄色 | 9999久久久久久 | 日本免费中文字幕 | 一级黄色毛片免费 | 亚洲欧美一区二区三区在线观看 | 久久国产不卡 | 国产精品久久久久网站 | 一本视频在线观看 | h视频免费在线观看 | 曰韩毛片 | 日本免费aaa观看 | 成人短视频在线播放 | 国产女厕一区二区三区在线视 | 91香蕉影视 | 欧美3p激情一区二区三区猛视频 | 日本人乱人乱亲乱色视频观看 | 福利在线播放 | 99视频网 | 久久久久国产一区二区三区不卡 | 久久精热| 国产五区| 日本精品视频一区二区三区四区 | 在线成人亚洲 | 日韩毛片一区二区三区 | 久久伊| 国产精品v片在线观看不卡 成人一区二区三区在线 | 99国产精品国产免费观看 | 亚洲第一成人在线观看 | 91久久九色| www国产成人免费观看视频,深夜成人网 | 欧美一级淫片免费视频1 | 一区二区三区视频在线观看 | 姑娘第四集免费看视频 | 黄色的视频在线观看 |