Author:赵志乾
Date:2019-06-14
Declaration:All Right Reserved!!!
踩坑:
前提:mysql-connector-java版本为5.1.30,mysql版本为5.7.17。
场景:数据库指定字段类型为varchar,使用的字符集为utf8mb4,将emoji表情通过JDBC存储时产生乱码。
做法:jdbcUrl中使用characterEncoding=utf-8,并且没有做其他额外的数据库设置操作。
解决方案:
上述问题是因客户端和服务端使用的编码方式不一致导致的。可依据实际情况采用如下两种方案解决:
方案1:执行包含emoji表情的数据入库时,先执行字符集设置语句。如下:
set names utf8mb4
方案2:升级mysql-connector-java版本至5.1.47以上。在低于5.1.47版本时,jdbcUrl中设置的characterEncoding=utf-8对应mysql服务端的utf8,而从5.1.47开始,则对应到utf8mb4。如下:
知识背景:
mysql服务端的utf8编码占3个字节(即utf8mb3),而emoji表情占4个字节。故存储包含emoji表情的文本时要在服务端使用utf8mb4编码。
java中的utf8编码是可变长编码,其一个字符占用的长度可以为1、2、3或4个字节。