日志报错:
exception: org.springframework.dao.DataIntegrityViolationException:
查程序详细日志,看到了MySQL报错:
### Cause: com.mysql.jdbc.MysqlDataTruncation: Data truncation: Incorrect string value: '\xF0\x9F\x98\x8A' for column 'content' at row 1 ; SQL []; Data truncation: Incorrect string value: '\xF0\x9F\x98\x8A' for column 'content' at row 1; nested exception is com.mysql.jdbc.MysqlDataTruncation: Data truncation: Incorrect string value: '\xF0\x9F\x98\x8A' for column 'content' at row 1 at org.springframework.jdbc.support.SQLStateSQLExceptionTranslator.doTranslate(SQLStateSQLExceptionTranslator.java:100) at org.springframework.jdbc.support.AbstractFallbackSQLExceptionTranslator.translate(AbstractFallbackSQLExceptionTranslator.java:72) at org.springframework.jdbc.support.AbstractFallbackSQLExceptionTranslator.translate(AbstractFallbackSQLExceptionTranslator.java:80) at org.springframework.jdbc.support.AbstractFallbackSQLExceptionTranslator.translate(AbstractFallbackSQLExceptionTranslator.java:80) at org.mybatis.spring.MyBatisExceptionTranslator.translateExceptionIfPossible(MyBatisExceptionTranslator.java:73) at org.mybatis.spring.SqlSessionTemplate$SqlSessionInterceptor.invoke(SqlSessionTemplate.java:371) at $Proxy8.insert(Unknown Source) at org.mybatis.spring.SqlSessionTemplate.insert(SqlSessionTemplate.java:240) at org.apache.ibatis.binding.MapperMethod.execute(MapperMethod.java:51) at org.apache.ibatis.binding.MapperProxy.invoke(MapperProxy.java:52) at $Proxy12.insert(Unknown Source)
看到DataIntegrityViolationException第一感觉是参数错误,但是该表没有外键,没有约束等。
再看详细日志,想着应该是特殊字符,但是\xF0\x9F\x98\x8A这样的东西,我觉得没有那个客户会无聊到输入这些。回想一下,客户端同事说过,在苹果手机上,弹出输入框后,如果用户在输入法上输入表情,是无法屏蔽的。
搜了一下,果然是表情类的字符,于是问题就找到了,还是特殊字符的问题。
首先这个问题,客户端应该做判断,其次,作为服务端,不能把这种事情全指望给客户端来做,当时知道这个问题却没有及时屏蔽,这是我的失误。
以下来自网络:
Emoji表情字符现在在APP已经广泛支持了。但是MySQL的UTF8编码对Emoji字符的支持却不是那么好。所以我们经常会遇到这样的异常:
Incorrect string value: '\xF0\x90\x8D\x83...' for column
原因是Mysql里UTF8编码最多只能支持3个字节,而Emoji表情字符使用的UTF8编码,很多都是4个字节,有些甚至是6个字节。
解决的方案有两种:
1.使用utf8mb4的mysql编码来容纳这些字符。
2.过滤掉这些特殊的表情字符。
关于第一种解决方法,请参考:http://segmentfault.com/a/1190000000616820 和 http://info.michael-simons.eu/2013/01/21/java-mysql-and-multi-byte-utf-8-support/
有大量细节需要注意,例如:mysql版本,mysql的配置,mysql connector的版本等等。
关于过滤,其实过滤的方式很简单,直接使用正则表达式匹配编码范围,然后替换就行了。
更多可以参考:http://stackoverflow.com/questions/27820971/why-a-surrogate-java-regexp-finds-hypen-minus