PHP开发中涉及到emoji表情的几种处理方法

2019-03-18  本文已影响0人  WMSmile

找的了好久找到的解决方法

一般Mysql表设计时,都是用UTF8字符集的。把带有emoji的昵称字段往里面insert一下就没了,整个字段变成了空字符串。这是怎么回事呢?

原来是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了。这要怎么办呢?我来介绍几种方法

  1. 去除emoji表情包
    这段代码亲测可用
// 过滤掉emoji表情
function filterEmoji($str)
{
    $str = preg_replace_callback(
            '/./u',
            function (array $match) {
                return strlen($match[0]) >= 4 ? '' : $match[0];
            },
            $str);

     return $str;
 }
  1. 数据库使用utf8mb4编码
    如果你的mysql版本>=5.5.3,你大可直接将utf8直接升级为utf8mb4字符集
    这种4字节的utf8编码可完美兼容旧的3字节utf8字符集,并且可以直接存储emoji表情,是最好的解决方案
    至于字节增大带来的性能损耗,我看过一些评测,几乎是可以忽略不计的```

  2. 使用Base64编码
    如果你因为某些原因无法使用utf8mb4的话,你还可以使用base64来曲线救国
    使用例如base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中,取出时decode一下即可

其他的方法欢迎大家补充哈!!
原文地址

上一篇 下一篇

猜你喜欢

热点阅读