php过滤特殊字符,提取纯汉字

2018-09-19  本文已影响403人  呦丶耍脾气

前瞻

因为项目需要发送短信,但是短信内容中有用户名,用户名获取方式使用过小程序授权获取的微信用户,有些微信用户名为了臭美加了特殊的表情和字符(我不会告诉你们这个bug是通过我自己的微信名测出来的-0-),这些表情和字符会影响短信发送,报错:非法内容

可用代码

<?php 
//提取字符串中的汉字其余信息剔除
header("Content-type: text/html; charset=utf-8");
$str='f龙,真 。,.'; 
preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);
$str = join('', $matches[0]);
echo $str;
?> 

PHP利用正则表达式如何匹配出一段字符串中的中文,对于这个问题,网上也有很多代码,但是大部分都存在纰漏,所以下面为大家提供真正能够匹配出中文的代码。分两种编码形式:

<?php
    $str = "utf-8下匹配出中文字符串";
    $preg = "/[\x{4e00}-\x{9fa5}]+/u";
    if(preg_match_all($preg,$str,$matches)){
        print_r($matches);
    }
?>
<?php
    $str = "gb2312下匹配出中文字符串";
    $preg = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";
    if(preg_match($preg,$str,$matches)){
        print_r($matches);
    }
?>
上一篇下一篇

猜你喜欢

热点阅读