php过滤特殊字符,提取纯汉字
2018-09-19 本文已影响403人
呦丶耍脾气
前瞻
因为项目需要发送短信,但是短信内容中有用户名,用户名获取方式使用过小程序授权获取的微信用户,有些微信用户名为了臭美加了特殊的表情和字符(我不会告诉你们这个bug是通过我自己的微信名测出来的-0-),这些表情和字符会影响短信发送,报错:非法内容
可用代码
<?php
//提取字符串中的汉字其余信息剔除
header("Content-type: text/html; charset=utf-8");
$str='f龙,真 。,.';
preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);
$str = join('', $matches[0]);
echo $str;
?>
PHP利用正则表达式如何匹配出一段字符串中的中文,对于这个问题,网上也有很多代码,但是大部分都存在纰漏,所以下面为大家提供真正能够匹配出中文的代码。分两种编码形式:
- utf-8的编码格式,匹配中文代码如下:
<?php
$str = "utf-8下匹配出中文字符串";
$preg = "/[\x{4e00}-\x{9fa5}]+/u";
if(preg_match_all($preg,$str,$matches)){
print_r($matches);
}
?>
- gb2312的编码格式,匹配中文字符串代码如下:
<?php
$str = "gb2312下匹配出中文字符串";
$preg = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";
if(preg_match($preg,$str,$matches)){
print_r($matches);
}
?>