非正则的PHP中文英文特殊字符符号过滤方法

目录
[隐藏]

对于中英文特殊符号的匹配过滤,在少量的文本查找时,使用正则表达式方法简单方便,但是面对大文本的处理则性能瓶颈将导致其无法实用。此时使用逐字符替换方法则是速度性能最快的。

下面为PHP实现的中英文字符过滤方法,仅供参考。

1. PHP实现中文特殊字符转换与英文字符过滤 

XML/HTML代码
  1. /*  
  2. 中英文特殊字符转换与过滤  
  3. */  
  4. function clear_punctuation($str)     
  5. {     
  6.     $arr = array(    
  7.                     '0' => '0', '1' => '1', '2' => '2', '3' => '3', '4' => '4',     
  8.                  '5' => '5', '6' => '6', '7' => '7', '8' => '8', '9' => '9',     
  9.                  'A' => 'A', 'B' => 'B', 'C' => 'C', 'D' => 'D', 'E' => 'E',     
  10.                  'F' => 'F', 'G' => 'G', 'H' => 'H', 'I' => 'I', 'J' => 'J',     
  11.                  'K' => 'K', 'L' => 'L', 'M' => 'M', 'N' => 'N', 'O' => 'O',     
  12.                  'P' => 'P', 'Q' => 'Q', 'R' => 'R', 'S' => 'S', 'T' => 'T',     
  13.                  'U' => 'U', 'V' => 'V', 'W' => 'W', 'X' => 'X', 'Y' => 'Y',     
  14.                  'Z' => 'Z', 'a' => 'a', 'b' => 'b', 'c' => 'c', 'd' => 'd',     
  15.                  'e' => 'e', 'f' => 'f', 'g' => 'g', 'h' => 'h', 'i' => 'i',     
  16.                  'j' => 'j', 'k' => 'k', 'l' => 'l', 'm' => 'm', 'n' => 'n',     
  17.                  'o' => 'o', 'p' => 'p', 'q' => 'q', 'r' => 'r', 's' => 's',     
  18.                  't' => 't', 'u' => 'u', 'v' => 'v', 'w' => 'w', 'x' => 'x',     
  19.                  'y' => 'y', 'z' => 'z',     
  20.                  '(' => '', ')' => '', '〔' => '', '〕' => '', '【' => '',     
  21.                  '】' => '', '〖' => '', '〗' => '', '“' => '', '”' => '',     
  22.                  '‘' => '', '’' => '', '{' => '', '}' => '', '《' => '',     
  23.                  '》' => '',     
  24.                  '%' => '', '+' => '', '—' => '', '-' => '', '~' => '',     
  25.                  ':' => '', '。' => '', '、' => '', ',' => '', '、' => '',     
  26.                  ';' => '', '?' => '', '!' => '', '…' => '', '‖' => '',     
  27.                  '”' => '', '’' => '', '‘' => '', '|' => '', '〃' => '',     
  28.                  ' ' => '', '$'=>'', '@'=>'', '#'=>'', '^'=>'', '&'=>'', '*'=>'',  
  29.                    
  30.                  '(' => '', ')' => '', '[' => '', ']' => '', '`' => '', '{' => '', '~' => '',  
  31.                     '}' => '', '<' => '', '>' => '', '%' => '', '+' => '', '-' => '', ':' => '',   
  32.                     '.' => '', ';' => '', '?' => '', '!' => '', '|' => '', '$' => '', '@' => '',   
  33.                     '#' => '', '^' => '', '&' => '', '*' => '', '\' => '','"' => '', ''' => '',   
  34.                     '=' => '', '/' => '', ' ' => ''  
  35.                     );  
  36.     return strtr($str, $arr);  
  37. }  

2. PHP中文双字节字符转换为英文字符

XML/HTML代码
  1.    
  2.   
  3. /*  
  4. 中文字符转换为英文字符  
  5. */  
  6. function make_semiangle($str)     
  7. {     
  8.     $arr = array('0' => '0', '1' => '1', '2' => '2', '3' => '3', '4' => '4',     
  9.                  '5' => '5', '6' => '6', '7' => '7', '8' => '8', '9' => '9',     
  10.                  'A' => 'A', 'B' => 'B', 'C' => 'C', 'D' => 'D', 'E' => 'E',     
  11.                  'F' => 'F', 'G' => 'G', 'H' => 'H', 'I' => 'I', 'J' => 'J',     
  12.                  'K' => 'K', 'L' => 'L', 'M' => 'M', 'N' => 'N', 'O' => 'O',     
  13.                  'P' => 'P', 'Q' => 'Q', 'R' => 'R', 'S' => 'S', 'T' => 'T',     
  14.                  'U' => 'U', 'V' => 'V', 'W' => 'W', 'X' => 'X', 'Y' => 'Y',     
  15.                  'Z' => 'Z', 'a' => 'a', 'b' => 'b', 'c' => 'c', 'd' => 'd',     
  16.                  'e' => 'e', 'f' => 'f', 'g' => 'g', 'h' => 'h', 'i' => 'i',     
  17.                  'j' => 'j', 'k' => 'k', 'l' => 'l', 'm' => 'm', 'n' => 'n',     
  18.                  'o' => 'o', 'p' => 'p', 'q' => 'q', 'r' => 'r', 's' => 's',     
  19.                  't' => 't', 'u' => 'u', 'v' => 'v', 'w' => 'w', 'x' => 'x',     
  20.                  'y' => 'y', 'z' => 'z',     
  21.                  '(' => '(', ')' => ')', '〔' => '[', '〕' => ']', '【' => '[',     
  22.                  '】' => ']', '〖' => '[', '〗' => ']', '“' => '[', '”' => ']',     
  23.                  '‘' => '[', '’' => ']', '{' => '{', '}' => '}', '《' => '<',     
  24.                  '》' => '>',     
  25.                  '%' => '%', '+' => '+', '—' => '-', '-' => '-', '~' => '-',     
  26.                  ':' => ':', '。' => '.', '、' => '\', ',' => '.', '、' => '.',     
  27.                  ';' => ';', '?' => '?', '!' => '!', '…' => '-', '‖' => '|',     
  28.                  '”' => '"', '’' => '`', '‘' => '`', '|' => '|', '〃' => '"',     
  29.                  ' ' => ' ', '$'=>'$', '@'=>'@', '#'=>'#', '^'=>'^', '&'=>'&', '*'=>'*');  
  30.     //foreach($arr as $k=>$v)    
  31.         //echo $v;  
  32.     return strtr($str, $arr);  
  33. }   

3. PHP正则表达式过滤英文标点符号

XML/HTML代码
  1. $pattern = "/[ '.,:;*?~`!@#$%^&+=-)(<>{}]|]|[|/|\|"||/";  
  2. $content = preg_replace($pattern, '', $content);    //英文符号过滤 
点赞 (0)
  1. 中国奶茶网说道:

    字符过滤起来很有意思的。。。很考验脑力。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.