您现在的位置是：首页 > Python

当前栏目

python 匹配文本全角转半角字符「建议收藏」

python,匹配,文本,全角,半角,字符,建议,收藏

2025-04-11 08:58:02 时间

大家好，又见面了，我是你们的朋友全栈君。

在对文本进行处理的时候经常会遇见要对括号和标点进行匹配

常见的英文(半角)符号如( ) 直接用正则匹配即可

但是遇见全角字符(中文括号、标点)，直接用正则匹配会存在问题：

因为编码通常为为utf8，若直接匹配，中文括号的3字节编码会和一些中文的字节编码重复，产生意想不到的结果

若用decode转为unicode编码，则可避免产生错误结果，但也无法直接用正则匹配到

经过试验，发现一个看上去最佳的解决方法:

将字符串decode之后调用一个将全角符号转为半角符号的方法，然后处理返回的字符串

def strQ2B(ustring):    """全角转半角"""    rstring = ""    for uchar in ustring:        inside_code=ord(uchar)        if inside_code == 12288:                              #全角空格直接转换            inside_code = 32        elif (inside_code >= 65281 and inside_code <= 65374): #全角字符（除空格）根据关系转化            inside_code -= 65248        rstring += unichr(inside_code)    return rstringdef p(s):    s1 = strQ2B(s.decode())    p = re.compile('[()]',re.S)    s1 = p.sub('',s1)    return s1

这种方法本质上就是将正则的pattern字符和目标的编码对应, 所以将正则的字符串也用unicode表示就好可以:如下

#!/usr/bin/env python#-*- coding: utf-8 -*-import sysreload(sys)sys.setdefaultencoding('utf8')import reif __name__ == '__main__':    s = '123(45)a啊速度（伤害）有限公司'    ss = re.sub(u'[()（）]', '', s.decode())    print ss

总的来说两种方法都还是有必要存在的。

第二种方法简单直接如果能快速方便列出所有形式的待匹配符号，就果断选用第二个

反之，若待匹配的各种符号太多太繁琐，就统一转为半角再处理更好

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/159998.html原文链接：https://javaforall.cn

猜你喜欢

用 Python 破解了同学压缩文件的密码
Python列表（list）及其常用方法
miniconda可以运行python吗_pycharm怎么配置anaconda环境
Python+PyCharm下载安装教程「建议收藏」
Python继续霸榜，SQL写得溜，面试或许能加分
在pycharm中配置Anaconda的python工具包_pycharm配置远程解释器
python psutil替代_python psutil
python中sqrt函数用法_Python : sqrt() 函数
python函数–isalpha()方法[通俗易懂]
配置pycharm的python路径_linux多路径详细配置
python更新pip失败_pycharm怎么更新pip
python常用面试题_Python+Selenium 常见面试题整理[通俗易懂]
wxpython入门教程_wxPython 入门教程
Python 3 读取和存储Excel数据（应用到接口测试）
python 多线程就这么简单
Python安装whl文件之坑「建议收藏」
dockerfile制作：制作python3下的robotframework运行环境
2.1pycharm 设置Python模块的搜索路径的方式「建议收藏」
linux golang环境安装_python环境搭建
如何利用Python画图

Python程序教程

当前栏目

python 匹配文本全角转半角字符「建议收藏」

相关文章