版权归作者所有,转载请注明出处
This module provides regular expression matching operations similar to those found in Perl.
所以在Perl中存在的方法在Python的re模块中应该也有。
re 解决的问题:
在脏数据中清洗的出整齐规律的数据
模式匹配选出符合格式的字符串
批量处理与替换节省人力
语法的要点(Regular Expression Syntax)
表1列举了一些匹配模式
例如\d匹配数字,同时[0-9]也是匹配数字
表2列举了常用的几种方法
常用的方法由search()、findall(),不同方法返回的对象有所不同
表3列举了一些特殊的字符
这是一些参数:
以RE下提供详细的注解(注释)
下示例提供了各种方法的使用方式
对于中文字符,上面的方法适用,但是由于中文字符的特殊性使用特殊的处理方式会比较好。
#匹配中文字符的正则表达式: [\u4e00-\u9fa5]
#匹配双字节字符(包括汉字在内):[^\x00-\xff]
可以通过以上两条规则处理中文字符。
陈浩杰
2017.5.21