Python正则表达式是简介表达一组字符串的表达式,正则表达式可以方便的检查一个字符串是否与某种模式匹配。本文将结合实例给大家讲解六种在正则表达式中的常见函数,分别是re.match、re.search、re.findall、re.compile、re.split和re.sub。
re.match() tch函数从头开始匹配,如果不是起始位置匹配成功的话,match函数的匹配结果就为none。
re.search() 整个字符串,并返回第一个成功的匹配
re.findall() 整个字符串,返回一个list(最常用的)
re.compile() #compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象
re.split() #将一个字符串按照正则表达式匹配的结果进行分割,返回列表类型
re.sub() #在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串
1、re.match函数
match函数从头开始匹配,如果不是起始位置匹配成功的话,match函数的匹配结果就为none。匹配成功,re.match方法返回一个匹配的对象。
语法如下:re.match(pattern, string, flags=0)
pattern:需要匹配的正则表达式;
string:在那个字符串中就行匹配 ;
flags:标志位(默认为0),它可以控制正则表达式的匹配方式
常见的flags如下:
re.I 忽略匹配时的大小写
re.M 多行匹配,影响 ^ 和 $
re.S . 默认不匹配换行,使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B
示例如下:
我们可以看出,match函数匹配成功的话,re.match方法返回一个匹配的对象,而不是匹配的正则表达式;通过span()可以获取匹配的位置。
>>> import re
>>> astr='11you are 3344 my apple\n 11开心果,you\n66a77'
>>> re.match('11',astr)
<_sre.SRE_Match object; span=(0, 2), match='11'>
>>> re.match('11',astr).span()
(0, 2)
>>> print(re.match('you',astr))
None
2、re.search函数
搜索整个字符串,并返回第一个成功的匹配。
语法如下:re.search(pattern, string, flags=0)
pattern:需要匹配的正则表达式;
string:在那个字符串中就行匹配 ;
flags:标志位(默认为0),它可以控制正则表达式的匹配方式
常见的flags如下:
re.I 忽略匹配时的大小写
re.M 多行匹配,影响 ^ 和 $
re.S . 默认不匹配换行,使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B
示例如下:
我们可以看出,search函数匹配成功的话,re.search方法返回一个匹配的对象,而不是匹配的正则表达式;通过span()可以获取匹配的位置。如果没有匹配到,则返回为None。
>>> import re
>>> astr='11you are 3344 my apple\n 11开心果,you\n66a77'
>>> re.search('11',astr)
<_sre.SRE_Match object; span=(0, 2), match='11'>
>>> re.search('you',astr)
<_sre.SRE_Match object; span=(2, 5), match='you'>
>>> re.search('you',astr).span() #通过span()获取匹配的位置
(2, 5)
>>> re.search('11',astr).span()
(0, 2)
>>> print(re.search('22',astr))
None
3、re.findall函数
搜索整个字符串,返回一个list
语法如下:re.findall(string)
>>> import re
>>> astr='1you are 3344 my apple\n 11开心果,you\n66a77'
>>> re.findall('\d\d',astr) #列表形式显示所有的两个数字
['33', '44', '11', '66', '77']
>>> re.findall('\d{2,4}',astr) #列表形式显示所有的2——4个数字,默认贪婪匹配
['3344', '11', '66', '77']
>>> re.findall('\d+',astr) #(1,无穷)
['1', '3344', '11', '66', '77']
>>> re.findall('\d*',astr) #(0,无穷)
['1', '', '', '', '', '', '', '', '', '3344', '', '', '', '', '', '', '', '', '', '', '', '11', '', '', '', '', '', '', '', '', '66', '', '77', '']
>>> re.findall('\d?',astr) #匹配0或1
['1', '', '', '', '', '', '', '', '', '3', '3', '4', '4', '', '', '', '', '', '', '', '', '', '', '', '1', '1', '', '', '', '', '', '', '', '', '6', '6', '', '7', '7', '']
>>> re.findall('\d{2,3}?',astr) #一个模式后跟?,不贪婪匹配,范围后面?,有两次就先取两次
['33', '44', '11', '66', '77']
>>> re.findall('\d.\d',astr) #匹配两个数字与中间任意字符
['334', '6a7']
>>> re.findall('^\d',astr) #以数字开头
['1']
>>> re.findall('^\d',astr,re.M) #多行匹配
['1', '6']
>>> re.findall('\d$',astr) #以数字结尾
['7']
>>> re.findall('\d$',astr,re.M) #多行匹配,影响^和$
['7']
>>> re.findall('\d(.)(\d)',astr,re.S)#列表形式返回,每项为一个元组
[('3', '4'), ('a', '7')]
4、re.compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象。
语法如下:re.compile(pattern,flags=0)
pattern:需要匹配的正则表达式;
flags:标志位(默认为0),它可以控制正则表达式的匹配方式
常见的flags如下:
re.I 忽略匹配时的大小写
re.M 多行匹配,影响 ^ 和 $
re.S . 默认不匹配换行,使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B
示例如下:
>>> import re
>>> astr='AS12as34er567q!"3456'
>>> m1=re.compile(r'\d\d') #编译
>>> m1.search(astr).group() #匹配
'12'
>>> m1.findall(astr)
['12', '34', '56', '34', '56']
>>> m2=re.compile(r'a',re.I) #编译
>>> m2.findall(astr) #匹配
['A', 'a']
5、re.split函数
将一个字符串按照正则表达式匹配的结果进行分割,返回列表类型。
语法如下:re.split(pattern, string ,?maxsplit=0?,flags=0)
pattern:需要匹配的正则表达式;
string:在那个字符串中就行匹配 ;
maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。
flags:标志位(默认为0),它可以控制正则表达式的匹配方式。
常见的flags如下:
re.I 忽略匹配时的大小写
re.M 多行匹配,影响 ^ 和 $
re.S . 默认不匹配换行,使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B
示例如下:
>>> import re
>>> astr='AS12as34er567q!"3456'
>>> astr.split('12') #通过12进行分割
['AS', 'as34er567q!"3456']
>>> re.split("\d{2}",astr) #通过两个数字进行分割
['AS', 'as', 'er', '7q!"', '', '']
>>> re.split("\d+",astr) #通过数字进行分割
['AS', 'as', 'er', 'q!"', '']
>>> m3=re.compile(r'\d+') #与上面等价,运用了compile函数
>>> m3.split(astr)
['AS', 'as', 'er', 'q!"', '']
>>> m3.split(astr,3) #指定分割几次
['AS', 'as', 'er', 'q!"3456']
6、re.sub函数
在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串。
语法如下:re.sub(pattern, repl, string, count=0,flags=0)
pattern:需要匹配的正则表达式;
repl : 替换的字符串,也可为一个函数。
string:在那个字符串中就行匹配 ;
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
flags:标志位(默认为0),它可以控制正则表达式的匹配方式
常见的flags如下:
re.I 忽略匹配时的大小写
re.M 多行匹配,影响 ^ 和 $
re.S . 默认不匹配换行,使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B
示例如下:
>>> import re
>>> astr='AS12as34er567q!"3456'
>>> re.sub("5",'9',astr) #将5替换为9
'AS12as34er967q!"3496'
>>> m4=re.compile(r"\d+")
>>> m4.sub(' ',astr) #将数字替换为空字符串
'AS as er q!" '
>>> m4.sub(' ',astr,2) #指定替换几次
'AS as er567q!"3456'
以上就是Pthon正则表达式六种函数实例讲解,大家都懂了吗?如果对Python正则表达式还有任何疑问,可以上博学谷官网报名Python的课程,相信一定能解决大家关于学习Python的疑问。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
零基础学Python的过程有多难?需要多久?
Python是一门简单高效,应用范围广泛的计算机语言。先我们要知道Python已经算是一门相对其他编程语言而言,最适合零基础新手学习的开发语言,换句话说,如果连Python都学不进去就不要考虑进入IT技术行业了。那么零基础学Python的过程有多难呢?下面我们一起来看看Python的学习内容和规划。
3593
2019-09-29 14:03:33
Python调试常见异常汇总
在调试Python程序过程中,难免会遇到各种各样的异常情况。一般情况下,异常可能是因为开发者在编写程序的时候疏漏或者考虑不周全导致的。在开发过程中异常是不可避免的,当你遇到异常的时候回立刻反应他的问题所在吗?为了让大家更好的认识这些常见的异常,博学谷小编将Python调试过程中会产生的异常进行了整理。推荐大家收藏。
1723
2019-10-29 14:56:21
学Python的理由有哪些?这四大理由足够了
学Python的理由有哪些?可能有人会说Python是一种计算机语言,具有简洁性、易读性、及可扩展性,相对于其他语言学起来会更加容易,目前应用也非常广泛等等。其实总结起来,学Python的理由不外乎四点,即丰富免费的模块库,新手入门上手快的学习优势,还有广泛的应用场景以及国家的重视和支持。因此这四大理由足够掀起全面学习Python的热潮。
1154
2020-04-15 11:35:41
学完Python可以做什么?Python从业岗位
学完Python可以做什么?Python语言很有优势,可以从事的岗位也非常多,如、Linux运维、Python Web网站工程师、Python自动化测试、数据分析、人工智能等工作岗位。Python在是个实用工具,解决某一领域的问题都可以用Python来胶合相关的东西,或者是利用其强大的库处理得到的信息。
1034
2020-06-11 11:33:39
Python入门要多长时间?要学什么?
Python 是一门新手友好、功能强大、高效灵活的编程语言,学会之后想进入数据分析、人工智能、网站开发这些领域都可以用 Python 来实现。入门比较简单,掌握基础知识差不多要1-2个月时间。
458
2020-12-09 10:40:41
热门文章
- 机械专业转行Java程序员能成功吗?
- 软件测试能干到多少岁?有年龄限制吗?
- 女生学大数据好就业吗?前景如何?
- 零基础如何系统地自学Python编程?
- 跨境电商运营培训哪个机构好?怎么选?
- 大数据专业毕业后职业前景如何?
- Python if语句多层嵌套使用方法介绍
- 学习Python可以做什么工作?选什么方向?
- 计算机网络通信协议有哪些?作用是什么?
- 怎么判断软件测试培训班课程质量好不好? 查看更多
扫描二维码,了解更多信息
