今天介紹一下Python中常用的正則表達(dá)式處理函數(shù)。Python的正則表達(dá)式主要有兩種方法完成模式匹配:『搜索』和『匹配』
re.match嘗試從字符串的開始全部或者部分匹配某個(gè)模式,如:下面的例子匹配第一個(gè)單詞。
importre
text="PythonTab.comisagoodPythonwebsite"
m=re.match(r"(w+)s",text)
ifm:
printm.group(0),'',m.group(1)
else:
print'notmatch'
re.match的函數(shù)原型為:re.match(pattern,string,flags)
第一個(gè)參數(shù)是正則表達(dá)式,這里為"(w+)s",如果匹配成功,則返回一個(gè)Match,否則返回一個(gè)None;
第二個(gè)參數(shù)表示要匹配的字符串;
第三個(gè)參數(shù)是標(biāo)致位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。
注意:它能夠配配的前提是:開始就必須滿足匹配條件
re.search
re.search函數(shù)會(huì)在字符串內(nèi)查找模式匹配,只到找到第一個(gè)匹配然后返回,如果字符串沒有匹配,則返回None。
importre
text="PythonTab.comisagoodPythonwebsite"
m=re.search(r'Pyt(on)ns',text)
ifm:
printm.group(0),m.group(1)
else:
print'notsearch'
re.search的函數(shù)原型為:re.search(pattern,string,flags)
每個(gè)參數(shù)的含意與re.match一樣。
re.match與re.search的區(qū)別:re.match只匹配字符串的開始,如果字符串開始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回None;而re.search匹配整個(gè)字符串,直到找到一個(gè)匹配。
re.sub
re.sub用于替換字符串中的匹配項(xiàng)。下面一個(gè)例子將字符串中的空格''替換成'-':
importre
text="PythonTab.comisagoodPythonwebsite"
printre.sub(r's+','-',text)
re.sub的函數(shù)原型為:re.sub(pattern,repl,string,count)
其中第二個(gè)函數(shù)是替換后的字符串;本例中為'-'
第四個(gè)參數(shù)指替換個(gè)數(shù)。默認(rèn)為0,表示每個(gè)匹配項(xiàng)都替換。
re.sub還允許使用函數(shù)對(duì)匹配項(xiàng)的替換進(jìn)行復(fù)雜的處理。如:re.sub(r's',lambdam:'['+m.group(0)+']',text,0);將字符串中的空格''替換為'[]'。
re.split
可以使用re.split來分割字符串,如:re.split(r's+',text);將字符串按空格分割成一個(gè)單詞列表。
re.findall
re.findall可以獲取字符串中所有匹配的字符串。如:re.findall(r'w*oow*',text);獲取字符串中,包含'oo'的所有單詞。
re.compile
可以把正則表達(dá)式編譯成一個(gè)正則表達(dá)式對(duì)象。可以把那些經(jīng)常使用的正則表達(dá)式編譯成正則表達(dá)式對(duì)象,這樣可以提高一定的效率。下面是一個(gè)正則表達(dá)式對(duì)象的一個(gè)例子:
importre
text="PythonTabisagoodPythonwebsite"
regex=re.compile(r'w*onw*')
printregex.findall(text)#查找所有包含'on'的單詞
printregex.sub(lambdam:'['+m.group(0)+']',text)#將字符串中含有'on'的單詞用[]括起來。
以上內(nèi)容為大家介紹了Python正則表達(dá)式常用函數(shù)詳解,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://www.dietsnews.net/