Python做簡(jiǎn)單的字符串匹配詳解
?由于需要在半結(jié)構(gòu)化的文本數(shù)據(jù)中提取一些特定格式的字段、數(shù)據(jù)輔助挖掘分析工作,以往都是使用Matlab工具進(jìn)行結(jié)構(gòu)化數(shù)據(jù)處理的建模,matlab擅長(zhǎng)矩陣處理、結(jié)構(gòu)化數(shù)據(jù)的計(jì)算,Python具有與matlab共同的特點(diǎn):語(yǔ)法簡(jiǎn)潔、庫(kù)豐富,對(duì)算法仿真來(lái)說(shuō)都是一門(mén)簡(jiǎn)潔易用的語(yǔ)言。
Python做字符串匹配相對(duì)來(lái)說(shuō)上手比較容易,且具有成熟的字符串處理庫(kù)re供我們使用;
在re庫(kù)的幫助下,只需簡(jiǎn)單的兩步就可完成匹配工作,對(duì)做數(shù)據(jù)分析/算法的工作者來(lái)說(shuō),輕松了許多:
step1:構(gòu)建正則表達(dá)式模式,并使用compile()函數(shù)生產(chǎn)正則表達(dá)式對(duì)象
step2:調(diào)用step1生成的正在表達(dá)式對(duì)象的方法、屬性,返回匹配結(jié)果
# 導(dǎo)入正則表達(dá)式匹配模塊 Py 3.0
import re
text = "today is 01/04/2015, happy new year..."
#建立日期的正則表達(dá)式
detepat = re.compile('(\d+)/(\d+)/(\d+)')
#進(jìn)行匹配并打印結(jié)果
result = detepat.finditer(text)
for m in result:
print(m.group())
感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
