亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python采集博客中上傳的QQ截圖文件

系統(tǒng) 1785 0

哎,以前寫博文的時(shí)候沒注意,有些圖片用QQ來截取,獲得的圖片文件名都是類似于QQ截圖20120926174732-300×15.png的形式,昨天用ftp備份網(wǎng)站文件的時(shí)候發(fā)現(xiàn),中文名在flashfxp里面顯示的是亂碼的,看起來好難受,所以寫了一個(gè)python小腳本,爬取整個(gè)網(wǎng)站,然后獲取每個(gè)文章頁面的圖片名,并判斷如果是類似于QQ截圖20120926174732-300×15.png的形式就輸出并將該圖片地址和對應(yīng)的文章地址保存在文件中,然后通過該文件來逐個(gè)修改。

好了,下面是程序代碼:

            
import urllib2
from bs4 import BeautifulSoup
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
 
baseurl = "http://www.jb51.net/dont-worry.html"
#說明下,起始地址是第一篇文章的地址,通過該文章的頁面就
#可以使用BeautifulSoup模塊來獲取上一篇文章的地址
 
file = open(r"E:\123.txt","a")
 
def pageloop(url):
  page = urllib2.urlopen(url)
  soup = BeautifulSoup(page)
  img = soup.findAll(['img'])
  if img == []:
    print "當(dāng)前頁面沒有圖片"
    return
  else:
    for myimg in img:
      link = myimg.get('src')
      print link
      
      pattern = re.compile(r'QQ\S*[0-9]*png')
      badimg = pattern.findall(str(link))
      if badimg:
        print url
        file.write(link + "\n")
        file.write(url+"\n")
      
 
 
def getthenextpage(url):
  pageloop(url)
  page = urllib2.urlopen(url)
  soup = BeautifulSoup(page)
  for spanclass in soup.findAll(attrs={"class" : "article-nav-prev"}):
    #print spanclass
    if spanclass.find('article-nav-prev') != -1:
      pattern = re.compile(r'//www.jb51.net/\S*html')
      pageurl = pattern.findall(str(spanclass))
      for i in pageurl:
        #print i
        getthenextpage(i)
       
      
 
getthenextpage(baseurl)
 
 
 
print "the end!"
file.close()

          

最后,對和我以前剛開始做網(wǎng)站的同學(xué)說下,圖片命名的話最好是用數(shù)字形式或者是英文、拼音的形式,要不然到最后想修改的話就麻煩了,所以最好就是從剛開始就養(yǎng)成好的習(xí)慣,用正確的命名規(guī)范來問文章、圖片來命名,這樣就會好很多。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 亚洲国产精品一区二区九九 | 国产中文字幕免费观看 | 99精品视频在线视频免费观看 | 亚洲欧美日韩国产精品影院 | 老师粗又长好猛好爽视频 | 精品乱人伦一区二区三区 | 天天干天天干天天 | 国产久视频观看 | 久久草在线播放 | 欧美国产日韩在线播放 | 亚洲欧洲精品视频 | 五月花精品视频在线观看 | 欧美一级毛片高清毛片 | 久久在线免费观看视频 | 特级理论片 | 国产偷视频| 日韩 亚洲 欧美 中文 高清 | 亚洲一区二区三区网站 | 中文字幕一区在线播放 | 精品老司机在线观看视频 | 国产亚洲福利精品一区二区 | 亚洲综合精品成人啪啪 | 99精品国产成人一区二区在线 | 日韩在线1 | 日韩亚洲一区中文字幕 | 国产在线观看一区二区三区 | 亚洲国产成人久久一区www妖精 | 99视频精品全国免费 | 五月久久婷婷综合片丁香花 | 国产精品永久免费自在线观看 | 亚洲特级aaaaaa毛片 | 免费国产一区二区三区 | 国产精品自拍一区 | 亚洲精品久久久久久动漫剧情 | 日韩欧美成末人一区二区三区 | 欧美精品在线观看 | 波多野结衣一二三区 | 久久频这里精品香蕉久久 | 欧美日韩一区二区三在线 | 亚洲综合色就色手机在线观看 | 国产视频福利在线 |