亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python3爬取貓眼電影信息

系統(tǒng) 1881 0

Python3爬取貓眼電影信息

            
              import json
import requests
from requests.exceptions import RequestException
import re
import time

#爬取貓眼電影信息

def get_one_page(url):
		#增加了User-Agent識(shí)別,需要在headers中添加User-Agent參數(shù)。
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
        }
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None

	#正則提取
def parse_one_page(html):
    pattern = re.compile('
              
.*?board-index.*?>(\d+).*?data-src="(.*?)".*?name"> (.*?) .*?star">(.*?)

.*?releasetime">(.*?)

' + '.*?integer">(.*?).*?fraction">(.*?).*?
', re.S) items = re.findall(pattern, html) #遍歷提取結(jié)果并生成字典 for item in items: yield { 'index': item[0], 'image': item[1], 'title': item[2], 'actor': item[3].strip()[3:], 'time': item[4].strip()[5:], 'score': item[5] + item[6] } #寫入文件 def write_to_file(content): with open('result.txt', 'a', encoding='utf-8') as f: f.write(json.dumps(content, ensure_ascii=False) + '\n') def main(offset): url = 'http://maoyan.com/board/4?offset=' + str(offset) html = get_one_page(url) for item in parse_one_page(html): print(item) write_to_file(item) #分頁(yè)爬取 if __name__ == '__main__': for i in range(10): main(offset=i * 10) #延時(shí)等待 time.sleep(1)

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 久久精品大片 | 超激情碰碰碰啪在线视频 | 国产精品一区二区三区免费 | www.中文字幕 | 性欧美精品久久久久久久 | 亚洲最新在线 | 国产精品400部自产在线观看 | 精品视频久久久久 | 玖玖精品在线 | 搜毛片 | 一二三区在线观看 | 成人爽a毛片在线视频网站 成人爽视频 | 国产福利在线免费观看 | 99热99在线| 女人国产香蕉久久精品 | 天天插天天操天天射 | 四虎e456tcom| 国产成人精品免费视频大 | 91精品专区| 另类欧美chinese | 久久精品一区二区三区不卡牛牛 | 欧美黄色录像视频 | 欧美久色| 中文字幕亚洲综合久久菠萝蜜 | 免费的黄色小视频 | 成人在线视频观看 | 日日摸夜夜添夜夜添久久 | 国产欧美久久一区二区 | 欧美一级毛片aaa片 欧美一级毛片不卡免费观看 | 亚洲精品美女久久久久网站 | 无遮挡无遮挡91桃色在线观看 | 99久久成人国产精品免费 | 亚洲经典在线中文字幕 | 久久最新精品 | 亚洲图片综合网 | 欧美日韩亚洲精品一区二区 | 欧美一区二区三区免费观看视频 | 亚洲最新在线视频 | 2021国产精品系列一区二区 | 国产成人乱码一区二区三区在线 | 久久成年人视频 |