亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python爬蟲(chóng) scrapy框架爬取某招聘網(wǎng)存入mongodb解析

系統(tǒng) 2279 0

創(chuàng)建項(xiàng)目

            
scrapy startproject zhaoping
          

創(chuàng)建爬蟲(chóng)

            
cd zhaoping
scrapy genspider hr zhaopingwang.com
          

目錄結(jié)構(gòu)

Python爬蟲(chóng) scrapy框架爬取某招聘網(wǎng)存入mongodb解析_第1張圖片

items.py

            
  title = scrapy.Field()
  position = scrapy.Field()
  publish_date = scrapy.Field()
          

pipelines.py

            
from pymongo import MongoClient

mongoclient = MongoClient(host='192.168.226.150',port=27017)
collection = mongoclient['zhaoping']['hr']

class TencentPipeline(object):
  def process_item(self, item, spider):
    print(item)
    # 需要轉(zhuǎn)換為 dict
    collection.insert(dict(item))
    return item
          

spiders/hr.py

            
def parse(self, response):
    # 不要第一個(gè) 和最后一個(gè)
    tr_list = response.xpath("http://table[@class='tablelist']/tr")[1:-1]
    for tr in tr_list:
      item = TencentItem()
      # xpath 從1 開(kāi)始數(shù)起
      item["title"] = tr.xpath("./td[1]/a/text()").extract_first()
      item["position"] = tr.xpath("./td[2]/text()").extract_first()
      item["publish_date"] = tr.xpath("./td[5]/text()").extract_first()
      yield item

    next_url = response.xpath("http://a[@id='next']/@href").extract_first()
    # 構(gòu)造url
    if next_url != "javascript:;":
      print(next_url)
      next_url = "https://hr.tencent.com/" + next_url
      yield scrapy.Request(url=next_url,callback=self.parse,)
          

就是這么簡(jiǎn)單,就獲取到數(shù)據(jù)

Python爬蟲(chóng) scrapy框架爬取某招聘網(wǎng)存入mongodb解析_第2張圖片

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 亚洲综合插 | 欧美一区二区久久精品 | 日韩经典欧美一区二区三区 | 高清久久 | 人人模人人干 | 欧美毛片免费看 | 激情综合网五月激情 | 尹人综合网| 久久99热久久精品 | 日本免费高清一级毛片 | 久久国产视频一区 | 在线播放日本爽快片 | 国产免费久久精品丫丫 | 伊人久久综在合线亚洲91 | 精品中文字幕一区二区三区四区 | 94在线| 久久久久久久综合日本亚洲 | 欧美激情在线播放一区二区 | 99在线观看视频 | 国产 magnet| 欧美日本俄罗斯一级毛片 | 青青草一区二区免费精品 | 亚洲成a v人片在线观看 | 97久久精品国产成人影院 | 欧美激情在线观看一区二区三区 | 天天插天天操天天射 | 99热免费在线 | 99r在线视频 | 在线观看国产福利 | 伊人久久亚洲综合天堂 | 91精品久久久久含羞草 | 337p欧美超大胆日本人术艺术 | 日韩欧美毛片免费观看视频 | 国产精品久久视频 | 欧美日韩中文一区二区三区 | 亚洲图片二区 | 国产l精品国产亚洲区久久 国产l精品国产亚洲区在线观看 | 国产成在线人视频免费视频 | 亚洲精品免费在线视频 | 香蕉tv亚洲专区在线观看 | 日产精品一二三四区国产 |