亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python爬出基礎編程

系統 1742 0
閱讀更多

初學Python爬蟲時都會從最簡單的方法開始,以下為幾種常見的基礎做法。

            
              """

            
            
                  簡單的循環處理

            
            
              """

            
            
              import 
            
            requests


url_list = [
    
            
              "https://www.baidu.com"
            
            
              ,

            
            
              "https://www.cnblogs.com/"

            
            ]


            
              for 
            
            url 
            
              in 
            
            url_list:
    result = requests.get(url)
    
            
              print
            
            (result.text)



            
              """

            
            
                  線程池處理

            
            
              """

            
            
              import 
            
            requests

            
              from 
            
            concurrent.futures 
            
              import 
            
            ThreadPoolExecutor



            
              def 
            
            
              fetch_request
            
            (
            
              url
            
            ):
    result = requests.get(
            
              url
            
            )
    
            
              print
            
            (result.text)


url_list = [
    
            
              "https://www.baidu.com/"
            
            
              ,

            
            
              "https://www.cnblogs.com/"

            
            ]

pool = ThreadPoolExecutor(
            
              10
            
            )


            
              for 
            
            url 
            
              in 
            
            url_list:
    
            
              # 線程池中獲取線程,執行fetch_request方法

            
            pool.submit(fetch_request
            
              , 
            
            url)


            
              # 關閉線程池

            
            pool.shutdown()


            
              """

            
            
                  線程池+回調函數

            
            
              """

            
            
              import 
            
            requests

            
              from 
            
            concurrent.futures 
            
              import 
            
            ThreadPoolExecutor



            
              def 
            
            
              fetch_async
            
            (
            
              url
            
            ):
    response = requests.get(
            
              url
            
            )
    
            
              return 
            
            response



            
              def 
            
            
              callback
            
            (
            
              future
            
            ):
    
            
              print
            
            (
            
              future
            
            .result().text)


url_list = [
    
            
              "https://www.baidu.com/"
            
            
              ,

            
            
              "https://www.cnblogs.com/"

            
            ]

pool = ThreadPoolExecutor(
            
              10
            
            )


            
              for 
            
            url 
            
              in 
            
            url_list:
    v = pool.submit(fetch_async
            
              , 
            
            url)
    
            
              # 調用回調函數

            
            v.add_done_callback(callback)

pool.shutdown()


            
              """

            
            
                  進程池處理

            
            
              """

            
            
              import 
            
            requests

            
              from 
            
            concurrent.futures 
            
              import 
            
            ProcessPoolExecutor



            
              def 
            
            
              fetch_requst
            
            (
            
              url
            
            ):
    result = requests.get(
            
              url
            
            )
    
            
              print
            
            (result.text)


url_list = [
    
            
              "https://www.baidu.com/"
            
            
              ,

            
            
              "https://www.cnblogs.com/"

            
            ]


            
              if 
            
            __name__ == 
            
              '__main__'
            
            :

    pool = ProcessPoolExecutor(
            
              max_workers
            
            =
            
              10
            
            )

    
            
              for 
            
            url 
            
              in 
            
            url_list:
        pool.submit(fetch_requst
            
              , 
            
            url)

    pool.shutdown()


            
              """

            
            
                  進程池+回調函數

            
            
              """

            
            
              import 
            
            requests

            
              from 
            
            concurrent.futures 
            
              import 
            
            ProcessPoolExecutor



            
              def 
            
            
              fetch_async
            
            (
            
              url
            
            ):
    response = requests.get(
            
              url
            
            )
    
            
              return 
            
            response



            
              def 
            
            
              callback
            
            (
            
              future
            
            ):
    
            
              print
            
            (
            
              future
            
            .result().text)


url_list = [
    
            
              "https://www.baidu.com/"
            
            
              ,

            
            
              "https://www.cnblogs.com/"

            
            ]



            
              if 
            
            __name__ == 
            
              '__main__'
            
            :
    pool = ProcessPoolExecutor(
            
              10
            
            )

    
            
              for 
            
            url 
            
              in 
            
            url_list:
        v = pool.submit(fetch_async
            
              , 
            
            url)
        v.add_done_callback(callback)

    pool.shutdown()


          

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 日韩男人天堂 | 亚洲精品久久久中文字 | 成人精品一区二区久久久 | 四虎影院久久久 | 99精品久久久久久 | 2021午夜国产精品福利 | 在线观看亚洲国产 | 国产精品原创永久在线观看 | 国产在线自在拍91精品黑人 | 午夜影院一区二区三区 | 青青青青青青久久久免费观看 | 在线国产福利 | 精品精品国产理论在线观看 | 国产精品久久久久国产精品 | 奇米欧美成人综合影院 | 亚洲爱v| 精品新一区二区三区四区 | 免费国产成人高清在线观看视频 | 免费一级a毛片在线播出 | 久在草影院| 永久黄网站色视频免费观看 | 亚洲一区二区三区国产精品 | 亚洲精品第一综合99久久 | av线上免费观看 | 国产精品亚欧美一区二区三区 | 亚洲一区视频在线播放 | 久久亚洲成人 | 国产一级二级在线观看 | 国产成人综合在线视频 | 国产精品tv| 日韩在线一区二区 | 欧美成人毛片在线视频 | 99热这里只有免费国产精品 | 成人aaaa| 欧美成人禁片在线观看网址 | 成人影院www在线观看 | 精品国产乱码一区二区三区麻豆 | 国产成人一区二区三区免费观看 | 手机在线看片国产 | 久久精品99视频 | 成人欧美午夜视频毛片 |