亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python爬蟲偷懶神器 —— 一鍵構造請求頭

系統(tǒng) 1755 0

今天介紹個神奇的網(wǎng)站!堪稱爬蟲偷懶的神器!

我們在寫爬蟲,構建網(wǎng)絡請求的時候,不可避免地要添加請求頭( headers ),以 mdn 學習區(qū)為例,我們的請求頭是這樣的:

一般來說,我們只要添加 user-agent 就能滿足絕大部分需求了,Python 代碼如下:

          
            import requests

headers = {
    #'authority': 'developer.mozilla.org',
    #'pragma': 'no-cache',
    #'cache-control': 'no-cache',
    #'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
    #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
    #'accept-encoding': 'gzip, deflate, br',
    #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
    #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

          
        

但是有些請求,我們要把特定的 headers 參數(shù) 添加上才能獲得正確的網(wǎng)絡響應,不知道哪個參數(shù)是必要的情況下,就要先把所有參數(shù)都添加上,再逐個排除。

但是手動復制粘貼 headers 字典里的每一個 鍵值對 太費事了

一個不那么方便的解決方案:

用正則表達式或者直接字符串替換,把 headers 字符串直接轉化為字典,封裝成函數(shù)方便以后反復調用。

有的人喜歡用這種方法,每次復制headers信息,然后調用自己封裝好的函數(shù),但我覺得還是挺麻煩的。

那么還有沒有 快速一鍵 生成 Python 爬蟲請求頭的方法呢?

這里給大家介紹兩個:

  • 網(wǎng)站在線轉換
  • Postman

實戰(zhàn)演練

抓取網(wǎng)站:https://developer.mozilla.org...

網(wǎng)站在線轉換

1,Chrome 打開開發(fā)者選項( f12 )---> network 選項卡 ---> 刷新頁面,獲取請求 ---> 找到頁面信息對應的請求 (通過請求的名稱、后綴和 response 內容來判斷)

2,右鍵,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

3,打開網(wǎng)站,https://curl.trillworks.com/,粘貼 cURL (bash) 到 左邊 curl command,右邊會 自動 出 Python 代碼

4,生成代碼如下圖

5,print ( response.text ) 就可以直接打印網(wǎng)頁源代碼啦!

Postman

1,下載 postman ( Chrome 也有個 postman 的插件,操作應該差不多)

2,打開 postman,彈出的界面可以直接關掉

3,import --> paste raw text,在 Chrome 里復制 curl (bash),粘貼到下面的對話框里,點擊 import 按鈕

4,點擊 send,模擬網(wǎng)絡請求,下方可查看源代碼

5,確保源代碼正常后,點擊 code

6,左上角可以選擇編程語言,右上角復制到剪貼板

大功告成!

其實我本人平時都是用第一種,網(wǎng)站比較穩(wěn)定,基本沒出現(xiàn)過異常;有了這個神器就不用自己再構造請求頭了,先一鍵生成,然后再根據(jù)需求調一調就好了,幾秒鐘就搞定了。建議收藏網(wǎng)址。

https://curl.trillworks.com/


更多文章、技術交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 久久久福利 | 狠狠色噜噜狠狠色综合久 | 日韩欧美国产亚洲 | 天海翼精品久久中文字幕 | 国产日韩欧美综合一区 | 大杳蕉伊人狼人久久一本线 | 一级无遮挡理论片 | 动漫精品欧美一区二区三区 | 91最新91精品91蝌蚪 | 日韩免费成人 | 中文字幕网在线 | 日本免费特黄aa毛片 | 国产中文字幕视频在线观看 | 欧美激情亚洲激情 | 色播五月婷婷 | 久久色亚洲 | 91在线公开视频 | 日韩字幕 | 久久天堂 | 欧美一级毛片一 | 一本色道久久综合一区 | 欧美不卡在线观看 | 国产综合一区二区 | 国产精品免费久久久免费 | 国内精品免费一区二区三区 | 国产区视频在线 | 成人午夜在线播放 | 成人影院在线观看kkk4444 | 在线观看年轻的母亲 | 一区二区三区四区日韩 | 国产精品_国产精品_国产精品 | 久久er热在这里只有精品85 | 亚洲综合网站 | 成人最新午夜免费视频 | 国产欧美一区二区三区精品 | 我要看免费毛片 | 久久草在线播放 | 亚洲综合色秘密影院秘密影院 | 欧美激情_区二区三区 | 女人18毛片a级毛片免费视频 | 久精品视频村上里沙 |