亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python爬取蘇寧易購--jsonpath方法

系統(tǒng) 2498 0

蘇寧的爬取和京東的爬取是一樣的,方法類似
這是爬取京東的例子:
https://blog.csdn.net/Dream____Fly/article/details/99698222
現(xiàn)在分析蘇寧的首頁,這個(gè)頁面還算比較
python爬取蘇寧易購--jsonpath方法_第1張圖片
這個(gè)很容易獲取,獲取之后在前面拼接https就行了
到這里就可以看代碼操作了:

            
              import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
}

def two_request(new_url):
    print(new_url)
    # two_response = requests.get(url=new_url,headers=headers,verify=False)
    # two_soup = BeautifulSoup(two_response.text,'lxml')
    #需要什么加什么
def first_resquest(first_response):
    soup = BeautifulSoup(first_response.text,'lxml')
    first_body = soup.select('.u-items-list > .f-rt-list > ul > li > a')
    for num in first_body:
        new_url = 'https:' + str(num['href'])
        #發(fā)起二次請(qǐng)求
        two_request(new_url)

def main():
    url = 'https://pindao.suning.com/city/caidian.html?safp=d488778a.homepage1.99345513004.6'
    #第一次請(qǐng)求,獲得請(qǐng)求
    first_response = requests.get(url=url,headers=headers,verify=False)
    first_resquest(first_response)

if __name__ == '__main__':
    main()

            
          

接下來獲取蘇寧易購的商品評(píng)論,這里需要抓取json包
python爬取蘇寧易購--jsonpath方法_第2張圖片
到這里應(yīng)該已經(jīng)完成了所有的需求

2.蘇寧易購直接獲取商品的評(píng)論

            
              import urllib.request
import json,jsonpath

url = 'https://review.suning.com/ajax/cluster_review_lists/general-30075272-000000000627657477-0000000000-total-2-default-10-----reviewList.htm?callback=reviewList'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
}

request = urllib.request.Request(url=url,headers=headers)
content = urllib.request.urlopen(request).read().decode('utf8')
# print('*'*100)
# print(content)
# print('*'*100)
content = content.strip('reviewList()')
# print('-'*100)
# print(content)
# print('-'*100)
obj = json.loads(content)
#找到所有的品論列表
comments = obj['commodityReviews']
fp = open('蘇寧評(píng)論.txt','w',encoding='utf8')
for comment in comments:
    #評(píng)論時(shí)間
    publishTime = comment['publishTime']
    #用戶
    nickname = comment['userInfo']['nickName']
    #評(píng)論內(nèi)容
    content = comment['content']
    #圖片地址
    is_have = comment['picVideoFlag']
    if is_have == True:
        image_src = jsonpath.jsonpath(comment,'$..imageInfo[*].url')
    else:
        image_src = "無"

    #保存
    item = {
        '評(píng)論時(shí)間':publishTime,
        '用戶':nickname,
        '評(píng)論內(nèi)容':content,
        '圖片地址':image_src,
    }
    string = str(item)
    fp.write(string + '\n')


            
          

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 日本一区二区三区精品 | 午夜色网站 | 国产 日韩 欧美 亚洲 | 日本一区二区三区在线观看 | 99精品热女视频专线 | 成年人黄色小视频 | 在线欧美激情 | 兽王高清完整在线观看 | 国产高清对白国产露脸91 | 四虎免费影院4hu永久免费 | 老师在办公室被躁到白浆 | 色姑娘桃花网 | 国产麻豆视频在线看网站 | 日韩一区二区在线免费观看 | 狠狠干欧美 | 日本亚洲欧美国产日韩ay高清 | 色妞欧美 | 日本伊人色 | 国产精品国产三级国产 | 欧美激情aa毛片 | 国内精品伊人久久久影院 | 加勒比一本 | 亚洲在线一区 | 国产呦系列 欧美呦 日韩呦 | 国产精品三 | 性夜黄a爽爽免费视频国产 性夜影院爽黄a爽免费看网站 | 亚洲成人免费视频 | 国产精品成人免费视频不卡 | 亚洲你懂的 | 久久手机免费视频 | 久久中文亚洲国产 | 久久久国产成人精品 | 性色视频| 欧美 亚洲 另类 热图 | 看日本真人一一级特黄毛片 | 亚洲精品区一区二区三区四 | 深夜看片在线观看18 | 纯欧美一级毛片免费 | 欧美在线观看一区二区三 | 久久精品国产精品亚洲红杏 | 亚洲va高清中文字幕 |