亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論

系統(tǒng) 2188 0

課程作業(yè)要求,遂學(xué)習(xí)了python的自動(dòng)化selenium工具,并爬取京東商品評(píng)論數(shù)據(jù)練練手。

目錄:

一、環(huán)境

二、第三方庫(kù)

三、分析

1.1 chrome驅(qū)動(dòng)

1.2?定位評(píng)論元素

1.3?循環(huán)爬取評(píng)論數(shù)據(jù)并保存為CVS文件導(dǎo)出

其中xpath對(duì)應(yīng)網(wǎng)頁(yè)元素

? ? ? ? ?評(píng)論:

? ? ? ? ?用戶名:

四、代碼

五、結(jié)果


?


一、環(huán)境

我使用的是windows+python3.6+pycharm,大家自己去下載對(duì)應(yīng)的環(huán)境。

二、第三方庫(kù)

              
                from selenium import webdriver
from time import sleep
import csv
              
            

三、分析

1.1 chrome驅(qū)動(dòng)

              
                browser = webdriver.Chrome()#需要使用chrome的調(diào)用驅(qū)動(dòng)chormedrive導(dǎo)入script目錄
              
            

調(diào)用瀏覽器需要下載對(duì)應(yīng)的chrome驅(qū)動(dòng)到項(xiàng)目工程目錄

我的目錄是 C:\Users\Administrator\PycharmProjects\python\venv\Scripts

需要注意的是chrome瀏覽器的版本號(hào)需要與對(duì)應(yīng)驅(qū)動(dòng)版本號(hào)對(duì)應(yīng),不然會(huì)報(bào)錯(cuò)。

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第1張圖片

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第2張圖片


1.2?定位評(píng)論元素

然后就是通過(guò)xpath定位網(wǎng)頁(yè)評(píng)論元素

              
                try:
    browser.get('https://item.jd.com/100002795959.html#none')   #控制瀏覽器跳轉(zhuǎn)到這個(gè)網(wǎng)頁(yè)
    button = browser.find_element_by_xpath("http://li[@clstag='shangpin|keycount|product|shangpinpingjia_1']")   #獲取商品評(píng)論按鈕
    button.click()  #控制按鈕進(jìn)行點(diǎn)擊
    sleep(10)   #等待網(wǎng)頁(yè)加載,防止網(wǎng)頁(yè)加載過(guò)慢
              
            

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第3張圖片


1.3?循環(huán)爬取評(píng)論數(shù)據(jù)并保存為CVS文件導(dǎo)出

              
                 with open('comment_con.csv', 'w') as csvfile:   #新建并打開comment_con.csv文件
        writer = csv.writer(csvfile)
        writer.writerow(['user_name', 'comment'])   #寫第一行
        for n in range(99): #進(jìn)行99次循環(huán)
            m = n+1
            print(m)
            user = browser.find_elements_by_xpath("http://div[@class='user-info']")  #獲取用戶名
            lis = browser.find_elements_by_xpath("http://p[@class='comment-con']")   #獲取評(píng)論
            for i in range(len(user)):
                writer.writerow([user[i].text, lis[i].text])
            button2 = browser.find_element_by_class_name("ui-pager-next")   #獲取下一頁(yè)按鈕
            print(button2.text)
            sleep(1)
            print("第%d頁(yè)" %m)
            button2.click()
            sleep(5)
finally:
    browser.close()
              
            

其中xpath對(duì)應(yīng)網(wǎng)頁(yè)元素

評(píng)論:

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第4張圖片

用戶名:

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第5張圖片

?

四、代碼

              
                from selenium import webdriver
from time import sleep
import csv

browser = webdriver.Chrome()#需要使用chrome的調(diào)用驅(qū)動(dòng)chormedrive導(dǎo)入script目錄
try:
    browser.get('https://item.jd.com/100002795959.html#none')   #控制瀏覽器跳轉(zhuǎn)到這個(gè)網(wǎng)頁(yè)
    button = browser.find_element_by_xpath("http://li[@clstag='shangpin|keycount|product|shangpinpingjia_1']")   #獲取商品評(píng)論按鈕
    button.click()  #控制按鈕進(jìn)行點(diǎn)擊
    sleep(10)   #等待網(wǎng)頁(yè)加載,防止網(wǎng)頁(yè)加載過(guò)慢

    with open('comment_con.csv', 'w') as csvfile:   #新建并打開comment_con.csv文件
        writer = csv.writer(csvfile)
        writer.writerow(['user_name', 'comment'])   #寫第一行
        for n in range(99): #進(jìn)行99次循環(huán)
            m = n+1
            print(m)
            user = browser.find_elements_by_xpath("http://div[@class='user-info']")  #獲取用戶名
            lis = browser.find_elements_by_xpath("http://p[@class='comment-con']")   #獲取評(píng)論
            for i in range(len(user)):
                writer.writerow([user[i].text, lis[i].text])
            button2 = browser.find_element_by_class_name("ui-pager-next")   #獲取下一頁(yè)按鈕
            print(button2.text)
            sleep(1)
            print("第%d頁(yè)" %m)
            button2.click()
            sleep(5)
finally:
    browser.close()
              
            
wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

五、結(jié)果

使用Python的自動(dòng)化工具Selenium爬取京東商品評(píng)論_第6張圖片 wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== ?


博客記錄學(xué)習(xí),傳遞知識(shí),共同進(jìn)步,希望對(duì)你有幫助。QAQ


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 色婷婷777 | 欧美精品专区第1页 | 天天草天天 | 久久久久久久久久综合情日本 | 国产精品mm| 日韩欧国产精品一区综合无码 | 国产这里有精品 | 精品国产一区二区三区免费 | 日韩亚洲人成在线综合 | 最新亚洲精品国自产在线观看 | 国产成人福利 | 一级a毛片免费观看久久精品 | 久久久999久久久精品 | 一级特黄aaa大片大全 | 亚洲热线99精品视频 | 国产91精品久久久久999 | 亚洲一级在线 | 成熟女人免费一级毛片 | 毛片视频大全 | 免费观看一级欧美大 | 十大黄色免费网站 | 日本不卡二区 | 日韩一级欧美一级一级国产 | 91国内精品久久久久免费影院 | 91午夜精品亚洲一区二区三区 | 欧美综合成人 | 国产激情久久久久影院小草 | 国产一级毛片国产 | 狼人久久尹人香蕉尹人 | 伊人色美文情网址 | 亚洲 欧美精品 | 国产在线91精品 | 四虎国产视频 | 亚洲欧美日韩国产综合高清 | 欧美日韩亚洲精品国产色 | 久99久精品视频免费观看v | 国产精品亚洲欧美一级久久精品 | 深夜影院在线视频观看 | 国产日产欧产麻豆精品精品推荐 | 天啪天天久久天天综合啪 | 欧美日韩国产一区二区三区播放 |