亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python實現的百度站長自動URL提交小工具

系統 1765 0

URL提交是百度提供的一個站長工具,用于給站長提供手工收錄某些URL的接口,但是該接口有驗證碼識別部分,比較難弄。所以編寫了如下程序進行驗證碼自動識別:

主要思路

獲取多個驗證碼,提交到 http://lab.ocrking.com/ 進行多次識別,然后計算每個驗證碼圖片識別出來的 字母或數字 進行統計,得出統計率最高的 即為驗證碼。

復制代碼 代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
import time
import json
import re
?
?
if __name__ == "__main__":
??? i = 1
??? s = requests.session()
??? s.headers.update({'Referer':'http://zhanzhang.baidu.com/sitesubmit/index','User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.154 Safari/537.36'})
??? r = s.get('http://zhanzhang.baidu.com/sitesubmit/index')
??? s2 = requests.session()
??? r = s.post('http://zhanzhang.baidu.com/captcha',data={'async':'false','n':time.time()})
??? url = json.loads(r.content)['url']
??? temp = []
??? while 1:
??????? try:
??????????? r = s.get(url)
??????????? img_data = r.content
??????????? r = s2.get('http://lab.ocrking.com/')
??????????? try:
??????????????? content = ' '.join(r.content.split())
??????????????? sid =? re.findall(r'"sid" : "(.+?)"',content)[0]
??????????????? hash_1 = re.findall(r'"hash" : "(.+?)"',content)[0]
??????????????? timestamp = re.findall(r'"timestamp" : "(.+?)"',content)[0]
??????????? except:
??????????????? print 'error on get orking info!'
??????????????? continue
??????????? files = {'Filedata':('icode.jpeg', img_data)}
??????????? data? = {'Filename':'icode.jpeg','sid':sid,'hash':hash_1,'timestamp':timestamp}
??????????? r = s2.post('http://lab.ocrking.com/upload.html',files = files,data= data)
??????????? r = s2.post('http://lab.ocrking.com/ocrking.html',data={'upfile':r.content,'type':'captcha','charset':'7'})
??????????? icode = re.findall(r' (.+?) ',r.content)[0]
??????????? if len(icode) != 4 :
??????????????? continue
??????????? temp.append(icode)
??????????? i = i + 1
??????????? if i == 3 :
??????????????? break
??????? except Exception,e:
??????????? print e
??????????? pass
?
??? a = {'0':{},'1':{},'2':{},'3':{}}
??? for aa in temp:
??????? i = 0
??????? while i <=3 :
??????????? try:
??????????????? a[str(i)][aa[i]] =? a[str(i)][aa[i]] + 1
??????????? except:
??????????????? a[str(i)][aa[i]] = 1
??????????? i = i + 1
??? icode = ['','','','']
??? for index in a:
??????? temp_times = 0
??????? for index_1 in a[index]:
??????????? if a[index][index_1] >= temp_times :
??????????????? temp_times = a[index][index_1]
??????????????? icode[int(index)] = index_1
?
??? icode =? ''.join(icode)
?
??? img_name = 'temp\\'+icode+'.png'
??? file_object = open(img_name, 'w')
??? file_object.write(img_data)
??? file_object.close()
?
?
?
??? #r = s.post('http://zhanzhang.baidu.com/sitesubmit/sitepost',data={'url':'http://lab.ocrking.com/','captcha':icode})
?
??? #print r.content


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。?!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 欧美色图片区 | 亚洲精品乱码国产精品乱码 | 欧美另类日韩中文色综合 | 欧美成 人激情视频 | 99久久免费国内精品 | 欧美日韩在线成人免费视频大全 | 国产日本亚洲 | 麻豆精品国产免费观看 | 香蕉视频日本 | 精品一区二区三区四区 | 爱爱网网站免费观看 | 亚洲欧美另类在线视频 | 久久99亚洲精品久久频 | 一区一精品 | 欧美日韩国产人成在线观看 | 国产综合日韩伦理 | 亚洲欧美久久一区二区 | 成人一级免费视频 | 久久sese| 亚洲国产日韩欧美综合久久 | 亚洲男人天堂视频 | 特黄aa级毛片免费视频播放 | 久久精品中文字幕首页 | 欧美一级毛片免费看 | 日韩欧美在线看 | 搡的我好爽视频在线观看 | 欧美一级在线 | 黄黄视频免费看 | 99热这里只有精品久久免费 | 激情综合在线 | 99久久精品国产交换 | 色综合网站国产麻豆 | 成人国产午夜在线视频 | 色六月丁香 | www.伊人久久| 欧美777精品久久久久网 | 日韩一级欧美一级一级国产 | 日本一级看片免费播放 | 一级毛片卡| 久久69精品久久久久久hb | 久久七国产精品 |