2019年7月3日早上,在百度AI開(kāi)發(fā)者大會(huì)上,一個(gè)來(lái)自山西的青年,將一瓶礦泉水澆在了同樣來(lái)自山西的李彥宏身上。
可以回顧一下 https://b23.tv/av57665929/p1 ,著實(shí)讓人一驚,這么大的會(huì)議上既然讓人這么容易接近大佬。
(圖片來(lái)源網(wǎng)絡(luò))
OCR識(shí)別準(zhǔn)備工作
百度云真的是測(cè)試接口的天堂,免費(fèi)接口很多,當(dāng)然有量的限制,但個(gè)人使用是完全夠用的,什么人臉識(shí)別、MQTT服務(wù)器、語(yǔ)音識(shí)別等等,應(yīng)有盡有吧
看看OCR識(shí)別免費(fèi)的量
第一步:
創(chuàng)建一個(gè)文字識(shí)別的應(yīng)用,也就是向百度云申請(qǐng)一個(gè)文字識(shí)別的用戶接口
第二步:
打開(kāi)技術(shù)文檔,基本涵蓋了當(dāng)今流行的編程語(yǔ)言
https://cloud.baidu.com/doc/OCR/s/ejwvxzls6/
第三步:
安裝OCR Python SDK,OCR Python SDK目錄結(jié)構(gòu)
├── README.md
├── aip //SDK目錄
│ ├── __init__.py //導(dǎo)出類
│ ├── base.py //aip基類
│ ├── http.py //http請(qǐng)求
│ └── ocr.py //OCR
└── setup.py //setuptools安裝
支持Python版本:2.7.+ ,3.+
安裝命令:
在win10環(huán)境下通過(guò)cmd安裝后需要關(guān)掉當(dāng)前cmd窗口,重新打開(kāi)cmd窗口進(jìn)行命令執(zhí)行python程序方可正確實(shí)現(xiàn)
pip install baidu-aip
測(cè)試代碼
通用文字識(shí)別
from aip import AipOcr # 更換為自己的注冊(cè)信息 APP_ID = ' --- ' API_KEY = ' --- ' SECRET_KEY = ' --- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 fp=open( " tu2.png " , " rb " ).read() # 打開(kāi)并讀取文件內(nèi)容 res=client.basicGeneral(fp) # 普通 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結(jié)果 strx+=tex[ " words " ]#每一行 print (strx) # 輸出內(nèi)容
通用文字識(shí)別(高精度版)
from aip import AipOcr # 更換為自己的注冊(cè)信息 APP_ID = ' --- ' API_KEY = ' --- ' SECRET_KEY = ' --- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 fp=open( " tu2.png " , " rb " ).read() # 打開(kāi)并讀取文件內(nèi)容 # res=client.basicGeneral(fp)#普通 res=client.basicAccurate(fp) # 高精度 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結(jié)果 strx+=tex[ " words " ]#每一行 print (strx) # 輸出內(nèi)容
?URL圖片地址方式
from aip import AipOcr # 更換為自己的注冊(cè)信息 APP_ID = ' ---- ' API_KEY = ' ---- ' SECRET_KEY = ' ----- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 url = " https://img2018.cnblogs.com/blog/1485202/201907/1485202-20190705210445649-2093672772.png " res =client.basicGeneralUrl(url) # 普通 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結(jié)果 strx+=tex[ " words " ] print (strx) # 輸出內(nèi)容
注意
圖片格式(image):
圖像數(shù)據(jù),base64編碼,要求base64編碼后大小不超過(guò)4M,最短邊至少15px,最長(zhǎng)邊最大4096px,支持jpg/png/bmp格式
URL格式(url):
圖片完整URL,URL長(zhǎng)度不超過(guò)1024字節(jié),URL對(duì)應(yīng)的圖片base64編碼后大小不超過(guò)4M,最短邊至少15px,最長(zhǎng)邊最大4096px,支持jpg/png/bmp格式,當(dāng)image字段存在時(shí)url字段失效
語(yǔ)言設(shè)置(language_type)
識(shí)別語(yǔ)言類型,默認(rèn)為CHN_ENG
可設(shè)置:- CHN_ENG:中英文混合;- ENG:英文;- POR:葡萄牙語(yǔ);- FRE:法語(yǔ);- GER:德語(yǔ);-?ITA:意大利語(yǔ);- SPA:西班牙語(yǔ);- RUS:俄語(yǔ);- JAP:日語(yǔ);- KOR:韓語(yǔ);
圖像倒置設(shè)置(detect_direction)
是否檢測(cè)圖像朝向,默認(rèn)不檢測(cè),即:false。朝向是指輸入圖像是正常方向、逆時(shí)針旋轉(zhuǎn)90/180/270度??蛇x值包括:- true:檢測(cè)朝向;- false:不檢測(cè)朝向
是否檢測(cè)語(yǔ)言(detect_language)
是否檢測(cè)語(yǔ)言,默認(rèn)不檢測(cè)。當(dāng)前支持(中文、英語(yǔ)、日語(yǔ)、韓語(yǔ)),值為flase或者true
是否返回識(shí)別結(jié)果中每一行的置信度(probability)
值為flase或者true
參數(shù)添加舉例
""" 如果有可選參數(shù) """ options = {} options[ " detect_direction " ] = " true " options[ " detect_language " ] = " true " """ 帶參數(shù)調(diào)用網(wǎng)絡(luò)圖片文字識(shí)別, 圖片參數(shù)為遠(yuǎn)程url圖片 """ client.webImageUrl(url, options)
?更多參考:
https://cloud.baidu.com/doc/OCR/s/Rjwvxzm3n
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
