亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

java讀取pdf文件內容

系統 2407 0

java讀取pdf文件內容

在java中要讀取pdf文件內容,我們可以借助第三方軟件實現。常用的是xpdf,本文就簡單介紹在linux下如何安裝xpdf,及在java中如何利用xpdf讀取pdf文件內容。
一.安裝xpdf
在fc系列下,不用安裝,可以直接yum,但是筆者建議還是下載安裝的好,因為筆者曾經碰到過這樣的問題,客戶服務器上的xpdf是yum安裝的,有一些特殊的pdf文件就無法預覽,但是將yum安裝的xpdf卸載,然后下載xpdf安裝程序,再重新安裝后,就可以了。
1.下載
ok,我們需要下載的xpdf安裝包主要有三個:
2.安裝部署
(1)進入下載目錄,將主程序解壓至/usr,也可以是其他地方,根據個人情況而定。
# tarzvfxxpdf- 3 . 01pl2-linux . tar . gz-C / usr
# cd usr
然后將其重命名,這樣看起來簡單點
mvxpdf- 3 . 01pl2-linux / xpdf
(2)建立中文支持。回到下載目錄,依次執行:
# tarzvfxxpdf-chinese-simplified . tar . gz-C / usr / xpdf
# mv / usr / xpdf / xpdf-chinese-simplified / usr / xpdf / chinese-simplified
# tarzvfxxpdf-chinese-traditional . tar . gz-C / usr / xpdf
# mv / usr / xpdf / xpdf-chinese-traditional / usr / xpdf / chinese-traditional
(3)配置環境
# vi / etc / bashrc
增加如下內容
export PATH=/usr/xpdf/:$PATH
確保重啟機器后,在控制臺輸入xpdf不會提示找不到命令或文件即可。
(4)資源配置
# cd / usr / xpdf
# cpsample-xpdfrcxpdfrc
# vixpdfrc
*在文件開始處增加如下內容(將/usr/xpdf替換為xpdf的實際路徑)*
# -----beginChineseSimplifiedsupportpackage ( 2004 -jul- 27 )
cidToUnicodeAdobe-GB1
" /usr/xpdf/chinese-simplified/Adobe-GB1.cidToUnicode "
unicodeMapISO-
2022 -CN " /usr/xpdf/chinese-simplified/ISO-2022-CN.unicodeMap "
unicodeMapEUC-CN
" /usr/xpdf/chinese-simplified/EUC-CN.unicodeMap "
unicodeMapGBK
" /usr/xpdf/chinese-simplified/GBK.unicodeMap "
cMapDirAdobe-GB1
" /usr/xpdf/chinese-simplified/CMap "
toUnicodeDir
" /usr/xpdf/chinese-simplified/CMap "
# displayCIDFontTTAdobe-GB1 / usr /..../ gkai00mp . ttf
# ----- end ChineseSimplifiedsupportpackage
# -----beginChineseTraditionalsupportpackage ( 2004 -jul- 27 )
cidToUnicodeAdobe-CNS1
" /usr/xpdf/chinese-traditional/Adobe-CNS1.cidToUnicode "
unicodeMapBig5
" /usr/xpdf/chinese-traditional/Big5.unicodeMap "
unicodeMapBig5ascii
" /usr/xpdf/chinese-traditional/Big5ascii.unicodeMap "
cMapDirAdobe-CNS1
" /usr/xpdf/chinese-traditional/CMap "
toUnicodeDir
" /usr/xpdf/chinese-traditional/CMap "
# displayCIDFontTTAdobe-CNS1 / usr /..../ bkai00mp . ttf
# ----- end ChineseTraditionalsupportpackage
然后再執行:
# cpxpdfrc / usr / local / etc /
好了,到這里我們也就安裝完成了。下面介紹如何利用xpdf讀取pdf文件的內容
二.利用xpdf讀取pdf文件的內容
方法很簡單,利用著名的Runtime.getRuntime()即可,如下:
/***/ /**
*
@param filePathpdf文件路徑
*
@return
*/

public StringgetPdfContent(StringfilePath) ... {
Stringexcute
= " pdftotext " ;

String[]cmd
= new String[] ... {excute, " -enc " , " UTF-8 " , " -q " ,filePath, " - " } ;
Processp
= null ;
try ... {
p
= Runtime.getRuntime().exec(cmd);
}
catch (IOExceptione) ... {
e.printStackTrace();
}


BufferedInputStreambis
= new BufferedInputStream(p.getInputStream());

InputStreamReaderreader
= null ;

try ... {
reader
= new InputStreamReader(bis, " UTF-8 " );
}
catch (UnsupportedEncodingExceptione1) ... {
e1.printStackTrace();
}


StringBuffersb
= new StringBuffer();

try ... {
BufferedReaderbr
= new BufferedReader(reader);
Stringline
= br.readLine();
sb
= new StringBuffer();
while (line != null ) ... {
sb.append(line);
sb.append(
" " );
line
= br.readLine();
}

}
catch (Exceptione) ... {
e.printStackTrace();
}


return sb.toString();
}

java讀取pdf文件內容


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产一区二区三区成人久久片 | 日本欧美一区二区三区在线观看 | 久久夜色视频 | 在线亚洲欧美性天天影院 | 国产精品午夜在线观看 | 成人免费国产欧美日韩你懂的 | 亚洲免费久久 | 久久久久久久国产精品 | 综合国产 | 国产精品久久久久三级 | 欧美大香a蕉免费 | 亚洲国产人成中文幕一级二级 | 91人人看| 欧美日韩国产超高清免费看片 | 色综合色狠狠天天久久婷婷基地 | 午夜在线观看网站 | 你懂得在线网站 | 奇米影视888| 成人伊人网| 日本一区精品久久久久影院 | 久草免费公开视频 | 久久久夜间小视频 | 免费国产不卡午夜福在线 | 亚州视频在线 | 精品亚洲永久免费精品 | 亚洲欧美自拍一区 | 国产在线观看99 | 伊人情人综合成人久久网小说 | 99久久99久久免费精品蜜桃 | 亚洲免费一区 | 国产成人免费在线视频 | 狠狠色噜噜狠狠狠狠97不卡 | 日日噜噜夜夜狠狠久久aⅴ 日日噜噜夜夜狠狠久久丁香 | 欧美一级爱爱 | 综合图片区| 免费福利影院 | 日韩免费成人 | 亚洲精品久久久久久久久久久网站 | 久久亚洲热 | 中文成人在线 | 久草在线视频看看 |