亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

java讀取pdf文件內容

系統 2457 0

java讀取pdf文件內容

在java中要讀取pdf文件內容,我們可以借助第三方軟件實現。常用的是xpdf,本文就簡單介紹在linux下如何安裝xpdf,及在java中如何利用xpdf讀取pdf文件內容。
一.安裝xpdf
在fc系列下,不用安裝,可以直接yum,但是筆者建議還是下載安裝的好,因為筆者曾經碰到過這樣的問題,客戶服務器上的xpdf是yum安裝的,有一些特殊的pdf文件就無法預覽,但是將yum安裝的xpdf卸載,然后下載xpdf安裝程序,再重新安裝后,就可以了。
1.下載
ok,我們需要下載的xpdf安裝包主要有三個:
2.安裝部署
(1)進入下載目錄,將主程序解壓至/usr,也可以是其他地方,根據個人情況而定。
# tarzvfxxpdf- 3 . 01pl2-linux . tar . gz-C / usr
# cd usr
然后將其重命名,這樣看起來簡單點
mvxpdf- 3 . 01pl2-linux / xpdf
(2)建立中文支持。回到下載目錄,依次執行:
# tarzvfxxpdf-chinese-simplified . tar . gz-C / usr / xpdf
# mv / usr / xpdf / xpdf-chinese-simplified / usr / xpdf / chinese-simplified
# tarzvfxxpdf-chinese-traditional . tar . gz-C / usr / xpdf
# mv / usr / xpdf / xpdf-chinese-traditional / usr / xpdf / chinese-traditional
(3)配置環境
# vi / etc / bashrc
增加如下內容
export PATH=/usr/xpdf/:$PATH
確保重啟機器后,在控制臺輸入xpdf不會提示找不到命令或文件即可。
(4)資源配置
# cd / usr / xpdf
# cpsample-xpdfrcxpdfrc
# vixpdfrc
*在文件開始處增加如下內容(將/usr/xpdf替換為xpdf的實際路徑)*
# -----beginChineseSimplifiedsupportpackage ( 2004 -jul- 27 )
cidToUnicodeAdobe-GB1
" /usr/xpdf/chinese-simplified/Adobe-GB1.cidToUnicode "
unicodeMapISO-
2022 -CN " /usr/xpdf/chinese-simplified/ISO-2022-CN.unicodeMap "
unicodeMapEUC-CN
" /usr/xpdf/chinese-simplified/EUC-CN.unicodeMap "
unicodeMapGBK
" /usr/xpdf/chinese-simplified/GBK.unicodeMap "
cMapDirAdobe-GB1
" /usr/xpdf/chinese-simplified/CMap "
toUnicodeDir
" /usr/xpdf/chinese-simplified/CMap "
# displayCIDFontTTAdobe-GB1 / usr /..../ gkai00mp . ttf
# ----- end ChineseSimplifiedsupportpackage
# -----beginChineseTraditionalsupportpackage ( 2004 -jul- 27 )
cidToUnicodeAdobe-CNS1
" /usr/xpdf/chinese-traditional/Adobe-CNS1.cidToUnicode "
unicodeMapBig5
" /usr/xpdf/chinese-traditional/Big5.unicodeMap "
unicodeMapBig5ascii
" /usr/xpdf/chinese-traditional/Big5ascii.unicodeMap "
cMapDirAdobe-CNS1
" /usr/xpdf/chinese-traditional/CMap "
toUnicodeDir
" /usr/xpdf/chinese-traditional/CMap "
# displayCIDFontTTAdobe-CNS1 / usr /..../ bkai00mp . ttf
# ----- end ChineseTraditionalsupportpackage
然后再執行:
# cpxpdfrc / usr / local / etc /
好了,到這里我們也就安裝完成了。下面介紹如何利用xpdf讀取pdf文件的內容
二.利用xpdf讀取pdf文件的內容
方法很簡單,利用著名的Runtime.getRuntime()即可,如下:
/***/ /**
*
@param filePathpdf文件路徑
*
@return
*/

public StringgetPdfContent(StringfilePath) ... {
Stringexcute
= " pdftotext " ;

String[]cmd
= new String[] ... {excute, " -enc " , " UTF-8 " , " -q " ,filePath, " - " } ;
Processp
= null ;
try ... {
p
= Runtime.getRuntime().exec(cmd);
}
catch (IOExceptione) ... {
e.printStackTrace();
}


BufferedInputStreambis
= new BufferedInputStream(p.getInputStream());

InputStreamReaderreader
= null ;

try ... {
reader
= new InputStreamReader(bis, " UTF-8 " );
}
catch (UnsupportedEncodingExceptione1) ... {
e1.printStackTrace();
}


StringBuffersb
= new StringBuffer();

try ... {
BufferedReaderbr
= new BufferedReader(reader);
Stringline
= br.readLine();
sb
= new StringBuffer();
while (line != null ) ... {
sb.append(line);
sb.append(
" " );
line
= br.readLine();
}

}
catch (Exceptione) ... {
e.printStackTrace();
}


return sb.toString();
}

java讀取pdf文件內容


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 久久国内精品自在自线400部o | 国产福利在线观看 | 视频在线欧美 | 九九九九精品视频在线播放 | 国内一区亚洲综合图区欧美 | 国产亚洲福利精品一区二区 | 夜色99 | 国产99久久九九精品免费 | 香蕉人精品视频多人免费永久视频 | 天天爽夜夜爽人人爽 | 香蕉网久久 | 亚洲国产一成人久久精品 | 99九九99九九九视频精品 | 欧美成人久久久免费播放 | 国产欧美日韩图片一区二区 | 日韩精品一区二区三区中文3d | 午夜香蕉成视频人网站高清版 | 中国特黄特级真人毛片 | 一级毛片一级毛片一级毛片aa | 香蕉久久夜色精品国产小说 | 国产a免费| 日本爱爱片 | 啪啪免费网站入口链接 | 国产91在线播放 | 欧美成人精品一级高清片 | 欧美伦禁片在线播放 | 国产综合视频 | 日日射视频 | 毛片爱做的片 | 老子午夜精品我不卡影院 | 四虎影音在线观看 | 不卡一级毛片免费高清 | 久久精品一区二区三区中文字幕 | 精品日产一区二区三区手机 | 日韩欧美成人免费中文字幕 | 亚洲天堂久久久 | 日韩高清欧美精品亚洲 | 亚洲高清视频在线观看 | 国产福利视频一区美女 | 国产亚洲综合精品一区二区三区 | 老司机精品视频个人在观看 |