第一個(gè)Hadoop下的Wordcount程序
這次的源碼是用的Hadoop實(shí)戰(zhàn)的源碼
首先將源碼拷貝進(jìn)Linux下的工作目錄下,在/home/hadoop/workspace下。
導(dǎo)入兩個(gè)測(cè)試文件
echo "Hello World Bye World" ?file01
echo "Hello Hadoop Bye Hadoop" file02
創(chuàng)建一個(gè)Jar包目錄:mkdir FirstJar?
編譯Java文件至FirstJar下:javac -classpath /usr/hadoop/hadoop-XXX-core.jar -d FirstJar WordCount.java?
打包FirstJar:Java -cvf WordCount.jar -C FirstJar/ . ? (注意這個(gè)點(diǎn)不要漏掉)
在HDFS上創(chuàng)建輸入輸出目錄:hadoop dfs -mkdir input,hadoop dfs -mkdir output
上傳測(cè)試文件至HDFS:Hadoop dfs -put ?file0* ?input
運(yùn)行Jar包:Hadoop jar WordCount.jar WordCount input output
需要說(shuō)明的一點(diǎn):Hadoop實(shí)戰(zhàn)源碼中有包目錄,編譯過(guò)程中若不刪除包目錄,在執(zhí)行jar包是會(huì)發(fā)生找不到class類(lèi)的錯(cuò)誤,即便執(zhí)行時(shí)在類(lèi)前加上該目錄也找不到,具體愿意還待研究。
Linux 刪除目錄,文件:rm -rf dirname
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
