hadoop 日滶 Java程选

最近在研究分布式数据，其中用到的就是Hadoop,　Ｈadoop网上的资料不多，特别是运行中运行的问题更是找不到，以下是我运行的一点心得，嘻嘻。

如果在map/reduce的程序中用到java 的代码，可以在java的环境下写好，我用的是eclipse。

１.    进入工程目录找到代码，进bin目录，将用到的包打成 .jar 文件。bin 文件下是 .class文件，一定要是bin,不是src文件中的 .java 文件。  在ubuntu的打.jar 的命令是　jar -cvf  jarname.jar ./*

2.      将打好的 .jar文件复制到　Hadoop的目录下。

3.       切换到Hadoop目录下，编译含map/reduce函数的test .java 文件。命令：　javac -classpath hadoop-0.19.2-dev-core.jar:jarname.jar test.jar -d a. 　a是编译后.class存放的文件夹。

编译时要注意每次改动test.java文件时都要编译一次，而且在core.jar:jarname.jar中不能有空格，我就是因为有空格，导致test.java文件中老是出现软件包不存在的错误。而且这是jarname.jar 要在Hadoop目录下。如果没有:后面的，是不是就直接在lib文件下匹配，以后在研究下。
如果不用引人其它包，把:jarname.jar 去掉。

4.       进入含编译文件的a 文件夹，打　tests.jar 文件。

5.        运行代码：　bin/hadoop jar tests.jar org.test in out　org.test中org是包名, in 是输入文件，out是输出文件。

其中tests.jar　放在Ｈadoop目录下就可以了，但引用的jarname.jar　要放到lib文件夹下。