如何在Hadoop中编写和执行Hello World程序?
我刚开始学习Apache Hadoop,完全是个新手。能不能告诉我怎么在Apache Hadoop里写一个“Hello World”的Python程序?还有,Hadoop里的程序是怎么运行的?我只需要在一个单一的集群上做这个。我现在很着急,所以发这个帖子。我的Ubuntu 10.10上已经配置好了Hadoop,并且成功运行了一些示例程序,比如:
$ bin/hadoop jar hadoop-0.20.1-examples.jar pi 10 100
我对这个步骤背后发生的事情完全不明白。还有,能不能推荐一些好的Hadoop入门资料(电子书、链接等)?如果我有时间,我应该能搞明白这些,但我现在没有时间,所以请回复我,这对我会很有帮助。
3 个回答
0
可以看看雅虎的Hadoop教程(http://developer.yahoo.com/hadoop/tutorial/)。 你也可以查看hadoop-examples的源代码,这样能更好地理解如何用Hadoop编程。 另外,了解一下Hadoop流处理(http://wiki.apache.org/hadoop/HadoopStreaming)也是个不错的主意。
1
因为你可以在Hadoop中运行这个例子,所以运行一个应用程序的方法也是一样的。你可以在这里查看相关文档:http://hadoop.apache.org/common/docs/r0.18.2/mapred_tutorial.html。而WordCount例子就像是编程中的“你好,世界”程序,非常基础。
2
我建议你去看看文档,
http://hadoop.apache.org/common/docs/r0.20.2/index.html
还有维基百科,
http://wiki.apache.org/hadoop/FrontPage
在文档里,你会找到一些示例,就像之前的回答里提到的那样。祝你好运。