我们可以将Hadoop与Python集成吗？

2条回答

网友

1楼 · 编辑于 2024-04-20 10:24:54

Hadoop流媒体API：

$HADOOP_HOME/bin/hadoop  jar $HADOOP_HOME/hadoop-streaming.jar \
-input myInputDirs \
-output myOutputDir \
-mapper /bin/cat \
-reducer /bin/wc

你需要知道的是： http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/

网友

2楼 · 编辑于 2024-04-20 10:24:54

除了其他方法，您还可以使用类似JDBC的编译、绑定、运行模型在Python脚本中嵌入Pig拉丁语句和Pig命令。对于Python，确保jythonjar包含在类路径中。请参阅这里的apachepig文档以获取更多详细信息：https://pig.apache.org/docs/r0.9.1/cont.html#embed-python

编程相关推荐

java Spark sample（）函数是否复制数据？
java如何在API中返回单例列表？
java我可以生成提供输入/输出的哈希函数吗？
如何“使用MATLAB或JAVA”从文本文件中读取数字并将其保存在数组中？
java如何将十进制转换为十六进制？
JavaPostXML文件
java XStream如何在XML中不存在带注释的字段时引发异常
java Tomcat启动批处理问题
java AccessControlException与同一代码库中的小程序类
java如何将长本地时间戳转换为字符串UTC时间戳

相关问题更多 >

编程相关推荐

热门问题

热门文章

我们可以将Hadoop与Python集成吗？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >