管道命令行hadoop流式处理作业

1条回答

网友

1楼 · 发布于 2024-05-20 01:52:21

我也遇到了同样的问题，最后使用bash/shell脚本运行hadoop流式处理命令。我创建了一个名为hadoop.sh版其中包含以下内容：

rm -r output | bin/hadoop jar share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar -files /hadoop-2.7.3/script/mapper.php -input /data/* -output output -mapper "php mapper.php" -jobconf mapred.reduce.tasks=1
#add a beginning/ending php to the file
ex -sc '1i|<?php' -c '$a|?>' -cx output/part-00000
#move the file from /output to /script
mv /hadoop-2.7.3/output/part-00000 /hadoop-2.7.3/script/part-00000.php

第00000部分文件将成为下一个hadoop命令的part0000.php文件。在

编程相关推荐

使用applets查询的多人java游戏？
java如何基于字符串生成数组
基于java多边形的路径查找
java如何对多列ArrayList排序
java批处理更新从更新中返回了意外的行数（Spring/Hibernate）
java如何使用SeleniumWebDriver列出<tr>标记内的所有<td>
java如何使用SimpleFlatMapper将前缀为CSV的列别名到映射？
java为什么通过eclipse运行/调试TomCat时会出现ClassNotFoundException
java Android滚动视图上次视图未显示内部线性布局
替换字符串中不带空格的字符序列

相关问题更多 >

编程相关推荐

热门问题

热门文章

管道命令行hadoop流式处理作业

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >