mrjob在Hadoop clus上使用make\u runner时出错

测试中的工作_作业.py公司名称：

from mrjob.job import MRJob import re WORD_RE = re.compile(r"[\w']+") class MRWordFreqCount(MRJob): def mapper(self, _, line): for word in WORD_RE.findall(line): yield word.lower(), 1 def combiner(self, word, counts): yield word, sum(counts) def reducer(self, word, counts): yield word, sum(counts)

乔布先生的竞选人_测试.py公司名称：

我可以在本地运行此代码（使用inline选项），但是在hadoop上我得到了：

> Traceback (most recent call last): File "mr_job_tester.py", line 17, > in <module> > print test_runner(args, input_dir) File "mr_job_tester.py", line 8, in test_runner > runner.run() File "/usr/local/lib/python2.7/dist-packages/mrjob/runner.py", line 458, in > run > self._run() File "/usr/local/lib/python2.7/dist-packages/mrjob/hadoop.py", line 239, in > _run > self._run_job_in_hadoop() File "/usr/local/lib/python2.7/dist-packages/mrjob/hadoop.py", line 295, in > _run_job_in_hadoop > for step_num in xrange(self._num_steps()): File "/usr/local/lib/python2.7/dist-packages/mrjob/runner.py", line 742, in > _num_steps > return len(self._get_steps()) File "/usr/local/lib/python2.7/dist-packages/mrjob/runner.py", line 721, in > _get_steps > raise ValueError("Bad --steps response: \n%s" % stdout) ValueError: Bad --steps response:

1条回答

网友

1楼 · 发布于 2024-04-26 07:34:19

（According to this）mrjob提交作业文件并在mapper和reducer中远程执行的方式使得以下行必须位于作业声明文件中：

if __name__ == "__main__":
    MRWordFreqCount.run()

测试中的工作_作业.py公司名称：

乔布先生的竞选人_测试.py公司名称：

相关问题更多 >

编程相关推荐

热门问题

热门文章