擅长:python、mysql、java
<p>您缺少很多配置,需要定义目录等。请看这里:</p>
<p><a href="http://wiki.apache.org/hadoop/QuickStart" rel="noreferrer">http://wiki.apache.org/hadoop/QuickStart</a></p>
<p>分布式操作与上面描述的伪分布式操作一样,除了:</p>
<ol>
<li>在conf/hadoop-site.xml中的fs.default.name和mapred.job.tracker值中指定主服务器的主机名或IP地址。它们被指定为主机:端口对。</li>
<li>在conf/hadoop-site.xml中为dfs.name.dir和dfs.data.dir指定目录。它们分别用于在主节点和从节点上保存分布式文件系统数据。请注意,dfs.data.dir可能包含以空格或逗号分隔的目录名列表,因此数据可能存储在多个设备上。</li>
<li>在conf/hadoop-site.xml中指定mapred.local.dir。这将确定临时MapReduce数据的写入位置。它也可能是目录列表。</li>
<li>在conf/mapred-default.xml中指定mapred.map.tasks和mapred.reduce.tasks。根据经验,mapred.map.tasks使用10倍的从属处理器,mapred.reduce.tasks使用2倍的从属处理器。</li>
<li>列出conf/slaves文件中的所有从属主机名或IP地址,每行一个,并确保jobtracker位于指向jobtracker节点的/etc/hosts文件中</li>
</ol>