擅长:python、mysql、java
<p>这听起来可能更容易与电子病历。在</p>
<p>你在评论中提到你正在做计算机视觉。通过准备一个文件,其中每行都是图像文件的base64编码,可以使您的作业hadoop友好。在</p>
<p>您可以准备一个简单的引导脚本,以确保集群的每个节点都安装了您的软件。Hadoop流媒体允许您使用图像处理代码来完成任务(而不是用java重写)。在</p>
<p>作业结束后,集群实例将关闭。您还可以指定将输出直接流式传输到S3存储桶中,所有这些都是内置的。EMR也很便宜,100个m1.medium EC2实例运行一个小时只需花费2美元左右,根据最新的定价:<a href="http://aws.amazon.com/elasticmapreduce/pricing/" rel="nofollow">http://aws.amazon.com/elasticmapreduce/pricing/</a></p>