Python中文
首页
教程
问答
标签
搜索
登录
注册
如何开始大数据分析
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我是R的长期用户,最近开始使用Python。使用传统的RDBMS系统进行数据仓库存储,使用R/Python进行数字处理,我觉得现在有必要着手进行大数据分析。</p> <p>我想知道如何开始大数据处理。 -如何从Map/Reduce和Hadoop的使用开始简单</p> <ul> <li>我如何利用我在R和Python中的技能开始大数据分析。例如使用Python Disco项目。</li> <li>使用RHIPE包并查找玩具数据集和问题区域。</li> <li>找到合适的信息,让我决定是否需要从RDBMS类型数据库移动到NoSQL</li> </ul> <p>总之,我想知道如何从小做起,逐步积累我在大数据分析方面的技能和诀窍。</p> <p>谢谢你的建议和建议。 我为这个查询的一般性表示歉意,但我希望获得有关这个主题的更多视角。</p> <ul> <li>严厉的</li> </ul>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以考虑的一件事是DMelt(<a href="http://jwork.org/dmelt/" rel="nofollow">http://jwork.org/dmelt/</a>)数据分析程序。一个值得注意的特性是它有数百个使用Python语言的示例,以及一些书籍。我使用它的原因是它运行在我的Windows 10上(因为它使用Java VM),另外它有非常好的2D/3D图形,可以导出为矢量图形格式。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何提高Djang的410误差
4 回答
如何提高doc2vec模型中两个文档(句子)的余弦相似度?
6 回答
如何提高Docker的日志限制?|[输出已剪裁,达到日志限制100KiB/s]
3 回答
如何提高DQN的性能?
6 回答
如何提高EasyOCR的准确性/预测?
3 回答
如何提高Euler#39项目解决方案的效率?
10 回答
如何提高F1成绩进行分类
8 回答
如何提高FaceNet的准确性
7 回答
如何提高fft处理的精度?
4 回答
如何提高Fibonacci实现对大n的精度?
1 回答
如何提高Flask与psycopg2的连接时间
2 回答
如何提高FosterCauer变换的scipy.signal.invres()的数值稳定性?
10 回答
如何提高gae查询的性能?
3 回答
如何提高GANs用于时间序列预测/异常检测的结果
3 回答
如何提高gevent和tornado组合的性能?
2 回答
如何提高googleappengin请求日志的吞吐量
2 回答
如何提高googlevision文本识别的准确性
8 回答
如何提高groupby/apply效率
1 回答
如何提高Gunicorn中的请求率
6 回答
如何提高G中的文件编码转换
6 回答