优化AWS EMR Spark设置(Spark配置备忘单)

spark-optimizer的Python项目详细描述


#火花优化器

[![构建状态](https://api.travis-ci.org/delijati/spark-optimizer.svg?branch=master)(https://travis ci.org/delijati/spark optimizer)


优化spark设置(用于群集aka yarn run)


spark优化器

dev安装:

$virtualenv env
$env/bin/pip安装-e。



>使用“4”节点为“c4.4xlage”生成设置:

$env/bin/spark优化器c4.4xlage 4
{spark.default.parallelism':'108',
'spark.driver.cores':'2',
'spark.driver.maxresultsize':'3481m',
“spark.driver.memory”:“3481m”,
“spark.driver.memoryOverhead”:“614m”,
“spark.executor.cores”:“2”,
“spark.executor.instances”:“27”,
“spark.executor.memory”:“3481m”,
'spark.executor.memoryoverhead':'614m'}


>更新实例信息:



$env/bin/python/python-spark优化/emr-u-update.py









>







-




<0.1.3.3.3(2019-03-08)









br/>----

-将EMR成本添加到山药
-导出-加载山药文件
-使“内存-开销-开销”系数“可编辑




<0.1.2(2019-02-20)0.1.2(2019-02-02-20)
---------





-取消版本
-将cli从




<0.1.1.1(2018-09-12)0.1.2(2019-02-20)0.1.2(2019-02-02-20)0.1.1.2(2019-02-02-02-20)0.1.1.1.2(2019-02-09-12)

-初次发布

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
传递Java处理类类型参数的方式的参数   java安卓中间层admob在logcat中导致大量GC_FOR_ALLOC释放消息   java Vert。x Http请求未将参数分配为配置   java中多线程的输出不正确   如何减少java本地线程的冗余   java不完全分块结果   使用OpenCv时java中的Mat数据类型不受支持错误   Java中的正则表达式不工作,而同一正则表达式在shell中工作   java如何从数组中删除元素?   JDBCJava。sql。SQLException:[Microsoft][ODBC Microsoft Access驱动程序]操作必须使用可更新的查询   java如何以对角线打印字符串变量的字符?   SonarQube 5.2的java自定义插件生成NoClassDefFoundError   macos使用Java应用程序打开浏览器选项卡