我一直在使用PaperMill定期执行我的python笔记本。要执行计算密集型笔记本,我需要连接到EMR集群中运行的远程内核
对于Jupyter笔记本,我可以通过使用jupyter notebook --gateway-url=http://my-gateway-server:8888
启动Jupyter服务器来实现这一点,并且我能够在远程内核上执行我的代码。但是如何让本地python代码(通过造纸机)使用远程内核呢?在内核管理器中进行哪些更改以连接到远程内核
我能找到的一个相关答案是here。这建议将端口转发到远程服务器,并使用来自服务器的连接文件初始化KernelManager。我无法做到这一点,因为blockingkernelmanager
不再在Ipython.zmp中,我也希望像jupyter那样使用HTTP连接
黑客方法-设置shell脚本以执行以下操作:
hadoop
用户在EMR主节点上创建python环境与造纸厂合作:
造纸机s3://path/to/notebook/input.ipynb s3://path/to/notebook/output.ipynb-p param=1
如果集群主节点每次都相同,则步骤1和2是一次性要求
稍微好一点的方法:
我在不同的用例中使用了这两种方法,目前它们似乎工作得很好
相关问题 更多 >
编程相关推荐