2024-04-29 06:32:26 发布
网友
我想在笔记本上使用Intel BigDL来体验云上的数据科学。在
如何安装?在
如果您的笔记本电脑是由apachespark作为DSX中的服务实例来支持的,那么安装BigDL非常简单。但是你必须先收集一些版本信息。在
有了这些信息,您可以确定Maven存储库中所需bigdljar文件的URL。 对于示例版本bigdl0.3.0和spark2.1,下载URL是https://repo1.maven.org/maven2/com/intel/analytics/bigdl/bigdl-SPARK_2.1/0.3.0/bigdl-SPARK_2.1-0.3.0-jar-with-dependencies.jar
对于其他版本,根据需要替换该URL中的0.3.0和2.1。请注意,两个版本都会出现两次,一次出现在路径中,一次出现在文件名中。在
您需要JAR和匹配的Python包。Python包只依赖于BigDL的版本,而不依赖于Spark版本。 安装步骤可以从Python笔记本执行:
安装震击器。在
!(export sv=2.1 bv=0.3.0 ; cd ~/data/libs/ && wget https://repo1.maven.org/maven2/com/intel/analytics/bigdl/bigdl-SPARK_${sv}/${bv}/bigdl-SPARK_${sv}-${bv}-jar-with-dependencies.jar)
在这里,Spark(sv)和BigDL(bv)的版本被定义为环境变量,因此您可以轻松地调整它们而不必更改URL。
sv
bv
安装Python模块。在
如果要在Python版本之间切换笔记本,请对每个Python版本执行此步骤一次。 (如果没有 no-deps,将安装一个冲突版本的pyspark。)
no-deps
重启笔记本内核后,BigDL就可以使用了。在
如果按照上面描述的Python安装JAR,Scala内核中也可以使用它。在
如果你想在Scala中独占使用BigDL,最好不要安装JAR。相反,在笔记本的开头使用%AddJar魔法。最好在第一个代码单元中这样做,以避免类加载问题。在
%AddJar
通过不安装JAR,您可以灵活地在共享同一服务的不同Scala笔记本中使用不同版本的Spark和BigDL。一旦你安装了一个JAR,你很可能会在这个和你用%AddJar拉进来的JAR之间发生冲突。在
如果你想安装一个不同版本的BigDL,你必须首先清理。下面是一些命令来检查安装的内容,并删除它。从Python笔记本执行这些命令。在
检查安装了什么罐子。如果输出为空,则不安装任何输出。在
!find ~/data/libs -name bigdl-\*
检查安装了哪个Python模块。如果输出为空,则不安装BigDL。在
!pip freeze | grep -i BigDL
删除已安装的BigDL jar。在
!find ~/data/libs -name bigdl-\* -exec rm -vf {} +
删除为当前Python版本安装的BigDL Python模块。在
!rm -rf ~/.local/lib/python${_py_version_}/site-packages/{bigdl,BigDL}*
如果重新安装失败并出现"multiple dist-info directories"消息,请同时执行:
!rm -rf $PIP_BUILD
DSX现在支持BigDL。请参阅博客中的详细信息:https://medium.com/ibm-data-science-experience/using-bigdl-in-data-science-experience-for-deep-learning-on-spark-f1cf30ad6ca0?source=collection_home -4 1
如果您的笔记本电脑是由apachespark作为DSX中的服务实例来支持的,那么安装BigDL非常简单。但是你必须先收集一些版本信息。在
使用Python,每个服务只能安装一个Spark版本的BigDL。在
如果有疑问,请检查download page。火花固定级别无关紧要。在
有了这些信息,您可以确定Maven存储库中所需bigdljar文件的URL。 对于示例版本bigdl0.3.0和spark2.1,下载URL是
https://repo1.maven.org/maven2/com/intel/analytics/bigdl/bigdl-SPARK_2.1/0.3.0/bigdl-SPARK_2.1-0.3.0-jar-with-dependencies.jar
对于其他版本,根据需要替换该URL中的0.3.0和2.1。请注意,两个版本都会出现两次,一次出现在路径中,一次出现在文件名中。在
为Python安装
您需要JAR和匹配的Python包。Python包只依赖于BigDL的版本,而不依赖于Spark版本。 安装步骤可以从Python笔记本执行:
安装震击器。在
在这里,Spark(
sv
)和BigDL(bv
)的版本被定义为环境变量,因此您可以轻松地调整它们而不必更改URL。安装Python模块。在
^{pr2}$如果要在Python版本之间切换笔记本,请对每个Python版本执行此步骤一次。 (如果没有
no-deps
,将安装一个冲突版本的pyspark。)重启笔记本内核后,BigDL就可以使用了。在
(不是)为Scala安装
如果按照上面描述的Python安装JAR,Scala内核中也可以使用它。在
如果你想在Scala中独占使用BigDL,最好不要安装JAR。相反,在笔记本的开头使用
^{3}$%AddJar
魔法。最好在第一个代码单元中这样做,以避免类加载问题。在通过不安装JAR,您可以灵活地在共享同一服务的不同Scala笔记本中使用不同版本的Spark和BigDL。一旦你安装了一个JAR,你很可能会在这个和你用
%AddJar
拉进来的JAR之间发生冲突。在清理
如果你想安装一个不同版本的BigDL,你必须首先清理。下面是一些命令来检查安装的内容,并删除它。从Python笔记本执行这些命令。在
检查安装了什么罐子。如果输出为空,则不安装任何输出。在
检查安装了哪个Python模块。如果输出为空,则不安装BigDL。在
删除已安装的BigDL jar。在
删除为当前Python版本安装的BigDL Python模块。在
如果重新安装失败并出现"multiple dist-info directories"消息,请同时执行:
DSX现在支持BigDL。请参阅博客中的详细信息:https://medium.com/ibm-data-science-experience/using-bigdl-in-data-science-experience-for-deep-learning-on-spark-f1cf30ad6ca0?source=collection_home -4 1
相关问题 更多 >
编程相关推荐