在云端数据科学体验中安装BigDL

2条回答

网友

1楼 · 编辑于 2024-05-15 15:23:23

如果您的笔记本电脑是由apachespark作为DSX中的服务实例来支持的，那么安装BigDL非常简单。但是你必须先收集一些版本信息。在

哪个Spark版本？目前，2.1是DSX支持的最新版本。
使用Python，每个服务只能安装一个Spark版本的BigDL。在
哪个BigDL版本？目前，0.3.0是最新版本，它支持Spark 2.1。
如果有疑问，请检查download page。火花固定级别无关紧要。在

有了这些信息，您可以确定Maven存储库中所需bigdljar文件的URL。对于示例版本bigdl0.3.0和spark2.1，下载URL是
https://repo1.maven.org/maven2/com/intel/analytics/bigdl/bigdl-SPARK_2.1/0.3.0/bigdl-SPARK_2.1-0.3.0-jar-with-dependencies.jar

对于其他版本，根据需要替换该URL中的0.3.0和2.1。请注意，两个版本都会出现两次，一次出现在路径中，一次出现在文件名中。在

为Python安装

您需要JAR和匹配的Python包。Python包只依赖于BigDL的版本，而不依赖于Spark版本。安装步骤可以从Python笔记本执行：

安装震击器。在

!(export sv=2.1 bv=0.3.0 ; cd ~/data/libs/ && wget  https://repo1.maven.org/maven2/com/intel/analytics/bigdl/bigdl-SPARK_${sv}/${bv}/bigdl-SPARK_${sv}-${bv}-jar-with-dependencies.jar)

在这里，Spark（sv）和BigDL（bv）的版本被定义为环境变量，因此您可以轻松地调整它们而不必更改URL。

安装Python模块。在
^{pr2}$
如果要在Python版本之间切换笔记本，请对每个Python版本执行此步骤一次。（如果没有 no-deps，将安装一个冲突版本的pyspark。）

重启笔记本内核后，BigDL就可以使用了。在

（不是）为Scala安装

如果按照上面描述的Python安装JAR，Scala内核中也可以使用它。在

如果你想在Scala中独占使用BigDL，最好不要安装JAR。相反，在笔记本的开头使用%AddJar魔法。最好在第一个代码单元中这样做，以避免类加载问题。在

^{3}$

通过不安装JAR，您可以灵活地在共享同一服务的不同Scala笔记本中使用不同版本的Spark和BigDL。一旦你安装了一个JAR，你很可能会在这个和你用%AddJar拉进来的JAR之间发生冲突。在

清理

如果你想安装一个不同版本的BigDL，你必须首先清理。下面是一些命令来检查安装的内容，并删除它。从Python笔记本执行这些命令。在

检查安装了什么罐子。如果输出为空，则不安装任何输出。在
```
!find ~/data/libs -name bigdl-\*
```
检查安装了哪个Python模块。如果输出为空，则不安装BigDL。在
```
!pip freeze | grep -i BigDL
```

删除已安装的BigDL jar。在

!find ~/data/libs -name bigdl-\* -exec rm -vf {} +

删除为当前Python版本安装的BigDL Python模块。在
```
!rm -rf ~/.local/lib/python${_py_version_}/site-packages/{bigdl,BigDL}*
```
如果重新安装失败并出现"multiple dist-info directories"消息，请同时执行：
```
!rm -rf $PIP_BUILD
```

网友

2楼 · 编辑于 2024-05-15 15:23:23

DSX现在支持BigDL。请参阅博客中的详细信息：https://medium.com/ibm-data-science-experience/using-bigdl-in-data-science-experience-for-deep-learning-on-spark-f1cf30ad6ca0?source=collection_home -4 1

为Python安装

（不是）为Scala安装

清理

相关问题更多 >

编程相关推荐

热门问题

热门文章