方便使用的实用工具,用于数据块笔记本。

databricks-utils的Python项目详细描述


数据块实用程序

Python versionPyspark versionBuild Status

databricks-utils是一个python包,它提供了几个实用程序类/func 这提高了数据块笔记本的易用性。

安装

pip install databricks-utils

功能

文件

api文档可以在https://e2fyi.github.io/databricks-utils/找到。

快速启动

s3bucket

importjsonfromdatabricks_utils.awsimportS3Bucket# need to attach notebook's dbutils# before S3Bucket can be usedS3Bucket.attach_dbutils(dbutils)# create an instance of the s3 bucketbucket=(S3Bucket("somebucketname","SOMEACCESSKEY","SOMESECRETKEY").allow_spark(sc)# local spark context.mount("somebucketname"))# mount location name (resolves as `/mnt/somebucketname`)# show list of files/folders in the bucket "resource" folderbucket.ls("resource/")# read in a json file from the bucketdata=json.load(open(bucket.local("resource/somefile.json","r")))# read from parquet via sparkdataframe=spark.read.parquet(bucket.s3("resource/somedf.parquet"))# umountbucket.umount()

vega
VegaVega-Lite 是交互式图形的高级语法。它们提供简洁的json 用于快速生成可视化以支持分析的语法。

fromdatabricks_utils.vegaimportvega_embed# vega-lite spec for a bar chartspec={"data":{"values":[{"a":"A","b":28},{"a":"B","b":55},{"a":"C","b":43},{"a":"D","b":91},{"a":"E","b":81},{"a":"F","b":53},{"a":"G","b":19},{"a":"H","b":87},{"a":"I","b":52}]},"mark":"bar","encoding":{"x":{"field":"a","type":"ordinal"},"y":{"field":"b","type":"quantitative"}}}# plot out the vega chart in databricks notebookdisplayHTML(vega_embed(spec=spec))

显影剂

# add a version to git tag and publish to pypi
. add_tag.sh <VERSION>

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
日期和现在之间的Java时间   java以适当的方式更新jLabel和jTextField   java如何从PQ(单链表)中删除最大值   java可以通过任何方式找出哪些NSF文件属于Domino服务器   java Velocity 2不会设置属性   如何使用java流迭代索引映射列表   maven依赖项在编译期间工作,但在java运行时失败。lang.NoClassDefFoundError&java。lang.ClassNotFoundException   java有没有办法完全隐藏Web应用程序代码?   Android appcompat v7 21库中的java FadingActionBar错误   Eclipse/com中的java AdMob。谷歌。安卓gms。ads.AdView   java My Service表示它正在运行,但其状态尚不清楚,似乎没有绑定   java无法启动Apache Tomcat Web应用程序容器   JDK:java中的命名约定。可丢弃的   Spring SerSecurity中的java身份验证错误   Maven:使用JDK8编译Java7   java在使用ExecutorService时如何管理内存?   comm.jar通信串行端口java   java LibGDX创建动画