没有项目描述

csvtoparquet的Python项目详细描述


#使用IBM云对象存储将CSV对象文件转换为Apache Parquet

这个工具是为了帮助ibm cloud上的用户将ibmcloudobjectstorage(cos)中的csv对象转换为apache parquet对象而开发的。它是使用Python3.6.6开发的,将与3.6.6之前的Python3版本一起使用。

###安装 要安装该工具,请使用以下命令运行pip

` pip install csvtoparquet `

安装该工具后,必须具有ibm cloud api密钥和ibm cos服务才能使命令行工具正常工作。它要求您插入ibm cloud api密钥和ibm cos服务。您可以从IBM云管理面板中找到API密钥:manage>;security>;platform API密钥。如果您没有ibm cos作为服务,可以在对象存储下的cloudcatalog中找到它,它有一个lite层(免费)。

如果已经有了cos服务,则需要csv对象所在的bucket的名称。现在,该工具不支持多个bucket,因此不能从一个bucket转换对象并将它们存储在另一个bucket中。但是,您可以将转换后的对象重命名为使用前缀,例如:

[对象名称]-mycsvfile.csv [重命名对象存储为拼花]-new/prefix/mycsvfile.parquet

文件扩展名.parquet将自动添加到新对象名中。

###用法

使用以下必需标志在命令行上运行csvtoparquet

` csvtoparquet -a <IBM_CLOUD_API_KEY> -e <IBM_CLOUD_COS_ENDPOINT> -b <IBM_COS_BUCKET> `

  • -a-api key-ibm云api key
  • -e–端点-cos bucket端点
  • -b–存储csv对象的bucket-cos bucket名称

使用标志后,您可以将以下标志附加到命令:

  • -l–list-列出bucket中的所有对象
  • -c-csv-列出bucket中的所有csv对象
  • -cn-csv名称-仅列出存储桶中csv对象的名称
  • -f–file-要转换的csv对象的名称-与-n
  • 一起使用
  • -n–name-新对象的名称new可以包含前缀-与-f
  • 一起使用

####转换对象

#####转换一个对象

输入:

` csvtoparquet -a <IBM_CLOUD_API_KEY> -e <IBM_CLOUD_COS_ENDPOINT> -b <IBM_COS_BUCKET> \ -f csvfile.csv -n csvfile `

输出:

` Now Converting: csvfile.csv --> csvfile.parquet `

#####转换多个对象

输入:

` csvtoparquet -a <IBM_CLOUD_API_KEY> -e <IBM_CLOUD_COS_ENDPOINT> -b <IBM_COS_BUCKET> \ -f csvfile.csv anothercsvfile.csv -n csvfile new/csvfile `

输出:

` Now Converting: csvfile.csv --> csvfile.parquet Now Converting: anothercsvfile.csv --> new/csvfile.parquet `

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用jdbc和jsp将数据插入mysql?   Oracle Java 7密钥工具无法将pkcs11密钥库导入JKS:非PKCS 8编码   java使用接口获取Todo id或JPA getOne方法速度更快   Java获得给定日期的下个月的第一天   java使用单个“更新”按钮将测试表的自动增量值插入分数表   BottomNavigationView下坐标布局上的java Fab按钮   java在安卓 OnPreferenceClickListener中调用非静态方法   java在MediaStore中在哪里可以找到图像的文件路径   java Spring boot 2.2 activemq jetty冲突   java集合值在所有列表变量中都得到更新   java如何在SpringMVC+maven项目中获取web上下文路径?   java不可变类:空白的最后字段可能未被初始化   在Android中实现ads的java程序?   java将数据库任务与spring petclinic应用程序分离   同一实体列上的java双向关联不能为null