数据处理和转换库。

datamonke的Python项目详细描述


![pypi-python版本](https://img.shields.io/pypi/pyversions/datamonkey.svg)
![PYPI-许可证](https://img.shields.io/PYPI/L/datamonkey.svg?颜色=绿色)
![pypi](https://img.shields.io/pypi/v/datamonkey.svg?color=orange&;label=version)


数据猴子
==

**易于使用的文件转换库**

--




**数据猴子**是一个python文件转换库,旨在减轻操作数据的压力。它为**验证
数据完整性**和**将文件修改为所需的格式**提供了强大的工具。
一旦您创建了一个文件temp稍后,在本地开始处理文件很简单。

data monkey当前支持以下文件格式:
1。CSV<BR/> 2。excel
3.固定宽度文本文件(也称为平面文件)
4。json(具有扁平的、非嵌套的数据结构)

查看功能文档[文档](https://docs.data-monkey.com/)了解更多详细信息。

Data Monkey允许您可靠地将数据操作为所需的内容;无论您是将CSV文件转换为JSON还是从API响应生成Excel报告,Data Monkey都为您提供了帮助。
-一种无代码、基于配置的方法--使用我们的[Web应用程序](https://app.data-mon(key.com)以便根据需要快速更新文件模板。更改生成的文件类型、过滤掉不必要的结果、合并和转换数据等等都很简单。
-在数据中发现与预期不符的意外"惊喜"令人沮丧,这就是为什么数据验证是数据管理的核心功能OnKEY。配置任意数量的数据验证,这些验证将在出现问题时向您发出警报。
-Data Monkey在转换大文件时提供按播放进度跟踪,以便让您确切地知道进程中的位置。


ey)。

最新发布版本的二进制安装程序可在[python
包索引](https://pypi.org/project/datamonkey)中找到。

```python
如果你还没有可用的话。此外,请查看可选的依赖项;如果您正在使用Excel文件,或正在将文件写入/读取到S3,则可能需要这些依赖项。

\usage&;examples

处理任何文件的第一步是在[Data Monkey Web应用程序](https)上创建文件模板://app.data monkey.com)。
文件模板是一种基于配置的方法,用于精确定义文件的转换方式,例如所需的文件类型、传出数据字段以及对数据本身的任何自定义验证器或修改。
您可以查看有关创建文件项的指南Plates[此处](https://documentation.data monkey.com)。

ate key(在data monkey.com上生成)
process or=fileprocessor(您的模板密钥)
包含任何问题的详细信息。



配置

如果您希望使用模板的本地版本(可在文件模板的摘要屏幕上下载),
您可以使用模板文件的位置初始化"file processor":

``python
from datamonkey import fileprocessor
processor=fileprocessor(您的y,template_file_path="path/to/file")
```


这将允许您完全脱机处理文件,或在具有有限网络访问权限的安全环境中处理文件。


生成的输出文件
2。错误和警告文件

``python
来自data monkey import file processor
processor=fileprocessor(您的密钥)
processor.process("path/to/input",output_file="path/to/output",error_file="path/to/error")
```

aws s3上的文件fs``在amazon web服务的s3上读写文件。要访问s3,请将文件路径替换为s3 bucket位置:

``python
from datamonkey import file processor
processor=fileprocessor(您的密钥)
processor.process("s3://bucket-name/input-file-name",output-file-path=""s3://bucket-name/output-file-name",error-file-path="s3:"//bucket_name/error_file_name")
```


注意:您必须具有本地配置的aws凭据,可以对要使用的bucket进行读/写访问。有关更多帮助,请参阅[AWS文档](https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-configure.html)。

\a name="dependencies">;<;/a>;dependencies

Data Monkey需要以下库才能正常工作:

-[numpy](https://www.numpy.org):1.14.5或更高版本
-[熊猫](https://labix.org/python dateutil):0.23.1或更高版本
-[请求](https://pythonhosted.org/pytz):2.19.1或更高版本
-[ujson](https://pythonhosted.org/pytz):1.35.0或更高版本

n Web服务S3:
-[s3fs](https://www.numpy.org):0.1.5或更高版本

如果使用Excel文件,则需要这些依赖项:
-[xlrd](https://labix.org/python dateutil):1.1.0或更高版本
-[xlsxwriter](https://labix.org/python dateutil):1.1.1或更高版本


nse
[mit](https://github.com/datamonkeyhq/data monkey/blob/master/license)

/>其他文档
官方文档位于https://docs.data monkey.com/。它有几个有用的指南,例如如何创建文件模板,以及一个附录,其中包含了可以对数据执行的各种操作的信息。

o按特定要求处理。"数据猴子"项目于2018年启动,目前正在开发中。我们希望您对您希望看到的功能或应支持的文件格式提供反馈,请通过feedback@data-monkey.com通知我们!

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在一个问题被连续正确回答三次/并添加差异后,我如何将程序循环回开始   Java中未实例化的匿名类   java如何在Android中录制视频,只允许横向模式和最长时间录制时间   java从另一个活动发送实时消息   多线程java线程和互斥   java禁用Spring安全日志   JAVA伊奥。StreamCorruptedException:在与子级和父级ProcessBuilder通信时写入子级中的标准输出时,流头无效   使用Java(HttpURLConnection)对Restheart进行身份验证(对于Mongodb)   java如何解决Jenkins中的SAXParseException?   java为什么我需要mockito来测试Spring应用程序?   计算sin-cos和tan时缺乏精度(java)   java Hibernate。不同项目中相同一对一映射的不同行为   java图像滑块:如何使用JavaFX将图像放在另一个图像上   java Mockito在使用when时抛出NotAMockException   http Java servlet发送回响应