使您的数据更加生动的工具。

datajazz的Python项目详细描述


数据爵士

使您的数据更加生动的工具。

datajazz是一个用于操作和优化数据以进行分析、机器学习、提取、转换和加载(etl)的工具包。

贡献

datajazz是一个开源项目,它是为了更好地服务于数据科学和机器学习社区而创建和维护的。请随时提交拉动请求,为项目作出贡献。通过参与,您将遵守datajazz的code of conduct

安装

pip install datajazz

示例用法

创建具有不同数据类型的数据帧

import pandas as pd
import numpy as np

rng = pd.date_range('2015-02-24', periods=5, freq='20H')
df = pd.DataFrame({ 'Start_Time': rng, 'Values': np.random.randn(len(rng)), 'Categories': ['A']*len(rng) }) 
df.head()

创建时间特性

import datajazz as dj
df = dj.timeoftime(df)

一个热编码分类列

import datajazz as dj
df = dj.onehot_categories(df)

删除多余的行和列

import datajazz as dj
df = dj.remove_redundancies(df)

更多的用例即将到来!提交请求以添加新用例。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
线程“main”java中的socket异常。网SocketException:在java上重置连接。木卫一。缓冲读取器。读线(未知源)   java原子参考   如何使用Java以编程方式确定两个XML文件(如XPATH)之间的差异?   java使用ApachePOI从存在于不同行中的两列中提取公共值   java在JavaFX中使用WebView会破坏Linux上的UI   Java中for循环中的If语句   Java中Hilberts空间填充曲线算法   由于出现错误,使用Reformation2下载的java文件停止工作   java是否可以通过编程方式控制setjaxbvalidationeventhandler?   没有Eclipse GUI的java Eclipse RCP应用程序   多线程在Java中使用线程安全集合时,处理并发问题的最佳方法是什么?   swing Java LWJGL和JOptionPane   java JPA:设置@JoinColumn(updateable=false)以避免OptimisticLockException   java GL VertexBuffer无效操作   java在Swing中实现后退/前进按钮   java在同一个JTable上创建两个表   类文件中的java不兼容魔术值1008813135   在Java中使用“@”的c#文字字符串?