数据帧功能的简单实现
ie-pandas的Python项目详细描述
IE熊猫
这是c团队在高级python中的最后一个项目。
数据帧功能的简单实现
库位于Pypi
安装
安装ie熊猫最简单的方法是通过pip
pipinstallie_pandas
要在项目中使用它,必须首先导入库
fromie_pandasimportDataframe
您可以通过以下4种方法创建帧:
- 列表列表
- 列表的numpy数组
- 一个列表字典,其中键是列名,值是该列的值
- numpy数组字典(与列表相同)
dictionary={'c0':[1,3,5],'c1':[7,6,2],'c2':[2,4,7],'c3':[5,3,9]}df=DataFrame(dictionary)
功能性
- 从列表列表、numpy数组、列表字典和numpy数组中创建数据帧
dictionary={'c0':[1,3,5],'c1':[7,6,2],'c2':[2,4,7],'c3':[5,3,9]}df=DataFrame(dictionary)# You may optionally pass along two parameters, cols and index# cols determines the column names (if blank they will be numerical strings)# index determines the row names (if blank they will be numbers)df=DataFrame(dictionary,cols=["col0","col1","col2","col3"],index=["row1","row2","row3"])
- 按名称访问列
df['column_1']
- 按位置或行名称访问行
df.get_index(1)# ordf.get_index('row_1')
- 按名称访问数据,如numpy数组
df[0:2,1:3]
- 修改数据框
df[0,0]=3
- sum,median,mean,min,max方法(仅适用于数值列)
df.mean()
由于dataframe的底层对象是一个numpy数组,您可以执行诸如
df[:,1:2].sum()
- 可视化两个完全数值列之间的关系(仅限数值列)
df.visualize(df[:,2],df[:,3])# ordf.visualize(df["c1"],df["c2"])
依赖关系
IE熊猫只需要以下软件包:
- 纽比(>;=1.16)
- matplotlib(>;=3.0.2)
但是,出于开发目的,需要以下软件包:
- Pytest(>;=4.2)
- pytest cov(>;=2.6)
- 黑色(符合PEP8)
发展
出于开发目的,您可以直接下载文件,并将终端放在下载的文件夹中,然后在本地安装库
pipinstall--editable.[dev]
然后,执行您只需运行的测试
pytest--cov
ie_pandas编码风格
ie_pandas符合pep8,并使用black
作为编码标准
版本控制
SemVer用于版本控制。
许可证
这个项目是在麻省理工学院的许可下授权的-详细信息请参见License文件