字典键是dataframe中的列,值是列的特征类型

2024-05-16 05:12:25 发布

您现在位置:Python中文网/ 问答频道 /正文

编写一个函数,返回一个字典,其中键是数据框的列名,值是“numeric”、“categorical”、“ordinal”、“date/time”或“text”之一,对应于每列的特征类型。你知道吗

我可以将数据作为数据帧导入。然后我把df转换成了字典。然后我得到了作为列的键,但是在为每个列分配值(“数字”、“分类”、“序号”、“日期/时间”或“文本”)时遇到了问题。你知道吗

# Importing the pandas package
import pandas as pd

def helper(df):
    # Creating data frame from csv.gz File. Enter the appropriate file path
    cobra = pd.read_csv(df, compression='gzip')
    cobra_dict = cobra.to_dict()
    dict_keys = cobra.keys()

    print(dict_keys)


helper(df)
Expected Results:
In [1]: helper(df[['offense_id','beat','x','y']])
Out[1]: {'beat': 'categorical',
         'offense_id': 'ordinal',
         'x': 'numeric',
         'y': 'numeric'}

Tags: csvthe数据helperpandasdf字典keys
1条回答
网友
1楼 · 发布于 2024-05-16 05:12:25

IIUC公司

如果您希望与上面的输出完全相同,您可能需要创建一个映射dict,但这应该是可行的,我们可以将列和您的dtypes分为两个列表,并创建一个dict,其中列作为键,值作为数据类型。你知道吗

def helper(df):
    # Creating data frame from csv.gz File. Enter the appropriate file path
    cobra = pd.read_csv(df, compression='gzip')
    cobra_dict = dict(zip(cobra.columns.tolist(),cobra .dtypes.tolist()))

    print(cobra_dict)
在我自己的样品上。
print(my_dict)    
{'A': dtype('O'), 'B': dtype('int64'), 'C': dtype('float64')}

相关问题 更多 >