如何创建在集合上迭代的数据帧？

d = {'city':['Barcelona','Madrid','Rome','Torino','London','Liverpool','Manchester','Paris'], 'country': ['ES','ES','IT','IT','UK','UK','UK','FR'], 'revenue': [1,2,3,4,5,6,7,8], 'amount': [8,7,6,5,4,3,2,1] df = pd.DataFrame(d)

3条回答

网友

1楼 · 编辑于 2024-06-07 13:39:19

Country是一个被重写的迭代器变量。你知道吗

要生成4个不同的数据帧，请尝试使用生成器函数。你知道吗

def country_df_generator(data): for country in data['country']unique(): yield df.loc[(df["country"]== country), ['date','sum']] countries = country_df_generator(data)

网友

2楼 · 编辑于 2024-06-07 13:39:19

您可以将字典理解与groupby一起使用：

res = {k: v.drop('country', 1) for k, v in df.groupby('country')}

print(res)

{'ES':    amount       city  revenue
       0       8  Barcelona        1
       1       7     Madrid        2,
 'FR':    amount   city  revenue
       7       1  Paris        8,
 'IT':    amount    city  revenue
       2       6    Rome        3
       3       5  Torino        4,
 'UK':    amount        city  revenue
       4       4      London        5
       5       3   Liverpool        6
       6       2  Manchester        7}

网友

3楼 · 编辑于 2024-06-07 13:39:19

循环提供了所有四个数据帧，但您将前三个数据帧扔进了垃圾箱。你知道吗

使用变量country遍历a，然后在下一个语句country = ...中销毁该值。然后返回循环的顶部，将country重置为下一个两个字母的缩写，并在所有四个国家中继续此冲突。你知道吗

如果需要四个数据帧，则需要将每个数据帧放在单独的位置。例如：

a = set(df.loc[:]["country"])
df_dict = {}

for country in a:
    df_dict[country] = df.loc[(df["country"]== country),['date','sum']]

现在您有了一个包含四个数据帧的字典，每个数据帧按其国家代码编制索引。有帮助吗？你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章