我有这个数据帧:
d = {'city':['Barcelona','Madrid','Rome','Torino','London','Liverpool','Manchester','Paris'],
'country': ['ES','ES','IT','IT','UK','UK','UK','FR'],
'revenue': [1,2,3,4,5,6,7,8],
'amount': [8,7,6,5,4,3,2,1]
df = pd.DataFrame(d)
我想为每个国家获得:
españa = {'city':['Barcelona','Madrid']
'revenue':[1,2]
'amount':[8,7]}
ES = pd.DataFrame(españa)
因此,在最后我将有4个数据帧命名为ES,IT,UK和FR
我已经试过了:
a = set(df.loc[:]["country"])
for country in a:
country = df.loc[(df["country"]== country),['date','sum']]
但这只给了我一个数据帧和一个值。你知道吗
Country是一个被重写的迭代器变量。你知道吗
要生成4个不同的数据帧,请尝试使用生成器函数。你知道吗
def country_df_generator(data): for country in data['country']unique(): yield df.loc[(df["country"]== country), ['date','sum']] countries = country_df_generator(data)
您可以将字典理解与
groupby
一起使用:循环提供了所有四个数据帧,但您将前三个数据帧扔进了垃圾箱。你知道吗
使用变量
country
遍历a
,然后在下一个语句country = ...
中销毁该值。然后返回循环的顶部,将country
重置为下一个两个字母的缩写,并在所有四个国家中继续此冲突。你知道吗如果需要四个数据帧,则需要将每个数据帧放在单独的位置。例如:
现在您有了一个包含四个数据帧的字典,每个数据帧按其国家代码编制索引。 有帮助吗?你知道吗
相关问题 更多 >
编程相关推荐