我有以下数据集: 名为:2、3、4…9的列中填充了相互重叠的主题名称。Pageviews是一个结果变量。你知道吗
2 3 Pageviews
0 Financial Services Consumer Products 4106.0
1 Consumer Products ... 3368.0
2 Consumer Products ... 1025.0
3 Collaboration ... 7840.0
4 Future of Supply Chains ... 2076.0
我想将每个主题列(2,3,4,…)与Pageviews
一起切片并附加它们,以便只创建一个包含1个主题列和Pageviews
的数据帧。你知道吗
我习惯于在Stata中循环,您可以使用x
循环列的名称,但我知道这与Pyhton完全不同。你知道吗
我从
for x in range(2, 9):
df_x = df[['Pageviews', df.x]]
但是Python不识别df.x
如何循环浏览列名?是否可以使用迭代器来创建新的数据帧?你知道吗
谢谢!你知道吗
编辑
我想要的输出是
Col Pageviews
0 Financial Services 4106.0
1 Consumer Products 3368.0
2 Consumer Products 1025.0
3 Collaboration 7840.0
4 Future of Supply Chains 2076.0
5 Future of Reporting 2123.0
6 Sustainability Management 15576.0
7 Human Rights 52.0
8 BSR News 903.0
9 Energy and Extractives 1232.0
10 HERproject 616.0
11 Sustainability Management 10697.0
其中col是附加第2、3、4列的结果。。。Pageviews是附加相应Pageviews列的结果。。你知道吗
我认为您正在寻找某种^{} 方法,而不是迭代(通常,在处理数据帧时,迭代是最后的手段,因为通常有矢量化方法来实现大多数数据重组任务)。你知道吗
以数据帧为例:
您可以执行以下操作:
使用
melt
相关问题 更多 >
编程相关推荐