回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个样本数据集:</p>
<pre><code>import pandas as pd
df = {'ID': ['H1','H2','H3','H4','H5','H6'],
'AA1': ['C','B','B','X','G','G'],
'AA2': ['W','K','K','A','B','B'],
'name':['n1','n2','n3','n4','n5','n6']
}
df = pd.DataFrame(df)
</code></pre>
<p>看起来像:</p>
<pre><code>df
Out[32]:
AA1 AA2 ID name
0 C W H1 n1
1 B K H2 n2
2 B K H3 n3
3 X A H4 n4
4 G B H5 n5
5 G B H6 n6
</code></pre>
<p>我想按AA1和AA2(唯一的AA1和AA2对)分组,唯一的一对选择的ID和name值与此无关,并将其输出到一个.csv文件中,因此.csv文件中的输出将如下所示:</p>
<pre><code> AA1 AA2 ID name
C W H1 n1
B K H2 n2
X A H4 n4
G B H5 n5
</code></pre>
<p>我试过密码:</p>
<pre><code>df.groupby('AA1','AA2').apply(to_csv('merged.txt', sep = '\t', index=False))
</code></pre>
<p>但是无法识别to-csv,我可以在.apply()中放入什么来将groupby结果输出到csv文件?</p>