将Pandas DataFrame中某列的唯一元素打印到文件

0 投票
1 回答
1249 浏览
提问于 2025-04-18 06:32

我刚接触pandas,搞不清楚怎么把pandas数据框里的元素打印到文件里。目前我有这个:

df.topic.to_csv("test.txt", encoding ='utf-8')

这个代码会把我数据框中topic这一列的所有元素都打印到文件里,但很多元素是重复的。

print df['topic'].unique()

这个代码能正确地在屏幕上打印出topic这一列的唯一元素。请问我怎么才能把这些唯一的元素打印到文件里呢?

谢谢

1 个回答

1

你用 pandas 标记了这个问题。那么,接下来可以这样做:

pd.DataFrame(df['topic'].unique()).to_csv(foo, bar)

不过,这样做会有一些额外的开销。如果你想把数据保存成易读的csv格式,可以看看 csv.writer。如果你只是想临时存储数据,还有其他选择,比如 shelve。最后,如果你也在使用numpy,可以看看 numpy.save

撰写回答