将Pandas DataFrame中某列的唯一元素打印到文件
我刚接触pandas,搞不清楚怎么把pandas数据框里的元素打印到文件里。目前我有这个:
df.topic.to_csv("test.txt", encoding ='utf-8')
这个代码会把我数据框中topic这一列的所有元素都打印到文件里,但很多元素是重复的。
print df['topic'].unique()
这个代码能正确地在屏幕上打印出topic这一列的唯一元素。请问我怎么才能把这些唯一的元素打印到文件里呢?
谢谢
1 个回答
1
你用 pandas
标记了这个问题。那么,接下来可以这样做:
pd.DataFrame(df['topic'].unique()).to_csv(foo, bar)
不过,这样做会有一些额外的开销。如果你想把数据保存成易读的csv格式,可以看看 csv.writer。如果你只是想临时存储数据,还有其他选择,比如 shelve。最后,如果你也在使用numpy,可以看看 numpy.save。