将Python pandas数据帧行切片写入fi

2024-04-23 10:47:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含4列的CSV文件,第一列是case id(这是重复的)。在

========INPUT csv file=============
case_num, serial,binary,review
23,29983, 1, "lorem ipsum ,lorem ipsum"
23,298829, 1, "Hi there"
29, 20020, 0, "hickery dickery dock"
29,298829, 1, "Hello there"
29, 28220, 0, "dickery dock"

我试图根据唯一的案例ID数筛选所有行。在

^{pr2}$

输出:

[23 '29983' 1
 'lorem ipsum ,lorem ipsum'] #<type 'numpy.ndarray'>

[29 '20220' 0
 'hickery dickery dock']     #<type 'numpy.ndarray'>

正如您所看到的,输出是在不同的行中写出的,但我希望它们正确地作为一行,每行用逗号分隔。在

====期望输出=====

23, '29983', 1,  'lorem ipsum ,lorem ipsum'
29 ,'20220', 0,  'hickery dickery dock'

简单地说,如果我已经从数据帧(使用csv文件生成)中读取了一些行,那么如何将选定的行子集以相同的格式(就像输入csv文件一样)写入输出csv文件。在


Tags: 文件csvnumpyidinputtypetherecase
1条回答
网友
1楼 · 发布于 2024-04-23 10:47:40

你可以使用^{}

print df
   case id case_num no                        text
0       23  '29983'  1  'lorem ipsum ,lorem ipsum'
1       23  '29983'  1  'lorem ipsum ,lorem ipsum'
2       23  '29983'  1  'lorem ipsum ,lorem ipsum'
3       23  '29983'  1  'lorem ipsum ,lorem ipsum'
4       29  '20220'  0      'hickery dickery dock'

df = df.drop_duplicates(subset='case id')
print df
   case id case_num no                        text
0       23  '29983'  1  'lorem ipsum ,lorem ipsum'
4       29  '20220'  0      'hickery dickery dock'

^{}输出到csv:

^{pr2}$

相关问题 更多 >