Python中文
首页
教程
问答
标签
搜索
登录
注册
如何对CSV文件中的多个列进行分组和求和?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我还是python和pandas的新手,目前正在尝试获取CSV文件中多个列的总和</p> <p>我有一个CSV文件,其中包含要求和的列<code>unitCount</code>、<code>orderCount</code>、<code>invoiceCount</code>:</p> <pre><code> date id name unitCount orderCount invoiceCount 2020-02-12 1 Guitar 200 100 200 2020-02-12 2 Drums 300 200 100 2020-02-12 3 Piano 400 700 300 2020-02-11 1 Guitar 100 500 300 2020-02-11 2 Drums 200 400 400 2020-02-11 3 Piano 300 300 100 </code></pre> <p>我想要的输出是一个CSV文件,包含最后3列的总和(按<code>ID</code>分组),并且仅链接到最新日期:</p> <pre><code> date id name total_unitCount total_orderCount total_invoiceCount 2020-02-12 1 Guitar 300 600 500 2020-02-12 2 Drums 500 600 500 2020-02-12 3 Piano 700 1000 400 </code></pre> <p>有人能帮忙吗</p> <p>到目前为止,我正在尝试下面的方法,但它对我不起作用。是否可以将<code>groupby</code>添加到下面代码的第一行?还是我一开始就完全错了?谢谢</p> <pre><code>df = pd.read_csv(r'path/to/myfile.csv', sep=';').sum() df.to_csv(r'path/to/myfile_sum.csv') </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用一些手动<code>agg</code>:</p> <pre><code>(df.groupby('id', as_index=False) .agg({'date':'max', 'name':'first', 'unitCount':'sum', 'orderCount':'sum', 'invoiceCount':'sum'}) .to_csv('file.csv') ) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Django:。是不是“超级用户”字段不起作用
2 回答
Django:'DeleteQuery'对象没有属性'add'
7 回答
Django:'ModelForm'对象没有属性
6 回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len()
8 回答
Django:'Python管理.pysyncdb'不创建我的架构表
9 回答
Django:'Python管理.py迁移“耗时数小时(和其他奇怪的行为)
9 回答
Django:'readonly'属性在我的ModelForm上不起作用
7 回答
Django:'RegisterEmployeeView'对象没有属性'object'
4 回答
Django:'str'对象没有属性'get'
8 回答
Django:'创建' 不能被指定为Order模型表单中的值,因为它是一个不可编辑的字段
7 回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
7 回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9:无效的连续字节”,加载临时文件时
9 回答
Django:“<…>”需要有一个字段“id”的值,然后才能使用这个manytomy关系
9 回答
Django:“AnonymousUser”对象没有“get_full_name”属性
9 回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3:序号不在范围内(128)
9 回答
Django:“BaseTable”对象不支持索引
5 回答
Django:“collections.OrderedDict”对象不可调用
3 回答
Django:“Country”对象没有属性“all”
10 回答
Django:“Data”对象没有属性“save”
4 回答
Django:“datetime”类型的对象不是JSON serializab
10 回答