我有一个csv文件,其中有数千个条目需要分组。在下面的示例中,我需要根据River名称将每一行分成多个组,以便以后可以根据它们的组重新格式化信息。
River Name, Branch, Length
Catnip, 1, 2145.30
Peterson, 2, 24.5
Catnip, 3, 15.4
Fergerson, 1, 5.2
Catnip, 1, 88.56
Peterson, 2, 6.45
我唯一能想到的信息分组方法是:
我不认为这是一个有效的方法来实现这一点,因为它给了我大约1500个csv,将需要开放和编写,但我在我的python知识的极限。如果有人能提供更好的方法,我们将不胜感激。
python pandas可以处理csv数据集。我没有做过任何相关的事情,但最好先检查一下熊猫。
http://pandas.pydata.org/pandas-docs/stable/
您可以使用pandas库。 用逗号分隔符读取csv文件
Df是pandas中的dataframe,用于操作导入的csv文件。
pandas会自动将csv文件分区为列/行。 您只需使用
df['River Name']
访问River Name列。您还可以简单地使用
csv
模块并将结果保存到字典中。我列举了读者跳过第一行(我相信一定有更简单的方法…)。然后读取每一行并将值赋给river
、branch
和length
。如果river不在字典中,那么它用空列表初始化它。然后将branch
和length
的元组对附加到字典中。相关问题 更多 >
编程相关推荐