我正在从csv文件导入数据,我想将列“topThemes”拆分为一个包含两列的数组/数据框。
在第一列中,我想知道主题的名称(例如生物学),在第二列中,我想知道它的相关分数(例如62)。
导入列时,它以以下格式存储:
Biology: 62\n
Economics: 12\n
Physics: 4\n
Chemistry: 8\n
and so on.
我的当前代码和错误如下所示。
代码:
df = pd.read_csv(r'myfilelocation')
split = [line.split(': ') for line in df['topThemes'].split('\n')]
错误:
AttributeError("'Series' object has no attribute 'split'")
正在导入的CSV文件:
我希望它看起来怎么样:
感谢您的帮助/回复
指定要与
sep
一起使用的分隔符,以及与read_csv()
函数的names
一起使用的列名:此处的文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
哦,我现在看到了您的源CSV文件…
可能有一种更简洁的方法可以用更少的步骤完成这项工作,但我认为这会产生您所请求的输出:
相关问题 更多 >
编程相关推荐