我有一个csv,其中每一行是一个字典,在每一行的dict中,有一个列表,这个列表包含一个子列表和一个子列表。每个子列表有2个元素,子列表有100个键,每个键有一个值。这是数据截图:
以下是文本格式的数据示例:
{"0": [[10.8, 36.0], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"1": [[10.8, 36.1], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"2": [[10.8, 36.2], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"3": [[10.8, 36.300000000000004], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"4": [[10.8, 36.4], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"5": [[10.8, 36.5], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"6": [[10.8, 36.6], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"7": [[10.8, 36.7], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0, "10": 0}]}
{"8": [[10.8, 36.800000000000004], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0}]}
{"9": [[10.8, 36.9], {"0": 0, "1": 0, "2": 0, "3": 0, "4": 0, "5": 0, "6": 0, "7": 0, "8": 0, "9": 0}]}
我想做的是将其读入一个pandas数据帧,该数据帧将产生这样的预期输出(为了简单起见,我只键入一行):
list_elemnt_1 list_elemnt_2 key_0, key_1, key_2, key_3, key_4, and so on...
value value value value value value value and so on...
对于csv中的每一行,我想构建一个dataframe,每个子列表值(2)有一列,该行dict中包含的子目录中的每个键有一列
我怎么能这么做??如果需要,请随时询问更多信息。你知道吗
事先非常感谢
编辑
按键0、按键1、按键2等。。。是子目录键,不是主目录键
不是最好的办法。你知道吗
这将为您提供每行的
df
,作为list_of_dfs
中的一个行元素,我假设这是目标? 让我知道它是否有效。你知道吗我同意@furas这看起来很像一个JSON,如果这个数据是从某人那里得到的,你最好问问他们是否可以用JSON格式发送给你。你知道吗
如果没有,上面的代码就起作用了。你知道吗
打开文件。
阅读每一行并将其存储为一个列表。
ast.literal_eval
允许Python从一开始就识别出它是一个字典,并将它们存储为dict
对象。我创建了一个helper
clean_lines
函数。干净的线是更重要的部分。你知道吗l1
和l2
key_X
的规格) d、 将l1和l2作为条目添加到字典中,基本上将子列表和子列表合并到一个字典中一旦有了字典列表,pandas就能够识别它,并且可以将它插入到
pd.DataFrame
实例化器对象中相关问题 更多 >
编程相关推荐