Pandas json_normalize产生令人困惑的“KeyError”消息？

from pandas.io.json import json_normalize json=[{"events": [{"schedule": {"date": "2015-08-27", "location": {"building": "BDC", "floor": 5}, "ID": 815}, "group": "A"}, {"schedule": {"date": "2015-08-27", "location": {"building": "BDC", "floor": 5}, "ID": 816}, "group": "A"}]}]

ID group schedule.date schedule.location.building schedule.location.floor '815' 'A' '2015-08-27' 'BDC' 5 '816' 'A' '2015-08-27' 'BDC' 5

In [2]: json_normalize(json[0],'events',[['schedule','date'],['schedule','location','building'],['schedule','location','floor']]) --------------------------------------------------------------------------- KeyError Traceback (most recent call last) <ipython-input-2-b588a9e3ef1d> in <module>() ----> 1 json_normalize(json[0],'events',[['schedule','date'],['schedule','location','building'],['schedule','location','floor']]) /Users/logan/Library/Enthought/Canopy_64bit/User/lib/python2.7/site-packages/pandas/io/json.pyc in json_normalize(data, record_path, meta, meta_prefix, record_prefix) 739 records.extend(recs) 740 --> 741 _recursive_extract(data, record_path, {}, level=0) 742 743 result = DataFrame(records) /Users/logan/Library/Enthought/Canopy_64bit/User/lib/python2.7/site-packages/pandas/io/json.pyc in _recursive_extract(data, path, seen_meta, level) 734 meta_val = seen_meta[key] 735 else: --> 736 meta_val = _pull_field(obj, val[level:]) 737 meta_vals[key].append(meta_val) 738 /Users/logan/Library/Enthought/Canopy_64bit/User/lib/python2.7/site-packages/pandas/io/json.pyc in _pull_field(js, spec) 674 if isinstance(spec, list): 675 for field in spec: --> 676 result = result[field] 677 else: 678 result = result[spec] KeyError: 'schedule'

3条回答

网友

1楼 · 编辑于 2024-05-26 06:20:50

在这种情况下，我想你应该用这个：

In [57]: json_normalize(data[0]['events'])
Out[57]: 
  group  schedule.ID schedule.date schedule.location.building  \
0     A          815    2015-08-27                        BDC   
1     A          816    2015-08-27                        BDC   

   schedule.location.floor  
0                        5  
1                        5

meta路径（[['schedule','date']...]）用于指定与记录处于相同嵌套级别的数据，即与“事件”处于相同级别。它看起来不像json_normalize处理带有嵌套列表的dict特别好，因此如果实际数据要复杂得多，您可能需要进行一些手动重塑。

网友

2楼 · 编辑于 2024-05-26 06:20:50

当json的结构不一致时，我得到了KeyError。也就是说，当json中缺少一个嵌套结构时，我得到了KeyError。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.json.json_normalize.html

从pandas文档站点上提到的示例中，如果您使其中一个记录上的嵌套标记（counties）丢失，则会得到一个KeyError。要避免这种情况，您可能必须确保忽略丢失的标记，或者只考虑使用数据填充的嵌套列/标记的记录。

网友

3楼 · 编辑于 2024-05-26 06:20:50

我也有同样的问题！这条线起了作用，尤其是降落伞py的答案。

我找到了一个解决方案，使用：

df.dropna(subset = *column(s) with nested data*)

然后将结果df保存为新的json。加载新的json，现在就可以展开嵌套的列了。

也许有更有效的方法来解决这个问题，但我的解决方案是有效的。

编辑：忘了提，我试着在json.normalize()中使用*errors = 'ignore'*参数，但没有帮助。

相关问题更多 >

编程相关推荐

热门问题

热门文章