为什么在pandas DataFrame中向量查找不生效，但在Series/日期查找中有效？

Question

对于：

import numpy as np

import pandas as pd

x = pd.DataFrame(np.random.randn(6),index=pd.date_range('2015-01-15','2015-01-20')

In [37]: x[datetime(2015,1,15)]
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-37-0ce45ca5a858> in <module>()
----> 1 x[datetime(2015,1,15)]

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/frame.pyc in __getitem__(self, key)
   1656             return self._getitem_multilevel(key)
   1657         else:
-> 1658             return self._getitem_column(key)
   1659 
   1660     def _getitem_column(self, key):

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/frame.pyc in _getitem_column(self, key)
   1663         # get column
   1664         if self.columns.is_unique:
-> 1665             return self._get_item_cache(key)
   1666 
   1667         # duplicate columns & possible reduce dimensionaility

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/generic.pyc in _get_item_cache(self, item)
   1003         res = cache.get(item)
   1004         if res is None:
-> 1005             values = self._data.get(item)
   1006             res = self._box_item_values(item, values)
   1007             cache[item] = res

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/internals.pyc in get(self, item)
   2871                 return self.get_for_nan_indexer(indexer)
   2872 
-> 2873             _, block = self._find_block(item)
   2874             return block.get(item)
   2875         else:

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/internals.pyc in _find_block(self, item)
   3183 
   3184     def _find_block(self, item):
-> 3185         self._check_have(item)
   3186         for i, block in enumerate(self.blocks):
   3187             if item in block:

/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/internals.pyc in _check_have(self, item)
   3190     def _check_have(self, item):
   3191         if item not in self.items:
-> 3192             raise KeyError('no item named %s' % com.pprint_thing(item))
   3193 
   3194     def reindex_axis(self, new_axis, indexer=None, method=None, axis=0,

KeyError: u'no item named 2015-01-15 00:00:00'

但是，

In [39]: x = pd.Series(np.random.randn(6),index=pd.date_range('2015-01-15','2015-01-20'))

查找是正确的：

In [40]: x[datetime(2015,1,15)]

Out[40]: -2.0727569075280319

有人能解释一下为什么在Series上查找可以正常工作，而在DataFrame上查找却不行吗？

这里是x：

In [41]: x
Out[41]: 
2015-01-15   -2.072757
2015-01-16   -0.682232
2015-01-17    1.681293
2015-01-18    2.151027
2015-01-19    0.493222
2015-01-20    0.538554
Freq: D, dtype: float64

数据处理 pandas dataframe series 向量查找

为什么在pandas DataFrame中向量查找不生效，但在Series/日期查找中有效？

1 个回答

撰写回答