如何在Pandas中创建SparseDataFrame?

4 投票
1 回答
827 浏览
提问于 2025-04-18 17:37

在编程中,有时候我们需要让程序做一些事情,比如计算、显示信息或者处理数据。为了实现这些功能,我们会用到一些代码块,这些代码块就像是程序的“指令”,告诉计算机该怎么做。

在这个例子中,

pandas.DataFrame(a)
Out[41]: 
   1   2   3
0  1   2 NaN
1  1 NaN   3

a = [{1:1.0,2:2.0}, {1:1.0,3:3.0}]

pandas.DataFrame(a)
Out[43]: 
   1   2   3
0  1   2 NaN
1  1 NaN   3

pandas.SparseDataFrame(a)
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-44-50288c1b1994> in <module>()
----> 1 pandas.SparseDataFrame(a)

/Library/Python/2.7/site-packages/pandas/sparse/frame.pyc in __init__(self, data, index, columns, default_kind, default_fill_value)
     94             sdict, columns, index = self._init_dict(data, index, columns)
     95         elif isinstance(data, (np.ndarray, list)):
---> 96             sdict, columns, index = self._init_matrix(data, index, columns)
     97         elif isinstance(data, DataFrame):
     98             sdict, columns, index = self._init_dict(data, data.index,

/Library/Python/2.7/site-packages/pandas/sparse/frame.pyc in _init_matrix(self, data, index, columns, dtype)
    203 
    204         data = dict([(idx, data[:, i]) for i, idx in enumerate(columns)])
--> 205         return self._init_dict(data, index, columns, dtype)
    206 
    207     def __array_wrap__(self, result):

/Library/Python/2.7/site-packages/pandas/sparse/frame.pyc in _init_dict(self, data, index, columns, dtype)
    174                     v = [v.get(i, nan) for i in index]
    175 
--> 176                 v = sp_maker(v)
    177             sdict[k] = v
    178 

/Library/Python/2.7/site-packages/pandas/sparse/frame.pyc in <lambda>(x)
    159                                           kind=self.default_kind,
    160                                           fill_value=self.default_fill_value,
--> 161                                           copy=True)
    162 
    163         sdict = {}

/Library/Python/2.7/site-packages/pandas/sparse/series.pyc in __new__(cls, data, index, sparse_index, kind, fill_value, name, copy)
    127             if sparse_index is None:
    128                 values, sparse_index = make_sparse(data, kind=kind,
--> 129                                                    fill_value=fill_value)
    130             else:
    131                 values = data

/Library/Python/2.7/site-packages/pandas/sparse/array.pyc in make_sparse(arr, kind, fill_value)
    426 
    427     if np.isnan(fill_value):
--> 428         mask = -np.isnan(arr)
    429     else:
    430         mask = arr != fill_value

TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule 'safe'
就是一个代码块的占位符,里面会放一些具体的代码。代码的内容可能会涉及到变量、函数或者其他编程概念,但具体的内容在这里没有给出。

总之,代码块是编程中非常重要的部分,它们帮助我们把想法变成实际的操作,让计算机能够理解并执行我们的指令。

1 个回答

2

pandas 版本 >= 1.0

在这个版本中,SparseDataFrameSparseSeries 被从API中移除了,因为现在pandas支持了扩展类型

现在可以使用SparseArray这个扩展类型来声明稀疏列。

之前的写法

pd.SparseDataFrame({"A": [0, 1]})

新的写法 [✓]

pd.DataFrame({"A": pd.arrays.SparseArray([0, 1])})

   A
0  0
1  1

撰写回答