我想把一个稀疏矩阵(156060x11780)转换成数据帧,但是我得到了一个内存错误这是我的代码
vect = TfidfVectorizer(sublinear_tf=True, analyzer='word',
stop_words='english' , tokenizer=tokenize,
strip_accents = 'ascii')
X = vect.fit_transform(df.pop('Phrase')).toarray()
for i, col in enumerate(vect.get_feature_names()):
df[col] = X[:, i]
我在X = vect.fit_transform(df.pop('Phrase')).toarray()
中遇到问题。我该怎么解决呢?在
试试这个:
更新:对于Pandas 0.20+我们可以直接从稀疏数组构造
^{pr2}$SparseDataFrame
:相关问题 更多 >
编程相关推荐