我需要为文本数据集提取单词嵌入。由于Elmo需要花费大量的时间来处理一个庞大的数据集,因此我尝试通过将其划分为批并将值存储在CSV文件中来并行化该过程。现在我有了一个数据帧,它由大约1024列组成,其中包含单词embeddings
数据帧示例:
我需要做的是将值按行组合到一列中,这需要是一个Numpy数组而不是一个列表。
这就是我需要它的样子:
第4列中的值必须是NumPy数组类型
到目前为止,我所尝试的:
np.array(DF.iloc[:,0:1023].values.tolist())
但这会引发以下错误:
ValueError: Wrong number of items passed 1023, placement implies 1
我该怎么做?任何建议都会有帮助。提前谢谢
用
to_numpy
在轴1上尝试apply
:df
:您已接近,转换为numpy数组后需要
.tolist()
:对于您的数据:
您可以使用
apply()
方法和array()
方法:df
的输出:相关问题 更多 >
编程相关推荐