如何将向量列序列化到文件并能够读取它b

2024-04-23 22:14:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧,一列,我想它存储的数字向量。我很容易做到。但是如果我想把它序列化成一个文件,然后把它取回,它会变得非常混乱

下面是一个与我的代码类似的代码片段

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=['vector', 'other_col'])
for _ in range(1,10):
    df.loc[len(df), 'vector'] = np.random.rand(2000)
df.to_csv('example.csv', index=False)

data = pd.read_csv('example.csv')

数据如下所示

                                              vector  other_col
0  [ 0.44182594  0.38653563  0.55276495 ...,  0.6...        NaN
1  [ 0.15619965  0.97775275  0.6904491  ...,  0.2...        NaN
2  [ 0.80848747  0.66653121  0.37620277 ...,  0.5...        NaN
3  [ 0.41350165  0.40033263  0.39881338 ...,  0.3...        NaN
4  [ 0.17602205  0.54945447  0.49621991 ...,  0.6...        NaN
5  [ 0.75765499  0.09553434  0.14637461 ...,  0.2...        NaN

如您所见,存储到文件中的不是向量,而是实际的字符串,如果您试图打印数据帧的内容,您将在标准输出中看到该字符串

我有一些解决办法,我只是好奇是否有这个特定的解决方案是可行的


Tags: 文件csv数据代码importdfexampleas