我有一个数据帧,一列,我想它存储的数字向量。我很容易做到。但是如果我想把它序列化成一个文件,然后把它取回,它会变得非常混乱
下面是一个与我的代码类似的代码片段
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=['vector', 'other_col'])
for _ in range(1,10):
df.loc[len(df), 'vector'] = np.random.rand(2000)
df.to_csv('example.csv', index=False)
data = pd.read_csv('example.csv')
数据如下所示
vector other_col
0 [ 0.44182594 0.38653563 0.55276495 ..., 0.6... NaN
1 [ 0.15619965 0.97775275 0.6904491 ..., 0.2... NaN
2 [ 0.80848747 0.66653121 0.37620277 ..., 0.5... NaN
3 [ 0.41350165 0.40033263 0.39881338 ..., 0.3... NaN
4 [ 0.17602205 0.54945447 0.49621991 ..., 0.6... NaN
5 [ 0.75765499 0.09553434 0.14637461 ..., 0.2... NaN
如您所见,存储到文件中的不是向量,而是实际的字符串,如果您试图打印数据帧的内容,您将在标准输出中看到该字符串
我有一些解决办法,我只是好奇是否有这个特定的解决方案是可行的
目前没有回答
相关问题 更多 >
编程相关推荐