Pandas数据框浮点索引和转置错误

Question

我正在尝试将一个用空格分隔的数据文件正确导入到pandas的数据框中，这样我才能正确地绘制图表。我的数据文件长这样：

Vmeas   -5.00E+000  -4.50E+000  -4.00E+000  -3.50E+000 ...
vfd3051 -3.20E-008  -1.49E-009  1.38E-008   -1.17E-008 ...
vfd3151 -3.71E-008  -6.58E-009  -6.58E-009  -6.58E-009 ...
vfd3251 -4.73E-008  3.59E-009   8.68E-009   -1.68E-008 ...
vfd3351 -2.18E-008  -3.71E-008  3.60E-009   -3.20E-008 ...

所以测试位置最开始是在行中，列的电压从左到右增加，直到20V。

我用来读取数据文件到数据框的代码是：

if __name__ == '__main__':
    file_path = str(input("Enter the filename to open:  "))
    save = str(input('Do you wish to save a pdf of the IV plots? (y/n): '))
    df = pd.read_csv(file_path, index_col="Vmeas", delim_whitespace=True, header=0)
    df = df.T
    df.reset_index(inplace=True)
    df.index.names = ['Voltage']
    df.columns.names = ['Die_numbers']
    df.drop('index',axis=1, inplace=True)
    make_plots(df, save)

实际绘图的代码是：

def make_plots(df, save):
    voltage = np.arange(-5, 20, 0.5)
    plt.figure(figsize=(10, 7))
    for col in df:
        plt.plot(voltage, col, legend=False)
    plt.show()

一开始，我遇到的问题是pandas把电压当成了字符串，而pandas对浮点数索引不太友好。最开始尝试的时候，我的二极管电流-电压关系图从0开始绘制。(https://i.stack.imgur.com/i2XOY.jpg) 然后，我重新设置了索引，但绘图还是不行。现在，我重新设置了数据框的索引，删除了旧的索引列，当我检查df.head()时，一切看起来都正常：

Die_numbers       vfd3051       vfd3151           vfd3251          vfd3351  
Voltage                                                               
0                -3.202241e-08 -3.711351e-08 -4.728576e-08 -2.184733e-08   
1                -1.493095e-09 -6.580329e-09  3.594383e-09 -3.710431e-08   
2                 1.377107e-08 -6.581644e-09  8.683344e-09  3.595368e-09

但现在我在mpl中不断遇到ValueError。我觉得这和列的值是字符串而不是浮点数有关，我不明白为什么，因为之前电流打印得很好。

老实说，我对pandas还很陌生，但似乎每次我都被自己的无知阻碍，真让人疲惫。有没有更好的方法？也许我应该忽略日志文件的第一行？在读取文件时能否转换科学计数法？继续努力吗？

谢谢。

df.info()的结果是：

Int64Index: 51 entries, 0 to 50
Columns: 1092 entries, vfd3051 to vfd6824
dtypes: float64(1092)

一切似乎都正确加载到pandas中，但mpl对数据中的某些东西不满意。列是浮点数，我没有使用整数索引。如果列名被当作第一行添加，列就会被当作字符串或对象类型。错误是：

 Traceback (most recent call last):
  File "D:\Python\el_plot_top_10\IV_plot_all.py", line 51, in <module>
    make_plots(df, save)
  File "D:\Python\el_plot_top_10\IV_plot_all.py", line 21, in make_plots
    plt.plot(voltage, col, legend=False)
  File "C:\Anaconda3\lib\site-packages\matplotlib\pyplot.py", line 2987, in plot
    ret = ax.plot(*args, **kwargs)
  File "C:\Anaconda3\lib\site-packages\matplotlib\axes.py", line 4139, in plot
    for line in self._get_lines(*args, **kwargs):
  File "C:\Anaconda3\lib\site-packages\matplotlib\axes.py", line 319, in _grab_next_args
    for seg in self._plot_args(remaining, kwargs):
  File "C:\Anaconda3\lib\site-packages\matplotlib\axes.py", line 278, in _plot_args
    linestyle, marker, color = _process_plot_format(tup[-1])
  File "C:\Anaconda3\lib\site-packages\matplotlib\axes.py", line 131, in _process_plot_format
    'Unrecognized character %c in format string' % c)
ValueError: Unrecognized character f in format string

错误处理浮点数数据类型索引数据导入数据框绘图科学计数法

Pandas数据框浮点索引和转置错误

2 个回答

撰写回答