使用生成模型的libsvm预测问题
我有一个关于libsvm预测准确率的问题。我是用easy.py生成了一个svm模型文件。现在,当我在Python中尝试程序化地预测测试向量时,结果显示的标签全都是1,而用easy.py得到的准确率是91%。
我的测试和训练数据的每一行格式如下:
1 1:255 2:246 3:218 4:198 5:186 6:168 7:177 8:218 9:255 10:255 11:255 12:255 13:255 14:255 15:255 16:255 17:255 18:255 19:255 20:255 21:255 22:255 23:255 24:255 25:255 26:219 27:185 28:162 29:145 30:144 31:255 32:253 33:228 34:197
代码如下,我在这里是不是做错了什么?
wimn_model = svm.svm_model("newtraindata.txt.model")
#load model
wimn_f_test=open('newtestdata.txt','r');
#load test data and train data
wimn_f_train=open('newtraindata.txt','r');
ii=0
for eachline in wimn_f_test:
vec=eachline
v=vec.split()
vector={}
ii=ii+1
#print v[0]
wimn_test_labels.append(int(v[0]))
for i in range(1,len(v)):
s=v[i].split(":")
#print s[1]
vector[i]=int(s[1])
wimn_test_vectors.append(vector)
print "wimn test "+str(len(wimn_test_vectors))
# get the training and testing vectors and labels.
ii=0
for eachline in wimn_f_train:
vec=eachline
v=vec.split()
vector={}
ii=ii+1
wimn_train_labels.append(int(v[0]))
#print v[0]
for i in range(1,len(v)):
s=v[i].split(":")
#print s[1]
vector[i]=int(s[1])
wimn_train_vectors.append(vector)
print "wimn train "+str( len(wimn_train_vectors))
s=len(wimn_train_labels)
for i_s in range(0,s):
#print i_s
ww.append(wimn_model.predict(wimn_train_vectors[i_s]))
# wrongly predicted labels are in ww. correct labels are in wimn_train_labels, wimn_test_labels.
1 个回答
0
为了得到预测的结果,需要先加载经过缩放的输入值。这个问题已经解决了。
不过,使用easy.py生成的预测标签和我加载模型后预测的标签之间似乎有些不同。
网上关于libsvm的文档不太齐全。