我目前正在使用一个朴素的贝叶斯算法来做我的文本分类。
我的最终目标是,如果算法已确定句子属于某个类别,则能够突出显示大文本文档的部分内容。
朴素的Bayes结果很好,但是我想为这个问题训练一个NN,所以我遵循了本教程: http://machinelearningmastery.com/sequence-classification-lstm-recurrent-neural-networks-python-keras/在Keras上建立我的LSTM网络。
所有这些概念对我来说现在都很难理解,所以请原谅,如果你在我的代码中看到一些非常愚蠢的东西。
我有155个不同大小的句子被贴上了标签。
所有这些标记的句子都在training.csv文件中:
8,9,1,2,3,4,5,6,7
16,15,4,6,10,11,12,13,14
17,18
22,19,20,21
24,20,21,23
(每个整数代表一个单词)
所有结果都在另一个label.csv文件中:
6,7,17,15,16,18,4,27,30,30,29,14,16,20,21 ...
我在trainings.csv中有155行,当然在label.csv中有155个整数
我的字典里有1038个字。
这是我当前的代码:
total_words = 1039
## fix random seed for reproducibility
numpy.random.seed(7)
datafile = open('training.csv', 'r')
datareader = csv.reader(datafile)
data = []
for row in datareader:
data.append(row)
X = data;
Y = numpy.genfromtxt("labels.csv", dtype="int", delimiter=",")
max_sentence_length = 500
X_train = sequence.pad_sequences(X, maxlen=max_sentence_length)
X_test = sequence.pad_sequences(X, maxlen=max_sentence_length)
# create the model
embedding_vecor_length = 32
model = Sequential()
model.add(Embedding(total_words, embedding_vecor_length, input_length=max_sentence_length))
model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
print(model.summary())
model.fit(X_train, Y, epochs=3, batch_size=64)
# Final evaluation of the model
scores = model.evaluate(X_train, Y, verbose=0)
print("Accuracy: %.2f%%" % (scores[1]*100))
这种模式永远不会收敛:
155/155 [==============================] - 4s - loss: 0.5694 - acc: 0.0000e+00
Epoch 2/3
155/155 [==============================] - 3s - loss: -0.2561 - acc: 0.0000e+00
Epoch 3/3
155/155 [==============================] - 3s - loss: -1.7268 - acc: 0.0000e+00
我想要24个标签中的一个,或者每个标签的概率列表。
我在这里做错什么了?
谢谢你的帮助!
我已经更新了我的代码,感谢对我的问题发表的评论。
我想我可以玩LSTM大小(10或100),数量的时代和批量大小。
模型精度很低(40%)。但目前我认为这是因为我没有足够的数据(24个标签150个句子)。
在获取更多数据之前,我会将此项目置于待机模式。
如果有人有一些想法来改进这段代码,请随意评论!
相关问题 更多 >
编程相关推荐