基于lstm的类sklearn序列分类器
seq2seq-lstm的Python项目详细描述
seq2seq lstm是一个序列到序列的分类器 类似sklearn的接口,它使用keras包进行神经 建模。
本单元的开发灵感来自Francois Chollet的教程 A ten-minute introduction to sequence-to-sequence learning in Keras
这个项目的目标是创建一个简单的python包 用于解决不同seq2seq任务的类似sklearn的接口:machine 翻译,问答,将音素序列解码成 词序等
开始
安装
若要在本地计算机上安装此项目,应运行 终端中的以下命令:
git clone https://github.com/bond005/seq2seq.git cd seq2seq sudo python setup.py
您还可以运行测试:
python setup.py test
但我建议您使用p i p并从pypi安装此软件包:
pip install seq2seq-lstm
或(使用sudo):
sudo pip install seq2seq-lstm
使用量
安装seq2seq lstm之后,可以在 项目。例如:
from seq2seq import Seq2SeqLSTM # import the Seq2Seq-LSTM package seq2seq = Seq2SeqLSTM() # create new sequence-to-sequence transformer
要查看seq2seq lstm在大型数据集上的工作,可以运行 演示
python demo/seq2seq_lstm_demo.py
或(训练后保存模型):
python demo/seq2seq_lstm_demo.py some_file.pkl
在这个演示中,seq2seq lstm学习从 英语变成俄语。如果指定了神经模型文件(例如, 前面提到的some_file.pkl,那么学习的神经模型将是 保存到此文件中以供加载,而不是在下一个文件中重新安装 跑步。
Tatoeba项目中的俄语-英语句子对 用作单元测试和演示脚本的数据(请参见 http://www.manythings.org/anki/)。