在Keras实施的变压器XL

keras-transformer-xl的Python项目详细描述


Keras变压器XL

TravisCoverageVersionDownloadsLicense

[中文English]

非正式实施Transformer-XL

安装

pip install keras-transformer-xl

用法

负载预应变重量

可以在the info directory找到几个配置文件。

importosfromkeras_transformer_xlimportload_trained_model_from_checkpointcheckpoint_path='foo/bar/sota/enwiki8'model=load_trained_model_from_checkpoint(config_path=os.path.join(checkpoint_path,'config.json'),checkpoint_path=os.path.join(checkpoint_path,'model.ckpt'))model.summary()

关于IO

生成的模型有两个输入,第二个输入是存储器的长度。

您可以使用MemorySequence包装器进行训练和预测:

importkerasimportnumpyasnpfromkeras_transformer_xlimportMemorySequence,build_transformer_xlclassDummySequence(keras.utils.Sequence):def__init__(self):passdef__len__(self):return10def__getitem__(self,index):returnnp.ones((3,5*(index+1))),np.ones((3,5*(index+1),3))model=build_transformer_xl(units=4,embed_dim=4,hidden_dim=4,num_token=3,num_block=3,num_head=2,batch_size=3,memory_len=20,target_len=10,)seq=MemorySequence(model=model,sequence=DummySequence(),target_len=10,)model.predict(model,seq,verbose=True)

使用tf.keras

TF_KERAS=1添加到环境变量中以使用tensorflow.python.keras

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用JNA创建同一库的多个实例?   java在将Graphql查询作为JSON字符串传递时收到意外的令牌错误   OAuth2 oltu的java问题   java桌面应用程序使用的好的嵌入式数据库是什么?   java Firebase数据库高级查询选项   java正在使磁盘上的EhCache元素过期   java 安卓还原处于backstack中的片段的实例状态   XMemcached中的java异步集   java TimescaleDB是否使用与Postgresql完全相同的JDBC驱动程序?   java从网站c读取信息#   检查java Android中的字符串是否只包含数字和空格   c#如何向web服务发送特殊字符?   grails无法调用需要java的方法。lang.类参数?   java我在组合框中调用的方法不会运行所有代码,它只运行部分代码   java发送带有标头的HTTP GET请求