在keras中实现的xlnet

keras-xlnet的Python项目详细描述


凯拉斯xlnet

TravisCoverageVersionDownloadsLicense

[中文English]

非正式实施XLNetEmbedding extractionembedding extract with memory演示如何使用预先训练的检查点获取最后一个transformer层的输出。

安装

pip install keras-xlnet

用法

微调胶水

单击任务名称以查看基本型号的演示:

Task NameMetricsApproximate Results on Dev Set
CoLAMatthew Corr.52
SST-2Accuracy93
MRPCAccuracy/F186/89
STS-BPearson Corr. / Spearman Corr.86/87
QQPAccuracy/F190/86
MNLIAccuracy84/84
QNLIAccuracy86
RTEAccuracy64
WNLIAccuracy56

(WNLI数据集中只预测0)

加载预先训练的检查点

importosfromkeras_xlnetimportTokenizer,load_trained_model_from_checkpoint,ATTENTION_TYPE_BIcheckpoint_path='.../xlnet_cased_L-24_H-1024_A-16'tokenizer=Tokenizer(os.path.join(checkpoint_path,'spiece.model'))model=load_trained_model_from_checkpoint(config_path=os.path.join(checkpoint_path,'xlnet_config.json'),checkpoint_path=os.path.join(checkpoint_path,'xlnet_model.ckpt'),batch_size=16,memory_len=512,target_len=128,in_train_phase=False,attention_type=ATTENTION_TYPE_BI,)model.summary()

参数^ {< CD1>},^ {< CD2>}和^ {CD3>}是用于初始化内存的最大大小。如果in_train_phaseTrue,则返回用于训练语言模型的模型,否则将返回用于微调的模型。

关于i/o

注意shuffle应该是False中的fitfit_generator(如果使用内存)。

in_train_phaseFalse

3个输入:

  • 标记的ID,形状为(batch_size, target_len)
  • 段的ID,形状为(batch_size, target_len)
  • 记忆长度,形状为(batch_size, 1)

1输出:

  • 每个标记的功能,形状为(batch_size, target_len, units)

in_train_phaseTrue

4个输入:

  • 标记的ID,形状为(batch_size, target_len)
  • 段的ID,形状为(batch_size, target_len)
  • 记忆长度,形状为(batch_size, 1)
  • 标记的掩码,形状为(batch_size, target_len)

1输出:

  • 每个位置上每个标记的概率,形状为(batch_size, target_len, num_token)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
添加组件后,java JTable为空   java将json发送到php并插入mysql,但返回null   java Spring引导JNDI CommonJ资源   从不同PC创建和合并后的Java servlet问题   java如何在使用findelements时从xpath获取文本   java使用spring boot使用gmail smtp发送电子邮件   java在不使用pojo、bean或getter和setter的情况下获取Json标题的Json数组   Java中的OpenFile对话框将null作为响应   JavaBuilder模式。扩展接口   java中无需替换的数据结构选取   java如何评价Encog中的预测神经网络   java如何在安卓中使用实际的HttpURLConnection进行单元测试?   java使用XML配置禁用WebSocket中的CSRF保护   java如何通过hibernate从多表查询中获取数据?   mysql如何在java中获取更新的行Id   java AEM/CQ组件单一组件/有限组件   java FFmpeg Javacv延迟问题   显示整数数组的java不起作用