Paragram_300_SL999 Word嵌入文件是否损坏?

2024-06-16 09:17:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在我的项目中使用Paragram_SL999_300嵌入,该项目使用一篇已发表文章(https://github.com/cecilialeiqi/adversarial_text)中的开放源代码。当我尝试从https://github.com/cecilialeiqi/adversarial_text运行步骤4(生成对抗性示例)时,我得到一个ValueError,表示int()应为,但得到了','。我从Paragram-SL999 300的readme.txt中知道,应该是每行一个令牌,后跟其嵌入。在尝试打开Paragram_SL999_300.txt文件以查看其是否符合此条件时,它加载了大约一半,然后关闭TextEditor,而不允许我对其进行编辑。此外,如果我尝试在LibreOffice中打开它,它会崩溃。这是在一个Ubuntu 18.04虚拟机中。但是,我不确定这是否是因为作者的代码错误(在https://github.com/cecilialeiqi/adversarial_text/blob/master/src/discrete_attack.py的discrete_attack.py中),或者是因为文件已损坏,所以我尝试从我的Windows计算机上的Wieting网站(http://www.cs.cmu.edu/~jwieting/)下载并提取Pararam-SL999 300存档,我收到一条消息说存档已损坏,这使我无法提取Paragram_SL999_300.txt文件并使用它。在另一台Windows计算机上,我在尝试提取存档文件时收到错误代码0x80004005:未指定的错误

有没有办法绕过这个问题,或者有谁能提供关于这个问题的见解?是否建议从Wieting的GitHub(https://github.com/jwieting/paragram-word)生成嵌入?我将非常感谢任何意见,因为这些嵌入对我的项目至关重要


Tags: 文件项目textpyhttpsgithubtxtcom