Keras中pad\u序列的无效文字错误

2024-05-01 21:48:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个很长的清单。它们的长度不同,所以我想用Keras的pad\u序列方法来填充它们。你知道吗

这是我名单上的一个小样本。你知道吗

[['1052510314,561817251071255315530393310539,17], [18431041015251031392510310310559110712301031391839,1052510314,561817251071255315530393310539], [17,1818431041015251033925103103121061210310559110712301031010]]

内部列表中的项相当长,但是主列表的总长度是8252。你知道吗

我试着这样垫它

# pad documents to a max length of 4 words
max_length = 1000
paddedX = pad_sequences(X, maxlen=max_length, padding='post', dtype="int64")
print(paddedX)

我得到了这个错误

invalid literal for int() with base 10: '1052510314,561817251071255315530393310539,17,18431041015251031392510310310559110712301031391839,1052510314,561817251071255315530393310539,17,1818431041015251033925103103121061210310559110712301031010

据我所知,pad\u sequences方法默认使用int32数据类型。这可能是导致错误的原因。如果是这样的话,有没有办法在C中使用长数据类型之类的东西?你知道吗

注意:列表中的元素已经是热编码的。你知道吗


Tags: 方法列表错误序列lengthmaxdocumentskeras