如何删除列表中的空字符串?例如我有一句话 "He is so .... cool!" 然后我删除所有标点符号并将其列在列表中。 ["He", "is", "so", "", "cool"] 如何删除或忽略空字符串? ...2024-04-28 已阅读: n次
Python条件列表联接我有一个列表如下: [ 'A', 'must', 'see', 'is', 'the', 'Willaurie', ',', 'which', 'sank', ...2024-04-28 已阅读: n次
如何从列表中的字符串末尾去掉特定的标点符号,并使所有单词的cas都降低我有一个字符串列表,需要从列表中每个字符串的末尾去掉某些标点符号。列表如下: list = ['Twas', 'brillig,', 'and', 'the', 'slithy', 'toves', ...2024-04-28 已阅读: n次
在Python中使用NLTK查找押韵我有一首诗,我希望Python代码只打印那些押韵的单词。 到目前为止,我能够: 用wordpunct_tokenize()打断诗歌句子 去掉标点符号来清除单词 把这首诗每句的最后一个字都记在一张单子 ...2024-04-28 已阅读: n次
如何去除Python中的所有前导和尾随标点? 我知道如何删除字符串中的所有标点符号。 import string s = '.$ABC-799-99,#' table = string.maketrans("","") # to remov ...2024-04-28 已阅读: n次
NLTK中的实词计数NLTK书中有几个单词计数的例子,但实际上它们不是单词计数而是标记计数。例如,第1章“计算词汇量”说,下面给出了一个词汇量: text = nltk.Text(tokens) len(text) 但 ...2024-04-28 已阅读: n次
将字符串拆分为具有多个单词边界分隔符的单词我想我想做的是一个相当常见的任务,但我在网上找不到任何参考资料。我有带标点符号的文本,我想要一个单词列表。 "Hey, you - what are you doing here!?" 应该是 [' ...2024-04-28 已阅读: n次
在python中使用unicode数据的string.translate()我有3个API,它将json数据返回到3个字典变量。我正在从字典中提取一些值来处理它们。我读取了我想要列表valuelist的特定值。其中一个步骤是删除其中的标点符号。我通常在此进程中使用string ...2024-04-28 已阅读: n次
用n标记单词时防止在撇号处分裂我用nltk把句子分成单词。e、 g nltk.word_tokenize("The code didn't work!") -> ['The', 'code', 'did', "n't", ...2024-04-28 已阅读: n次
AttributeError:“float”对象没有“translate”Python属性我正在做一些NLP与文本数据从医生只是试图做一些基本的预处理文本清理试图删除停止词和标点符号。我已经给了程序一个标点符号和停止词的列表。你知道吗 我的文本数据如下所示: "Cyclin-depe ...2024-04-28 已阅读: n次
从文本问题中删除标点符号/数字我有一些代码可以很好地使用python中的正则表达式删除标点符号/数字,我必须稍微更改代码,这样停止列表才起作用,而不是特别重要。无论如何,现在标点符号并没有被删除,坦白地说,我很困惑为什么。 imp ...2024-04-28 已阅读: n次
在列表中添加标点符号?我对标点符号有点小问题。在 我的任务是检查文本中是否有重复的单词,如果列表中有任何重复的单词,我的工作是使用.upper()来突出显示它们。在 我喜欢苹果,苹果是我所知道的最好的东西。在 所以我取了原 ...2024-04-28 已阅读: n次
match模块match的目的是从原始的未经标记化的源获取已清理的标记化字符串的偏移量(以及偏移量之间的字符串,用于调试)。你可能会说“很重要”,但如果原始文本足够混乱,更不用说充斥着Unicode字符,这实际 ...2024-04-28 已阅读: n次
passgen-cli这是简单的cli随机密码生成器。它结合了标点符号、字母(大写和小写)和数字。 安装: pip install passgen-cli 选项: -l INTEGER length of the pa ...2024-04-28 已阅读: n次
punctuation-remove标点符号 这是一个python库,它将删除python字符串中的所有标点符号 示例代码 from punctuation import Punctuation my_str = '''"I can ...2024-04-28 已阅读: n次
dirtyclean用于快速清理文本以进行文本挖掘的微型库。主要用于去除Unicode标点符号、随机额外空格等。 这意味着一个非常快速和肮脏的清理过程(因此得名)。它抛出数字、货币符号、数学、标点符号、上标和下标等,主要 ...2024-04-28 已阅读: n次
english-words 英语单词py 包含来自 svnweb.freebsd.org/csrg/share/dic/。 这是最新的修订版61569的词表。 这个包裹有四套: english_words_set:一组同时包 ...2024-04-28 已阅读: n次
msgcheckmsgcheck对gettext文件执行各种检查: 编译(使用命令msgfmt-c) 每次翻译: 翻译字符串中的行数 字符串开始/结束处的空白 字符串中行尾的尾随空格 字符串末尾的标点符号 拼写(邮 ...2024-04-28 已阅读: n次