基于布尔ch增加两个计数器的Pythonic方法

import enchant from enchant.tokenize import get_tokenizer, HTMLChunker, EmailFilter, URLFilter d = enchant.Dict("en_US") good = 0 bad = 0 text = "this is <span class='stupid'>not important</span>. Email you@example.com from http://www.google.com. htis si a msispelling" tokenizer = get_tokenizer("en_US", (HTMLChunker,),(URLFilter,EmailFilter)) # This loop here: Can I make this more efficient? for (word,pos) in tokenizer(text): if d.check(word): good += 1 else: bad += 1 print good # Prints 7 print bad # Prints 3

3条回答

网友

1楼 · 编辑于 2024-04-27 03:35:48

你可以这样做

tokens = list(tokenizer(text))
good = sum(d.check(word) for word, _ in tokens)
bad = len(tokens) - good

例如，Python将False解释为0，将True解释为1，这是利用了这一事实

>>> sum([True, True, True])
3

因此在上面的代码中，对列表理解的结果求和将是对True和False值的列表求和，这实际上与只对True值求和是一样的。你知道吗

那么bad数就是总数减去good。你知道吗

网友

2楼 · 编辑于 2024-04-27 03:35:48

因为good和bad有些关联，所以用字典代替。你知道吗

counts = { 'good': 0, 'bad': 0 }

counts[ 'good' if d.check(word) else 'bad' ] += 1

就执行时间而言，这可能没有显著提高效率。你知道吗

网友

3楼 · 编辑于 2024-04-27 03:35:48

“Pythonic”通常是指最直截了当或最容易阅读的，所以我不这么认为。但这利用了一些可能更快的技巧。你知道吗

from collections import Counter
counts = Counter(d.check(word) for (word,pos) in tokenizer(text))
good, bad = counts[True], counts[False]

相关问题更多 >

编程相关推荐

热门问题

热门文章