尝试计数单词,仅统计最后一个列表

2024-06-16 11:52:50 发布

您现在位置:Python中文网/ 问答频道 /正文

for tekst in textblock:
    woorden_tekst = tekst.get_text()
    woorden_lib = woorden_tekst.split()
    print(woorden_lib)
    # see the result
    ## hier begint de dict.
    for woord in woorden_lib:
        if woord in counts:
            counts[woord] = +1
        else:
            counts[woord] = 1
    ###print(counts)

结果如下:

['Een', 'groep', 'van', 'zestien', 'burgers', 'heeft', 'de', 'overheid', 'voor', 'de', 'rechter', 'gedaagd', 'vanwege', 'de', 'stank', 'die', 'wordt', 'veroorzaakt', 'door', 'megastallen.', 'Het', 'gaat', 'om', 'twaalf', 'mensen', 'uit', 'Noord-Brabant,', 'twee', 'inwoners', 'van', 'Limburg,', 'een', 'inwoner', 'van', 'Gelderland', 'en', 'een', 'inwoner', 'van', 'Overijssel.', 'Zij', 'zeggen', 'dat', 'veel', 'burgers', 'op', 'het', 'platteland', '"voortdurend', 'last', 'hebben', 'van', 'een', 'overdosis', 'stank"', 'en', 'willen', 'beter', 'beschermd', 'worden.']
['De', 'burgers', 'werken', 'samen', 'met', 'het', 'Brabants', 'Burgerplatform,', 'een', 'beweging', 'die', 'opkomt', 'voor', '"verontruste', 'bewoners', 'van', 'het', 'platteland".', 'In', 'een', 'verklaring', 'zegt', 'het', 'platform', 'dat', 'de', 'veehouderij', 'op', 'dit', 'moment', 'te', 'veel', 'wordt', 'beschermd.', '"Door', 'de', 'uitzonderingen', 'in', 'de', 'wet', 'en', 'de', 'overmatige', 'bescherming', 'van', 'eerder', 'door', 'veehouders', 'verworven', 'rechten', 'wordt', 'er', 'zoveel', 'hinder', 'toegestaan,', 'dat', 'het', 'recht', 'op', 'ongestoord', 'woongenot', 'van', 'burgers', 'wordt', 'geschonden."']
['Volgens', 'de', 'groep', 'schendt', 'de', 'overheid', 'het', 'Europees', 'Verdrag', 'voor', 'de', 'Rechten', 'van', 'de', 'Mens,', 'de', 'Grondwet', 'en', 'het', 'Burgerlijk', 'Wetboek,', 'doordat', 'de', 'Staat', 'het', 'woongenot', 'naar', 'hun', 'mening', 'niet', 'beschermt.', 'Ze', 'verwijzen', 'in', 'hun', 'dagvaarding', 'naar', 'zestien', 'varkens-', 'rundvee-', 'en', 'pluimveehouderijen.']
['Het', 'Brabants', 'Burgerplatform', 'denkt', 'dat', 'er', 'een', 're�le', 'kans', 'is', 'op', 'succes', 'bij', 'de', 'rechter.', '"De', 'Staat', 'werd', 'al', 'eerder', 'op', 'de', 'vingers', 'getikt', 'in', 'een', 'vergelijkbare', 'kwestie:', 'de', 'Urgenda-zaak",', 'meldt', 'het', 'platform.', '"Ook', 'hier', 'ging', 'het', 'om', 'onvoldoende', 'bescherming', 'van', 'burgers,', 'tegen', 'klimaatverandering,', 'en', 'schending', 'door', 'de', 'Staat', 'van', 'het', 'Europees', 'Verdrag', 'voor', 'de', 'Rechten', 'van', 'de', 'Mens."']

我正在数一页上的字。我设法得到文本并拆分文本。但是我试着用手指数数

for woord in woorden_lib:
    if woord in counts:
        counts[woord] = +1
    else:
        counts[woord] = 1
    ###print(counts)

我只计算最后一个列表,但它当然必须计算在所有列表中。我做错了什么


Tags: inlibdevanenopcountshet