向空嵌套列表添加新值

for eachFilename in Talks: for eachTerm in range( 0, len( Talks[eachFilename]['TermVectors'] ) ): for term in Talks[eachFilename]['TermVectors'][ eachTerm ]: if unicode(term) not in stop_words: Talks[eachFilename]['TermVectorsNoStops'].append( term )

2条回答

网友

1楼 · 编辑于 2024-05-13 23:46:03

一些持续的实验，加上这些评论，让我朝着一个解决方案前进。我没有附加每个单独的术语（生成一个长列表），而是将这些术语累积到一个列表中，然后将每个列表追加，如下所示：

for eachFilename in Talks:
    for eachTerm in range( 0, len( Talks[eachFilename]['TermVectors'] ) ):
        term_list = [ ]
        for term in Talks[eachFilename]['TermVectors'][ eachTerm ]:
            if unicode(term) not in stop_words:
                term_list.append(term)
        Talks[eachFilename]['TermVectorsNoStops'].append( term )

谢谢大家！在

网友

2楼 · 编辑于 2024-05-13 23:46:03

您报告的错误（字符串不可变？）除非您的列表实际上不是空的，但已经用字符串填充，否则就没有任何意义。在任何情况下，如果您从一个空列表开始，那么填充它的最简单方法是附加：

>>> talks = {}
>>> talks['each_file_name'] = {}
>>> talks['each_file_name']['terms_removed'] = []
>>> talks['each_file_name']['terms_removed'].append(['paragraph','text'])
>>> talks['each_file_name']['terms_removed'].append(['paragraph','2'])
>>> talks['each_file_name']['terms_removed'].append(['paragraph'])
>>> talks
{'each_file_name': {'terms_removed': [['paragraph', 'text'], ['paragraph', '2'], ['paragraph']]}}
>>> from pprint import pprint
>>> pprint(talks)
{'each_file_name': {'terms_removed': [['paragraph', 'text'],
                                      ['paragraph', '2'],
                                      ['paragraph']]}}

如果您有一个空列表，并尝试使用索引为其分配，则会引发错误：

^{pr2}$

另外，代码如下：

for eachFilename in Talks:
    for eachTerm in range( 0, len( Talks[eachFilename]['TermVectors'] ) ):
        for term in Talks[eachFilename]['TermVectors'][ eachTerm ]:
            if unicode(term) not in stop_words:
                Talks[eachFilename]['TermVectorsNoStops'].append( term )

与Python风格相去甚远。不要使用camelCase，使用snake_case。不要将变量大写。另外，在中级for循环中，使用for eachTerm in range(0, len(Talks[eachFilename]['TermVectors']，但是eachTerm是int，因此使用标准ij或{}。偶数idx。在

无论如何，没有理由让代码变成这样：

Talks[filename1][TermVectors] =
     [['This','is','paragraph','one'],
      ['paragraph','two']]

在这方面：

Talks[filename1][TermVectors] =
     [['This'],
      ['is'],
      ['paragraph'],
      ['one'],
      ['paragraph'],
      ['two']]

下面是一个可复制的例子（我为您做了这个，但是您应该在发布问题之前自己做）：

>>> pprint(talks)
{'file1': {'no_stops': [],
           'term_vectors': [['This', 'is', 'paragraph', 'one'],
                            ['paragraph', 'two']]},
 'file2': {'no_stops': [],
           'term_vectors': [['This', 'is', 'paragraph', 'three'],
                            ['paragraph', 'four']]}}
>>> for file in talks:
...   for i in range(len(talks[file]['term_vectors'])):
...     for term in talks[file]['term_vectors'][i]:
...       if term not in stop_words:
...         talks[file]['no_stops'].append(term)
... 
>>> pprint(file)
'file2'
>>> pprint(talks)
{'file1': {'no_stops': ['This', 'paragraph', 'one', 'paragraph'],
           'term_vectors': [['This', 'is', 'paragraph', 'one'],
                            ['paragraph', 'two']]},
 'file2': {'no_stops': ['This', 'paragraph', 'paragraph', 'four'],
           'term_vectors': [['This', 'is', 'paragraph', 'three'],
                            ['paragraph', 'four']]}}
>>>

更像Python的方法如下：

>>> pprint(talks)
{'file1': {'no_stops': [],
           'term_vectors': [['This', 'is', 'paragraph', 'one'],
                            ['paragraph', 'two']]},
 'file2': {'no_stops': [],
           'term_vectors': [['This', 'is', 'paragraph', 'three'],
                            ['paragraph', 'four']]}}
>>> for file in talks.values():
...   file['no_stops'] = [[term for term in sub if term not in stop_words] for sub in file['term_vectors']]
... 
>>> pprint(talks)
{'file1': {'no_stops': [['This', 'paragraph', 'one'], ['paragraph']],
           'term_vectors': [['This', 'is', 'paragraph', 'one'],
                            ['paragraph', 'two']]},
 'file2': {'no_stops': [['This', 'paragraph'], ['paragraph', 'four']],
           'term_vectors': [['This', 'is', 'paragraph', 'three'],
                            ['paragraph', 'four']]}}
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章