擅长:python、mysql、java
<p>您可以使用dataframe并使用函数映射<code>text</code>列的值以获得第一个名称,然后从该特定列的列表中创建列表</p>
<p>在函数内部,使用正则表达式仅从该列表中的所有元组中提取名字,并返回名字列表</p>
<pre><code>import pandas as pd
import re
def get_first(x):
return list(map(lambda tup: re.match(r'\w+', tup[0])[0].lower(), x))
test = {'text': [
('tom-mark', 'tom', 'tom is a good guy.'),
('Nick X','nick', 'Is that Nick?')
]}, {'text': [
('juli', 'juli', 'Tom likes juli so much.'),
('tony', 'tony', 'Steve and Tony listen in as well.')
]}
data = sum(pd.DataFrame(test).applymap(get_first)['text'].tolist(), [])
print(data)
</code></pre>