我刚刚开始抓取网页,并决定在经典的IMDb数据集上试一试。我的一个列(“actors”)应该包含几个actor的名称。这就是它现在的样子:
"Director: Marc Webb | Stars: Zooey Deschanel, Joseph Gordon-Levitt, Geoffrey Arend, Chloë Grace Moretz"
我的目标是排除导演部分,只保留演员作为列表(用于某些数据分析):
["Zooey Deschanel", Joseph Gordon-Levitt", "Geoffrey Arend", "Chloe Grace Moretz"]
使用Python在所有行上实现此结果的最佳方法是什么?谢谢大家!
假设你有一个字符串数组,包含你在你的问题中描述的数据,那么你可以考虑做如下的事情:
执行会产生以下结果:
你可以check this solution out on IDEOne
您只需
split()
字符串:输出:
假设您的字符串存储为
s = "Director: Marc Webb | Stars: Zooey Deschanel, Joseph Gordon-Levitt, Geoffrey Arend, Chloe Grace Moretz"
,那么您可以按如下方式轻松拆分字符串-将字符串拆分为参与者:
my_list = str.split('|')
:这将拆分&;通过在|
处分隔字符串,将其转换为列表输出:
['Director: Marc Webb ', ' Stars: Zooey Deschanel, Joseph Gordon-Levitt, Geoffrey Arend, Chloe Grace Moretz']
my_list = my_list [1].split(':')
输出:
[' Stars', ' Zooey Deschanel, Joseph Gordon-Levitt, Geoffrey Arend, Chloe Grace Moretz']
actors = my_list [1].split(',')
输出:
[' Zooey Deschanel', ' Joseph Gordon-Levitt', ' Geoffrey Arend', ' Chloe Grace Moretz']
现在,您已经将字符串转换为所需的列表格式。以下为同一项目的代码:
上面的代码只会打印列表中的参与者
相关问题 更多 >
编程相关推荐