我有一个数据框,代表一些餐馆及其名称
is_chain
中添加一列df
,该列表示餐厅是否为食物链。此新列采用0或1。值1表示该餐厅是连锁店(如麦当劳)的一部分。如果数据库中有另一家同名餐厅,则该餐厅被视为连锁店的一部分李>data = {
'restaurant_id': ['1', '2','3','4','5','6','7','8','9','10','11','12'],
'restaurant_name': ['Dennys', 'Dennys','Pho U','Pho U','Dennys','Japanese Cafe','Japanese Cafe','Midori','Midori','xxx','yyy','zzz'],
}
df = pd.DataFrame (data, columns = ['restaurant_id','restaurant_name'])
df.head(15)
例如,这里,xxx
、yyy
和zzz
不是链的一部分
我不确定使用pandas来实现这样的功能的语法是否正确。如果需要任何澄清,请询问
多谢各位
这听起来像
duplicated
:输出:
相关问题 更多 >
编程相关推荐