重新分配唯一值pandas DataFram

import pandas as pd import numpy as np from collections import Counter d = ({ 'Time' : ['8:03:00','8:17:00','8:20:00','8:33:00','8:47:00','8:48:00','9:03:00','9:15:00','9:18:00','9:33:00','9:45:00','9:48:00','10:03:00','10:15:00','10:15:00','10:15:00','10:18:00','10:32:00','10:33:00','10:39:00','10:43:00','10:48:00','10:50:00','11:03:00','11:03:00','11:07:00','11:25:00','11:27:00','11:42:00','11:48:00','11:51:00','11:57:00','12:00:00','12:08:00','12:15:00','12:17:00','12:25:00','12:30:00','12:35:00','12:39:00','12:47:00','12:52:00','12:55:00','13:00:00','13:03:00','13:07:00','13:12:00','13:15:00','13:22:00','13:27:00','13:27:00'], 'Area' : ['A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','B','A','B','A','A','A','A','B','A','A','B','B','A','B','C','A','B','C','C','A','B','C','C','B','A','C','B','C','C','A','C','B','C','C','A','C'], 'Place' : ['House 1','House 2','House 3','House 1','House 3','House 2','House 1','House 3','House 2','House 1','House 3','House 2','House 1','House 3','House 4','House 1','House 2','House 1','House 1','House 4','House 3','House 2','House 1','House 1','House 4','House 1','House 1','House 4','House 1','House 1','House 4','House 1','House 2','House 1','House 4','House 1','House 1','House 2','House 1','House 4','House 1','House 1','House 3','House 2','House 4','House 1','House 2','House 4','House 1','House 4','House 2'], 'On' : ['1','2','3','3','3','3','3','3','3','3','3','3','3','3','4','5','5','5','5','5','5','4','3','3','3','2','2','2','2','3','3','3','4','4','4','4','4','4','4','4','4','4','4','4','4','4','5','6','6','6','6'], 'Person' : ['Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 2','Person 3','Person 1','Person 3','Person 1','Person 2','Person 1','Person 1','Person 3','Person 1','Person 2','Person 3','Person 3','Person 2','Person 3','Person 4','Person 2','Person 3','Person 4','Person 4','Person 2','Person 3','Person 4','Person 4','Person 3','Person 2','Person 4','Person 3','Person 4','Person 4','Person 2','Person 4','Person 3','Person 5','Person 4','Person 2','Person 4'], }) df = pd.DataFrame(data=d) def getAssignedPeople(df, areasPerPerson): areas = df['Area'].values places = df['Place'].values times = pd.to_datetime(df['Time']).values maxPerson = np.ceil(areas.size / float(areasPerPerson)) - 1 assignmentCount = Counter() assignedPeople = [] assignedPlaces = {} heldPeople = {} heldAreas = {} holdAvailable = True person = 0 # search for repeated areas. Mark them if the next repeat occurs within an hour ixrep = np.argmax(np.triu(areas.reshape(-1, 1)==areas, k=1), axis=1) holds = np.zeros(areas.size, dtype=bool) holds[ixrep.nonzero()] = (times[ixrep[ixrep.nonzero()]] - times[ixrep.nonzero()]) < np.timedelta64(1, 'h') for area,place,hold in zip(areas, places, holds): if (area, place) in assignedPlaces: # this unique (area, place) has already been assigned to someone assignedPeople.append(assignedPlaces[(area, place)]) continue if assignmentCount[person] >= areasPerPerson: # the current person is already assigned to enough areas, move on to the next a = heldPeople.pop(person, None) heldAreas.pop(a, None) person += 1 if area in heldAreas: # assign to the person held in this area p = heldAreas.pop(area) heldPeople.pop(p) else: # get the first non-held person. If we need to hold in this area, # also make sure the person has at least 2 free assignment slots, # though if it's the last person assign to them anyway p = person while p in heldPeople or (hold and holdAvailable and (areasPerPerson - assignmentCount[p] < 2)) and not p==maxPerson: p += 1 assignmentCount.update([p]) assignedPlaces[(area, place)] = p assignedPeople.append(p) if hold: if p==maxPerson: # mark that there are no more people available to perform holds holdAvailable = False # this area recurrs in an hour, mark that the person should be held here heldPeople[p] = area heldAreas[area] = p return assignedPeople def allocatePeople(df, areasPerPerson=3): assignedPeople = getAssignedPeople(df, areasPerPerson=areasPerPerson) df = df.copy() df.loc[:,'Person'] = df['Person'].unique()[assignedPeople] return df print(allocatePeople(df))

1条回答

网友
1楼 · 发布于 2024-04-26 00:07:24

There's a live version of this answer online that you can try for yourself.
问题
您看到的bug是由于您的问题（又一个）有趣的边缘情况。在6th作业期间，代码将person 2分配给(A, House 4)。然后它看到区域A在一小时内重复，因此它在该区域中保持person 2。这使得person 2不可用于下一个作业，该作业位于B区域中。在
但是，没有理由为了在(A, House 1)中发生的作业而在区域{}中保留{}，因为区域和地点的唯一组合{}已经被分配给person 1。在
解决方案
这个问题可以通过在决定何时把人关在某个区域时只考虑区域和地点的独特组合来解决。只有几行代码需要更改。在
首先，我们构建一个与唯一（区域、地点）对相对应的区域列表：
unqareas = df[['Area', 'Place']].drop_duplicates()['Area'].values
然后我们只需在标识holds的代码的第一行中用unqareas代替{}：
^{pr2}$
完整列表/测试
import pandas as pd import numpy as np from collections import Counter d = ({ 'Time' : ['8:03:00','8:07:00','8:10:00','8:23:00','8:27:00','8:30:00','8:37:00','8:40:00','8:48:00'], 'Place' : ['House 1','House 2','House 3','House 1','House 2','House 3','House 4','House 1','House 1'], 'Area' : ['A','A','A','A','A','A','A','B','A'], 'Person' : ['Person 1','Person 1','Person 1','Person 1','Person 1','Person 1','Person 2','Person 3','Person 1'], 'On' : ['1','2','3','3','3','3','4','5','5'] }) df = pd.DataFrame(data=d) def getAssignedPeople(df, areasPerPerson): areas = df['Area'].values unqareas = df[['Area', 'Place']].drop_duplicates()['Area'].values places = df['Place'].values times = pd.to_datetime(df['Time']).values maxPerson = np.ceil(areas.size / float(areasPerPerson)) - 1 assignmentCount = Counter() assignedPeople = [] assignedPlaces = {} heldPeople = {} heldAreas = {} holdAvailable = True person = 0 # search for repeated areas. Mark them if the next repeat occurs within an hour ixrep = np.argmax(np.triu(unqareas.reshape(-1, 1)==unqareas, k=1), axis=1) holds = np.zeros(areas.size, dtype=bool) holds[ixrep.nonzero()] = (times[ixrep[ixrep.nonzero()]] - times[ixrep.nonzero()]) < np.timedelta64(1, 'h') for area,place,hold in zip(areas, places, holds): if (area, place) in assignedPlaces: # this unique (area, place) has already been assigned to someone assignedPeople.append(assignedPlaces[(area, place)]) continue if assignmentCount[person] >= areasPerPerson: # the current person is already assigned to enough areas, move on to the next a = heldPeople.pop(person, None) heldAreas.pop(a, None) person += 1 if area in heldAreas: # assign to the person held in this area p = heldAreas.pop(area) heldPeople.pop(p) else: # get the first non-held person. If we need to hold in this area, # also make sure the person has at least 2 free assignment slots, # though if it's the last person assign to them anyway p = person while p in heldPeople or (hold and holdAvailable and (areasPerPerson - assignmentCount[p] < 2)) and not p==maxPerson: p += 1 assignmentCount.update([p]) assignedPlaces[(area, place)] = p assignedPeople.append(p) if hold: if p==maxPerson: # mark that there are no more people available to perform holds holdAvailable = False # this area recurrs in an hour, mark that the person should be held here heldPeople[p] = area heldAreas[area] = p return assignedPeople def allocatePeople(df, areasPerPerson=3): assignedPeople = getAssignedPeople(df, areasPerPerson=areasPerPerson) df = df.copy() df.loc[:,'Person'] = df['Person'].unique()[assignedPeople] return df print(allocatePeople(df))
输出：
Time Place Area Person On 0 8:03:00 House 1 A Person 1 1 1 8:07:00 House 2 A Person 1 2 2 8:10:00 House 3 A Person 1 3 3 8:23:00 House 1 A Person 1 3 4 8:27:00 House 2 A Person 1 3 5 8:30:00 House 3 A Person 1 3 6 8:37:00 House 4 A Person 2 4 7 8:40:00 House 1 B Person 2 5 8 8:48:00 House 1 A Person 1 5

问题

解决方案

完整列表/测试

相关问题更多 >

编程相关推荐

热门问题

热门文章