如何使用Python和Pandas从salesforce orderedict层次结构中提取数据

from collections import OrderedDict example = OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Telephone Sales')]))]) print(example['UserRole']['Name'])

import pandas as pd import json from collections import OrderedDict # Settings pd.set_option('display.max_colwidth', -1) # Functions def extract_odict_item(odict, key_1, key_2=None): data = json.dumps(odict) final_data = json.loads(data) if key_2 is None: if final_data is not None: return final_data[key_1] else: return None elif key_2 is not None: if final_data is not None: return final_data[key_1][key_2] else: return None # Data accounts = [ OrderedDict([('attributes', OrderedDict([('type', 'Account'), ('url', 'URLHERE')])), ('Name', 'Supermarket'), ('AccountNumber', 'ACC1234'), ('MID__c', '123456789')]), OrderedDict([('attributes', OrderedDict([('type', 'Account'), ('url', 'URLHERE')])), ('Name', 'Bar'), ('AccountNumber', 'ACC9876'), ('MID__c', '987654321')]), OrderedDict([('attributes', OrderedDict([('type', 'Account'), ('url', 'URLHERE')])), ('Name', 'Florist'), ('AccountNumber', 'ACC1298'), ('MID__c', '123459876')]) ] owner = [ OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Telephoone Sales')]))]), OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Field Sales')]))]), OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Online Sale')]))]) ] # Dataframe df = pd.DataFrame({'ConvertedAccounts': accounts, 'Owner': owner }) # Extract data from OrderedDict using usual indexing df['MerchantID'] = df['ConvertedAccounts'].apply(lambda x: x['MID__c']) df['UserRole'] = df['Owner'].apply(lambda x: x['UserRole']['Name']) # Extract data from OrderedDict using function df['extracted_MerchantID'] = df['ConvertedAccounts'].apply(lambda x: extract_odict_item(x, 'MID__c')) df['extracted_UserRole'] = df['Owner'].apply( lambda x: extract_odict_item(x, 'UserRole', 'Name')) # Drop junk columns df = df.drop(columns=['ConvertedAccounts', 'Owner']) print(df)

# Functions def extract_odict_item(odict, *args): data = json.dumps(odict) final_data = json.loads(data) if len(args) == 0: raise Exception('Requires atleast 1 argument') elif len(args) == 1: if final_data is not None: return final_data[args[0]] else: return None elif len(args) > 1: ### Pseudo Code ### # if final_data is not None: # return final_data[args[0]][args[1]][args[2]] etc..... # else: # return None

import json from collections import OrderedDict # Settings pd.set_option('display.max_colwidth', -10) # Data owner = [ OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Telephoone Sales')]))]), OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Field Sales')]))]), OrderedDict([('attributes', OrderedDict([('type', 'Name'), ('url', 'URLHERE')])), ('UserRole', OrderedDict([('attributes', OrderedDict([('type', 'UserRole'), ('url', 'URLHERE')])), ('Name', 'Online Sale')]))]) ] # Functions def rec_ext(odict, item_list): new_list = item_list.copy() data = json.dumps(odict) final_data = json.loads(data) el = new_list.pop() if isinstance(final_data[el], dict): return rec_ext(final_data[el], new_list) else: return final_data[el] # Dataframe df = pd.DataFrame({'owner': owner }) my_columns = ['UserRole', 'Name'] my_columns.reverse() df['owner2'] = df['owner'].apply(lambda x: rec_ext(x, my_columns)) print(df['owner2'])

1条回答

网友
1楼 · 发布于 2024-04-25 17:05:33

这不是一个确切的答案-但你可以尝试递归，如果我理解你的问题正确-
d = {1: {2: {3: {4: 5}}}}#Arbitrarily nested dict l = [1, 2, 3, 4] def rec_ext(my_dict, my_list): el = my_list.pop() if isinstance(my_dict[el], dict): return rec_ext(my_dict[el], my_list) else: return my_dict[el] l.reverse() #we reverse because we are "popping" in the function rec_ext(d, l) #Returns 5

相关问题更多 >

编程相关推荐

热门问题

热门文章