从di更新Pandasdf

counts: Counter({u'Apple': 1638, u'Facebook': 1169, u'Amazon': 1027, u'Boeing': 548, u'Microsoft': 437, u'JPMorgan': 435, u'Nasdaq': 364, u'Williams': 296, u'Disney': 270, u'Netflix': 260, u'Chevron': 258, u'Comcast': 213, u'CBS': 200, u'Carnival': 193, u'Intel': 188, u'IBM': 172, u'Starbucks': 165, u'Target': 143, u'Monsanto': 141, u'PayPal': 133, u'Viacom': 126, u'Equifax': 124, u'Anthem': 123, u'Pfizer': 121, u'Nike': 121, u'Caterpillar': 119, u'Citigroup': 116, u'AIG': 116, u'HP': 109, u'Aetna': 109, u'BlackRock': 109 ... co_names_df_1: Name Frequency 0 3M 0 1 A.O. Smith 0 2 Abbott 0 3 AbbVie 0 4 Accenture 0 5 Activision 0 6 Acuity Brands 0 ...

2条回答

网友

1楼 · 编辑于 2024-05-23 14:25:09

下面迭代counts中的键，并将数据帧中的Frequency值设置为counts中与该键关联的值。在

from collections import Counter

counts = Counter({u'Apple': 1638, u'Facebook': 1169, u'Amazon': 1027, u'Boeing': 548,})

for x in counts:
    co_names_df_1['Frequency'][co_names_df_1['Name']==x] = counts[x]  # updates dataframe values based on those in counts

更新：

使用pandas的.map()方法似乎比上面的for循环运行得更快（至少在这个4个小样本集中）键：值对). 在

^{pr2}$

在jupyter笔记本单元中使用%%time，运行.map()方法需要大约488µs，而for-loop方法需要~1.24s

网友

2楼 · 编辑于 2024-05-23 14:25:09

您可以使用^{}：

import collections
import pandas as pd
c = collections.Counter({u'Apple': 1638, u'Facebook': 1169, u'Amazon': 1027, u'Boeing': 548, u'Microsoft': 437, u'JPMorgan': 435, u'Nasdaq': 364, u'Williams': 296, u'Disney': 270, u'Netflix': 260, u'Chevron': 258, u'Comcast': 213, u'CBS': 200, u'Carnival': 193, u'Intel': 188,
                         u'IBM': 172, u'Starbucks': 165, u'Target': 143, u'Monsanto': 141, u'PayPal': 133, u'Viacom': 126, u'Equifax': 124, u'Anthem': 123, u'Pfizer': 121, u'Nike': 121, u'Caterpillar': 119, u'Citigroup': 116, u'AIG': 116, u'HP': 109, u'Aetna': 109, u'BlackRock': 109})
df = pd.DataFrame({'Name': {0: '3M',
                            1: 'A.O. Smith',
                            2: 'Abbott',
                            3: 'AbbVie',
                            4: 'Accenture',
                            5: 'Activision',
                            6: 'Acuity Brands',
                            7: 'AIG'},
                   'Frequency': {0: 0, 1: 0, 2: 0, 3: 0, 4: 0, 5: 0, 6: 0, 7: 10}})

df['Frequency'] = df['Name'].map(c)
print(df)

收益率

^{pr2}$

我向df添加了一行以显示一个非常重要的结果。在

当c中没有对应的键时，Series.map(c)会使序列保持独立。因此，只有在c中具有对应键的行才会被更新。在

相关问题更多 >

编程相关推荐

热门问题

热门文章