我有一个单词栏:
> print(df['words'])
0 [awww, thats, bummer, shoulda, got, david, car...
1 [upset, that, he, cant, update, his, facebook,...
2 [dived, many, time, ball, managed, save, rest,...
3 [whole, body, feel, itchy, like, it, on, fire]
4 [no, it, not, behaving, at, all, im, mad, why,...
5 [not, whole, crew]
另一个情感栏是每个单词的“情感”值:
> print(sentiment)
abandon -2
0 abandoned -2
1 abandons -2
2 abducted -2
3 abduction -2
4 abductions -2
5 abhor -3
6 abhorred -3
7 abhorrent -3
8 abhors -3
9 abilities 2
...
对于df['words']
中的每一行单词,我想总结它们各自的情感值。对于感情中不存在的词语,等于0。你知道吗
到目前为止,我的情况是:
df['sentiment_value'] = Sum(df['words'].apply(lambda x: ''.join(x+x for x in sentiment))
预期结果
print(df['sentiment_value'])
0 -5
1 2
2 15
3 -6
4 -8
...
如果将分数作为一个系列,以单词作为标签:
然后您可以查看列表的分数:
所以应用的方法是:
如果需要支持缺少的单词(不在s中),可以使用reindex:
如果第二列的字符串中有值,则需要首先通过转换过滤数据 一栏变成两栏
然后从情绪栏中找到情绪指数,从情绪值栏中得到值
相关问题 更多 >
编程相关推荐