我有一个数据帧,有多个列携带浮点值。在
df = pd.DataFrame({
"v0": [0.493864,0.378362,0.342887,0.308959,0.746347],
"v1":[0.018915,0.018535,0.019587,0.035702,0.008325],
"v2":[0.252000,0.066746,0.092421,0.036694,0.036506],
"v3":[0.091409,0.103887,0.098669,0.112207,0.043911],
"v4":[0.058429,0.312115,0.342887,0.305678,0.103065],
"v5":[0.493864,0.378362,0.338524,0.304545,0.746347]})
我需要在df中创建另一个列result,方法是比较df['v0']
中每一行的值与后续列v1-v5中的行的值。在
我需要的是:
v0 v1 v2 v3 v4 v5 Result
0 0.493864 0.018915 0.252000 0.091409 0.058429 0.493864 1
1 0.378362 0.018535 0.066746 0.103887 0.312115 0.378362 1
2 0.342887 0.019587 0.092421 0.098669 0.342887 0.338524 1
3 0.308959 0.035702 0.036694 0.112207 0.305678 0.304545 0
4 0.746347 0.008325 0.036506 0.043911 0.103065 0.746347 1
我尝试过很多方法,包括 This link 和 This link
但我要求的任务似乎不可行。 这几天以来我一直在努力。我的原始数据集有60000多行。请推荐最好最快的方法
对每个人来说,这个问题已经解决了。感谢那些花时间回复我的人。作为一个业余程序员,看到我的问题得到解答真的很振奋人心。 由于@coldspeed,最终解决方案如下所示
JUPYTER NOTEBOOK SCREENSHOT
处理浮点比较的更好的解决方案是将
np.isclose
与广播一起使用:在处理浮点时,不要使用基于相等的比较,因为浮点可能不准确。见Is floating point math broken?
相关问题 更多 >
编程相关推荐