在Pandas中，如何计算给定另一列的一组值的概率？

import pandas as pd df = pd.DataFrame({'Weather': ['rain', 'fine', 'rain', 'fine', 'snow', 'fine', 'snow'], 'Skidding': ['skid', 'skid', 'no skid', 'no skid', 'skid', 'no skid', 'jackknife']})

counts = df.groupby('Weather')['Skidding'].value_counts() relative_probability = (counts['rain']['skid'] + counts['snow']['skid'] + counts['rain']['jackknife'] + counts['snow']['jackknife']) / (counts['fine']['skid'] + counts['fine']['jackknife'])

1条回答

网友

1楼 · 发布于 2024-04-29 13:59:24

您可以使用isin代替... in ... for ...理解；如果只需要末尾的数字，也不需要过滤数据帧，只需构建条件sum和{}：

rain_snow = df.Weather.isin(['rain', 'snow'])
fine = df.Weather.eq('fine')
skid = df.Skidding.isin(['skid', 'jackknife'])

(rain_snow & skid).sum()/(fine & skid).sum()
# 3

编程相关推荐

java有没有工具可以将zephyr转换为velocity模板？
java在安卓 studio中从JSON响应中获取值
jvm如何在Java中设计一个好的permgen空间字符串？
java如何防止Rest webservice使用被盗令牌进行身份验证
java无法遍历列表JSTL
找不到用于ResourceServerTokenServices的java Bean SpringSecurityOauth2
java子字符串替换问题
爪哇玻璃鱼3。十、以编程方式处理任意HTTPSession的终止
java如何检查输入是否为整数，并在最后添加一个命令来重新启动while循环？
引发java ical4j 1.0.6不可解析日期异常

相关问题更多 >

编程相关推荐

热门问题

热门文章