用obj在大Pandas分组中创造求和和和除法我有一个城市列表和一个虚拟变量。1表示存在欺诈订单,0表示订单有效。我想确定一个订单有多大比例是欺诈性的。在 因此,我试图: 按城市分组 把他们下的订单数加起来 然后确定百分之几的订单是欺诈的。在 ...2024-06-16 已阅读: n次
MemoryError:无法为具有形状(5844379795,)和数据类型int64的数组分配43.5 GiB我有一个大数据框,我正在尝试更新一列: 数据帧: 我想更新最后一列IsFraudsterStatus 我的代码: df= pd.concat(chunk_list,) def expand_ ...2024-06-16 已阅读: n次
ValueError:X每个样本有231个特征;预计1228下面是训练模型的脚本顶部(我使用的是逻辑回归): data_raw = pd.read_sql(sql,cnxn) pd.Series(data_raw.columns) pd.Series(da ...2024-06-16 已阅读: n次
键列具有重复的值。我正在尝试合并数据帧我想将CustomerMail上的DF1与DF2合并,这在两者中都很常见,但具有重复值。 DF1 customer_Email Fraud name_0 False name ...2024-06-16 已阅读: n次
datafram列列表中的Name属性我有一个示例数据框,如图所示 is_fraud|Domain_name|safe|fraud|Domain_count|fraud_prop ----------------------------- ...2024-06-16 已阅读: n次
如何使用列中的值组合创建数据帧好了,伙计们,这个很难 这个问题的主题是基于欺诈数据、规则和付款——我认为通过一点背景知识更容易描述我试图做什么 我有一个数据框架,它由accountid、金额、日期、欺诈等组成,还有一个名为rule ...2024-06-16 已阅读: n次
如何从Pandas数据帧中检索列值并检查条件Dataframe列类由2个值0和1组成。我想计算类0的行数和类1的行数 genuine_count=0 fraud_count=0 if credit_card_df['Class'] == 1: ...2024-06-16 已阅读: n次
Seaborn barplot,带y轴排序的条形图我想用y轴对seaborn图中的条形图进行排序,因此在本例中'Fraud Probability'按降序排列。我怎么能做到呢? 这是我的代码: plt.figure(figsize = (16,5)) ...2024-06-16 已阅读: n次
p中缺少Seaborn值你好,我试着用下面的代码创建一个seaborn的图,但是我在图中得到了0.00%的值 高度和总高度正确,但只有0.00值。 有什么想法吗? 谢谢 tmp = pd.crosstab(df_trans[ ...2024-06-16 已阅读: n次
PySpark:我如何修复这个UDF以将列表中的值替换为无值?错误:需要结构类型,但得到双精度我想用PySpark数据框中的None替换列表中的某些字符串值(nan_字符串)。dataframe包含类型为double、date和string的列。如何仅将UDF应用于字符串值,而不必编写额外的f ...2024-06-16 已阅读: n次
如何_从_两_列_ ( _标签_ 、 _文本_ ) _数据_源_开始_进行_文本_分类_ ?_我们收到第三方的虐待投诉。我以XML格式导出了大量的投诉,然后将它们编译成一个pandas DataFrame(),同时将电子邮件地址、主机名、url和IP地址清除如下。在 档案学习_数据.txt'由 ...2024-06-16 已阅读: n次
如何修正“ValueError”:级数的真值是模糊的。在python中使用a.empty、a.bool()、a.item()、a.any()或a.all()?我试图通过随机选择与少数阶级相等的多数阶级来解决阶级不平衡的问题 这是一个多类分类问题,我尝试过用不平衡类分布的子样本数据,但是我得到了一个布尔错误。我已经为类做了标签编码 no_of_frauds ...2024-06-16 已阅读: n次
rgmining-fraud-eagle 这个包提供了一个欺诈鹰算法的实现。这个 leman akoglu,等人引入了算法。在ICWSM 2013 有关详细信息,请参见the documents 信息。 安装 使用pip安装此软件包。 ...2024-06-16 已阅读: n次
durable持久性规则==持久性规则是一个多线程的微观框架,用于实时、一致和可伸缩的事件协调。使用持久性规则,您可以通过组合来自多个源的数据来推断更复杂的情况,从而跟踪和分析发生的事情(事件)的信息。a forw ...2024-06-16 已阅读: n次