Pandas功能：数据帧应用（）运行第一行twi

2024-05-14 10:05:48 发布

男 | 程序猿一只，喜欢编程写python代码。

我有两个版本的函数，它使用Pandas表示Python 2.7，逐行遍历inputs.csv。在

第一个版本在single column上使用Series.apply()，并按预期遍历每一行。在

第二个版本在multiple columns上使用DataFrame.apply()，由于某种原因，它读取了顶行两次。然后它继续执行其余的行而不重复。在

你知道为什么后者会把第一行读两遍吗？在

版本1–{} （读取第一行一次）

import pandas as pd
df = pd.read_csv(inputs.csv, delimiter=",")

def v1(x):
    y = x
    return pd.Series(y)
df["Y"] = df["X"].apply(v1)

版本2–{} （读取第一行两次）

^{pr2}$

print y：

v1(x):            v2(f):

    Row_1         Row_1
    Row_2         Row_1
    Row_3         Row_2
                  Row_3

Tags： columns csv 函数版本 pandas df column multiple

1条回答

网友

1楼 · 发布于 2024-05-14 10:05:48

这是设计的，如here和{a2}

apply函数需要知道返回数据的形状，以便智能地确定如何组合这些数据。应用是一种智能应用聚合、转换或筛选的快捷方式。你可以试着像这样分开你的函数来避免重复调用。在