问题使用文件.DataFrame.assign

2024-06-16 11:33:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用assign函数将一些新列添加到我的dataframe中,这些列是从数据库的现有列派生出来的。你知道吗

这是密码-

train2 = pd.read_excel('output1.xlsx')
X_train = (train2.assign(collegeGPA_new = np.power(2.0,(train2["10percentage"] + train2["12percentage"] + train2["collegeGPA"]))).head())
y_train = X_train.Salary
X_train = X_train.drop(['collegeGPA','CollegeTier','Salary','DOB','SalaryL'], axis=1)

这里,“train2”是我的原始数据框,“collegeGPA\u new”是新添加的列,“10percentage”、“12percentage”、“collegeGPA”、“Salary”、“DOB”、“SalaryL”是数据框的现有列。你知道吗

现在的问题是,我的数据帧在派生X_train之后惊人地从(3199628)收缩到(5628)。列车2具有形状(3199628),而X泷列车具有形状(5628)。其他几排去哪?这里有什么问题?你知道吗


Tags: 数据函数数据库密码dataframenewtrain形状