我正在使用assign函数将一些新列添加到我的dataframe中,这些列是从数据库的现有列派生出来的。你知道吗
这是密码-
train2 = pd.read_excel('output1.xlsx')
X_train = (train2.assign(collegeGPA_new = np.power(2.0,(train2["10percentage"] + train2["12percentage"] + train2["collegeGPA"]))).head())
y_train = X_train.Salary
X_train = X_train.drop(['collegeGPA','CollegeTier','Salary','DOB','SalaryL'], axis=1)
这里,“train2”是我的原始数据框,“collegeGPA\u new”是新添加的列,“10percentage”、“12percentage”、“collegeGPA”、“Salary”、“DOB”、“SalaryL”是数据框的现有列。你知道吗
现在的问题是,我的数据帧在派生X_train之后惊人地从(3199628)收缩到(5628)。列车2具有形状(3199628),而X泷列车具有形状(5628)。其他几排去哪?这里有什么问题?你知道吗
你知道吗数据帧.head只返回数据帧的前N行,默认N为5。 这就是为什么X\ U列车只有5排。你知道吗
相关问题 更多 >
编程相关推荐