我正在尝试将两个数据帧中的列合并到一个数据帧中,以便构建训练和测试样本。我正在使用此链接的演练Towards Data Science,但我使用的是不同的excel电子表格
到目前为止,所有代码都工作正常,直到我尝试组合两个数据帧的列。下面的代码是我到目前为止的精简版本,但我相信我遗漏的所有代码都只是在探索数据。总而言之,我在Python之旅中还是一个新手,所以我不确定有多少代码是有益的,所以如果需要的话,我可以发布更多
除了最后一行之外,所有代码都正常工作,这给了我一个错误:无法强制转换为Series,长度必须是16:gived 14
有什么想法吗
import numpy as np
import pandas as pd
healthcare = pd.read_csv('/medical_clean.csv')
cols_cat_num = ['ReAdmis', 'Initial_admin', 'HighBlood', 'Stroke', 'Complication_risk', 'Overweight', 'Arthritis', 'Diabetes', 'BackPain', 'Anxiety', 'Allergic_rhinitis', 'Reflux_esophagitis', 'Asthma']
healthcare[cols_cat_num] = healthcare[cols_cat_num].astype('str')
healthcare_cat=pd.get_dummies(healthcare[cols_cat_num + ['HighBlood']], drop_first = True)
healthcare_num=['Population', 'VitD_levels', 'Income', 'Doc_visits', 'Full_meals_eaten', 'vitD_supp', 'Item1', 'Item2', 'Item3', 'Item4', 'Item5', 'Item6', 'Item7', 'Item8']
healthcare[healthcare_num]= healthcare[healthcare_num].astype('str')
finalhealth= healthcare_num + healthcare_cat
healthcare_cat
是一个数据帧,而healthcare_num
是一个列表。错误消息是由于无法使用这两个完全不同的对象执行加法而导致的,尽管Python试图“强制”您可以探索
pd.concat()
来组合数据帧相关问题 更多 >
编程相关推荐