Pandas DataFrame索引中的None
我正在把一个SQL查询的结果读入一个数据框(dataframe),并把其中一列作为这个数据框的索引。问题是,这个查询没有过滤掉空值(null),所以生成的数据框中有些行的索引是None。我能想到几种解决办法,但我想知道有没有现成的pandas代码可以处理这个问题,比如:
import pandas as pd
pd.Index().dropna()
我知道这个方法不行 :-) 我试过了。还有其他办法吗?
1 个回答
3
我建议你在删除掉缺失值(NA值)之后再设置索引。
cnn = get_db_connection()
sqlqry = "select * from table"
nacols = ['Col_with_NAs']
indexcols = ['Col_with_NAs', 'othercol1', 'othercol2']
df = pandas.read_sql(sqlqry, cnn).dropna(subset=nacols).set_index(indexcols)