好吧,我在研究这个ML问题,在这个问题中,我必须预测一张病假罚单被发给一个人的概率。我试图将ticket_id
设置为数据帧的索引,但是发生了一些奇怪的事情,我不知道为什么。你知道吗
import pandas as pd
import numpy as np
def blight_model():
train = pd.read_csv('train.csv', encoding = "ISO-8859-1")
test = pd.read_csv('readonly/test.csv', encoding = "ISO-8859-1")
address = pd.read_csv('readonly/addresses.csv', encoding = "ISO-8859-1")
"""X = data.iloc[:,0:33] #independent columns
y = data.iloc[:,-1] #target column i.e price range"""
common_cols_to_drop = ['agency_name', 'inspector_name', 'mailing_address_str_number',
'violator_name', 'violation_street_number', 'violation_street_name',
'mailing_address_str_name', 'admin_fee', 'violation_zip_code',
'state_fee', 'late_fee', 'ticket_issued_date', 'hearing_date', 'violation_description',
'fine_amount', 'clean_up_cost', 'disposition', 'grafitti_status',
'violation_code', 'city']
train_cols_to_drop = ['payment_status', 'payment_date', 'balance_due', 'payment_amount','compliance_detail', 'collection_status'] + common_cols_to_drop
train = train.drop(train_cols_to_drop, axis=1).set_index('ticket_id')
train = train[np.isfinite(train['compliance'])]
return train.head()
我得到的结果是这个?这是怎么回事?你知道吗
它以这种方式显示,这样您就知道它是一个索引。你知道吗
您得到它是因为(将其设置为索引):
在此行中:
相关问题 更多 >
编程相关推荐