所以我从csv读取2D数组并将其转换为numpy数组,如下所示:
sheet = pd.read_csv('data.csv')
sheet_data = sheet.as_matrix()
我可以成功地将这个2D数组中的“N”和“Y”值分别替换为0和1。在
^{pr2}$但是,此数据集的第二列和第三列是格式为“%Y-%m-%d%H:%m:%S”的时间戳,但我不确定如何使用np.地点将值替换为自epoch以来的秒数。在
此外,其中一些值也被记录为NaN,但这两行都没有成功地将它们替换为0:
np.place(taxi_sheet_data, taxi_sheet_data == 'nan', 0)
np.place(taxi_sheet_data, taxi_sheet_data == float('NaN'), 0)
我该怎么做呢?在
表_数据中的第一项作为参考,如下所示:
[2 '2016-06-01 02:46:38' '2016-06-01 03:06:40' 0 1 -73.93058013916014
40.695178985595696 -74.00005340576173 40.72904586791992 1 5.24 19.5 0.5
0.5 6.24 0.0 nan 0.3 27.04 1 1.0]
目前没有回答
相关问题 更多 >
编程相关推荐