是否可以使用genfromtxt
从numpy
库中排除所有字符串列?在
我有一个csv文件,其中包含来自机器学习网站的此类数据。在
antelope,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
目前在我的设置np.genfromtxt(path, dtype=float, names=None,delimiter=',')
中,它将字符串标记为nan
,这是有意义的,但我想排除所有字符串列。在
我知道有usecols=(1,2)
参数,但这将要求我指定这个或我需要使用的每个数据集。我更喜欢“排除”方法而不是包含方法。在
我应该使用不同的方法还是自己处理每一行?在
pandas有一个
DataFrame.select_dtypes
方法,可以让您非常轻松地完成这项工作。您可以直接(如下例所示)或使用各种读取方法之一(例如,pd.read_csv()
)将数据获取到数据帧中:您可以在阅读后用
nan
过滤出列。在所有行中都有}的列。其他测试也可以。在
^{pr2}$nan
的列;或者我可以使用.any
来表示任何{另一个想法是用
dtype=None
读取一次文件,让genfromtxt
为每一列选择数据类型。可以对生成的复合数据类型进行筛选,以查找所需类型的列。在还可以筛选数据类型以收集正确类型的列名
虽然将这个结构化数组合并为一个具有单个dtype(int)的2d数组,但是有点麻烦(如果需要,我可以详细介绍)。在
相关问题 更多 >
编程相关推荐