我有一个大的表文件(大约2GB),它包含一个距离矩阵,该矩阵由它的第一列索引。它的行看起来像
A 0 1.2 1.3 ...
B 1.2 0 3.5 ...
C 1.5 0 4.5 ...
但是,我只需要保留一小部分行。如果给我一个需要保留的索引列表,那么将这个文件读入数据帧的最佳和最快的方法是什么。现在,我正在使用
distance_matrix = pd.read_table("hla_distmat.txt", header = None, index_col = 0)[columns_to_keep]
读取文件,但这会遇到read_table
命令的内存问题。有没有一种更快更节省内存的方法?谢谢。你知道吗
需要^{} 参数如果需要筛选列和
skiprows
对于筛选行,必须指定哪些列必须由list
或range
或np.array
删除:示例:(在实数数据中省略} )
sep
参数,sep='\t'
默认为^{使用^{} 的更一般的解决方案:
相关问题 更多 >
编程相关推荐