读取pandas中不带标题的制表符分隔的数据

2024-05-14 13:16:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我在使用pandas打开不带标题的制表符分隔的数据时遇到问题。

我的测试数据(实际上包含200行,我显示的是前10行):

Tag19184    CTAAC   hffef   1   a   36  -   chr1    10006   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10012   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10018   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10024   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10030   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10036   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10042   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10048   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10054   0   36M 36
Tag45093    CTAAC   hffef   1   a   36  -   chr1    10060   0   36M 36

我的代码:

import pandas as pd
df = pd.read_csv('in_test.txt',sep='\t',header=None)
print df

但是,我得到了以下输出,我不认为我可以用来进一步处理数据(?)以下内容:

<class 'pandas.core.frame.DataFrame'>
Int64Index: 200 entries, 0 to 199
Data columns:
X.1     200  non-null values
X.2     200  non-null values
X.3     200  non-null values
X.4     200  non-null values
X.5     200  non-null values
X.6     200  non-null values
X.7     200  non-null values
X.8     200  non-null values
X.9     200  non-null values
X.10    200  non-null values
X.11    200  non-null values
X.12    200  non-null values
dtypes: int64(5), object(7)

tutorial here建议print df应该只给我相应的数据帧。我做错什么了?


Tags: 数据标题pandasdfnull制表符pdvalues
1条回答
网友
1楼 · 发布于 2024-05-14 13:16:58

我想你读对了,但是:

  1. 请看:change pandas 0.13.0 "print dataframe" to print dataframe like in earlier versions,这是熊猫在旧版本中所做的。所以,更新将解决这个问题。
  2. 您可以使用ipython notebook,其中DataFrames将显示为HTML表。
  3. 您可以使用df.head(5)(类似于rhead)获取前几行,以确保您的DataFrame是正确的。

相关问题 更多 >

    热门问题