将表导入DataFrame并将列组设置为lis

2024-06-07 07:01:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个表格(制表符分隔的.txt文件),格式如下:

  • 每一行都是一个条目
  • 第一行是标题
  • 前5列是简单的数字参数
  • 第7列之后的所有列都应该是一个值列表

我的问题是如何导入和创建一个数据帧,其中最后一列包含一个值列表?你知道吗

问题1

标题(第一行)是“shorter”,只包含一些列的名称。第7个之后的所有值都没有标题(因为它应该是一个列表)。如果按原样导入文件,则会混淆导入函数

例如,如果我导入如下

df = pd.read_table( path , sep="\t")

所创建的DataFrame只有与第一行中的元素一样多的列。此外,分配的数据值不匹配。你知道吗

问题2

真正让我困惑的是,如果我在Excel中打开.txt并将其保存为制表符分隔的格式(不做任何更改),那么我就可以毫无问题地导入它,同时也可以导入标题:没有标题的列只会得到一个“Unnamed XYZ”标记。 为什么在Excel中保存会改变它?使用Note++我只能看到一个区别:原始的.txt是“Unix(LF)”格式,而保存在Excel中的是“Windows(crlf)”。两个都是UTF-8,所以我不明白这怎么会是个问题?!?你知道吗

不过,从这里我可以操作数据,并尝试收集我想要的所有列,并将它们列成一个列表。不过,我希望有一个更优雅,更快的方法来做这件事。你知道吗

下面是.txt文件的屏幕截图

enter image description here

谢谢你


Tags: 文件数据函数txt名称标题列表参数