我有一个表格(制表符分隔的.txt文件),格式如下:
我的问题是如何导入和创建一个数据帧,其中最后一列包含一个值列表?你知道吗
问题1
标题(第一行)是“shorter”,只包含一些列的名称。第7个之后的所有值都没有标题(因为它应该是一个列表)。如果按原样导入文件,则会混淆导入函数
例如,如果我导入如下
df = pd.read_table( path , sep="\t")
所创建的DataFrame
只有与第一行中的元素一样多的列。此外,分配的数据值不匹配。你知道吗
问题2
真正让我困惑的是,如果我在Excel中打开.txt并将其保存为制表符分隔的格式(不做任何更改),那么我就可以毫无问题地导入它,同时也可以导入标题:没有标题的列只会得到一个“Unnamed XYZ”标记。 为什么在Excel中保存会改变它?使用Note++我只能看到一个区别:原始的.txt是“Unix(LF)”格式,而保存在Excel中的是“Windows(crlf)”。两个都是UTF-8,所以我不明白这怎么会是个问题?!?你知道吗
不过,从这里我可以操作数据,并尝试收集我想要的所有列,并将它们列成一个列表。不过,我希望有一个更优雅,更快的方法来做这件事。你知道吗
下面是.txt文件的屏幕截图
谢谢你
目前没有回答
相关问题 更多 >
编程相关推荐