来自fi的python数据帧

2024-05-26 20:47:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从一个文件创建一个dataframe对象。文件看起来与此类似

Gibberish Header1
Gibberish Header2
Gibberish Header3
Gibberish Header4 (etc)...
TAG THING_I_WANT_AS_COLUMN_NAME Column1
1.0  # I'll want this index as data 1 
1.2  # I'll want this index as data 2 
1.3  etc
TAG THING_I_WANT_AS_COLUMN_NAME Column2
1.1
1.1
1.7

我希望数据帧看起来像:

       Column_1    Column_2 
data1  1.0         1.1
data2  1.2         1.1
data3  1.3         1.7

有没有一种方法可以在不编写函数的情况下将其转换为可以直接写入DataFrame类的字典?我在考虑可能的重塑,但我真的不确定如何在我的情况下工作。我知道将其写入dict是一件容易的事情,但是这些文件可能相当大,因此它可能会大大降低我的速度,甚至不可能使用我的RAM。你知道吗

任何帮助,哪怕是正确方向的一点,都将不胜感激。你知道吗

谢谢!你知道吗


Tags: 文件namedataindexastagetccolumn
1条回答
网友
1楼 · 发布于 2024-05-26 20:47:42

当从头开始创建数据帧时,我通常会。。。 作为pd导入

# create array for each column
col1 = [float(35*x) for x in xrange(10)]
col2 = [float(220*x) for x in xrange(10)]

dict = {'col1_name': col1, 'coll2_name': col2}
df = pd.DataFrame(dict)

就像其他人说的,你必须先解析数据。在没有看到实际数据的情况下,很难说到底是什么。你可以在文件中的每一行上循环,忽略标题,一旦你点击了列名和内容的行,设置一个标志。然后可以开始向数组追加值。一旦你在数组中得到了两组数字,像我在上面做的那样建立一个字典,你就有了一个数据帧!你知道吗

相关问题 更多 >

    热门问题