我有一些文本文件要加载到python代码中,但txt文件的格式不适合
以下是它包含的内容:
SEQ MSSSSWLLLSLVAVTAAQSTIEEQAKTFLDKFNHEAEDLFYQSSLASWNY
SS3 CCCHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
95024445656543114678678999999999999999888889998886
SS8 CCHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
96134445555554311253378999999999999999999999999987
SA EEEbBBBBBBBBBBbEbEEEeeEeBeEbBEEbbEeBeEbbeebBbBbBbb
41012123422000000103006262214011342311110000030001
TA bhHHHHHHHHHHHHHgIihiHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
00789889988663201010099999999999999999898999998741
CD NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
54433221111112221122124212411342243234323333333333
我想将其转换为panda Dataframe,将SEQ SS4 SA TA CD SS8作为Dataframe的列,并将其旁边的行作为行。 像这样:
我尝试了pd.read_csv
,但它没有给我想要的结果
谢谢大家!
您可以使用此脚本将.txt文件加载到DataFrame并将其另存为csv文件:
保存此CSV:
要使用pandas.read_csv()方法读取文本文件,文本文件应包含用逗号分隔的数据
台阶
注意:此解决方案适用于第一列中省略值的任意(包括零,当然不太多)连续行
代码
结果
然后可以使用
df_ans.to_csv()
保存生成的数据帧相关问题 更多 >
编程相关推荐