我是Python的初学者(我是生物学家),我有一个文件,其中包含了一个特定软件的结果,我想使用Python解析结果。从下面的输出中我只想得到分数,并想把序列分成单个氨基酸。
编号得分顺序
1 0.273778 FFHH-YYFLHRRRKKCCNNN-CCCK---HQQ---HHKKHV-FGGGE-EDDEDEEEEEEEE-EE--
2 0.394647 IIVVIVVVVIVVVVVVVVVV-CCCVA-IVVI--LIIIIIIIIYYYA-AVVVVVVVAAAAV-AST-
3 0.456667 FIVVIVVVVIXXXXIGGGGT-CCCCAV -------------IVBBB-AAAAAA--------AAAA-
4 0.407581 MMLMILLLLMVVAIILLIII-LLLIVLLAVVVVVAAAVAAVAIIII-ILIIIIIILVIMKKMLA-
5 0.331761 AANSRQSNAAQRRQCSNNNR-RALERGGMFFRRKQNNQKQKKHHHY-FYFYYSNNWWFFFFFFR-
6 0.452381 EEEEDEEEEEEEEEEEEEEE-EEEEESSTSTTTAEEEEEEEEEEEE-EEEEEEEEEEEEEEEEE-
7 0.460385 LLLLLLLLMMIIILLLIIII-IIILLVILMMEEFLLLLILIVLLLM-LLLLLLLLLLVILLLVL-
8 0.438680 ILILLVVVVILVVVLQLLMM-QKQLIVVLLVIIMLLLLMLLSIIIS-SMMMILFFLLILIIVVL-
9 0.393291 QQQDEEEQAAEEEDEKGSSD-QQEQDDQDEEAAAHQLESSATVVQR-QQQQQVVYTHSTVTTTE-
从上表中,我想得到一个相同数字、分数但序列分开的表(柱状) 所以看起来应该是
^{pr2}$另一个表,表示第二列氨基酸
^{pr3}$第三表为氨基酸第三列,第4列氨基酸等第4列
提前感谢您的帮助
我不认为创建表格有用。
只需将数据放入一个经过调整的结构中,并使用一个函数来显示您在需要时所需的内容:
结果
^{pr2}$从你的例子来看,我想:
这是我的代码示例,它从
input.dat
读取数据并将结果写入result-column-<number>.dat
:本例中使用的值得注意的函数:
假设您已经打开了包含此数据的文件
f
,那么您的示例可以用以下方法复制:要拆分序列,您需要另外循环
^{pr2}$seq
中的字母:这将打印序列号并多次得分。我不确定你是不是想要那样。在
相关问题 更多 >
编程相关推荐