从excel到txt单独的行

2024-05-16 18:45:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个程序,我把一个excel文件导出到.txt,我必须把这个.txt文件导入我的程序。主要目标是从每一行中提取相同的部分,但问题是在.txt文件中,excel的行被制成一个没有/n的巨大字符串。您知道程序中是否有方法将它们分开,如果有,我该怎么做?你知道吗

我正在使用的文件可以在http://we.tl/YtixI1ck6l中下载 到目前为止我一直在尝试

ppi = []

for line in read_text:
    prot_interaction = line[0:14]
    ppi.append(prot_interaction)

result_ppi = []

for line in read_text:
    result = line[-1]
    result_ppi.append(result)

但由于它不是在一行格式,而只是在一个单一的我没有得到任何好的结果。你知道吗


Tags: 文件textin程序txt目标forread
2条回答

以该文件为例,使用csv module来解析它。你知道吗

示例:

import csv

with open('/tmp/Model_Oralome.txt', 'rU') as f:
    reader=csv.reader(f, delimiter="\t")
    for row in reader:
        print row[0]

印刷品:

ppi
C4FQL5;Q08426
C8PB60;D2NP19
P40189;Q05655
P22712;Q9NR31
...
P05783;P02751
B5E709;D2NPK7
Q8N7J2;Q9UKZ4

(顺便说一句,这个特定文件可能存在的问题是,行终端是仅来自Mac Classic OS的CR。在Python中,您可以在打开文件时使用Universal Newline模式来解决这个问题……)

Excel正在导出带有回车符(\r)而不是换行符(\n)的文本文件。你知道吗

ppi = []
with open("Model_Oralome.txt",'r') as f:
    lines = f.readlines()
    lines = lines[0].split('\r')

从这里可以遍历每一行。因为看起来您需要第一列的值:

lines = lines[1:]
for line in lines:
    content = line.split('\t')
    ppi.append(content[0])

相关问题 更多 >