python拆分字符串而不剪切单词

网友

1楼 · 编辑于 2024-05-16 12:52:22

可以使用str.split()将字符串拆分为单词。如果不提供除数器，它将默认使用空格并返回字符串中的单词。请参阅Python官方文档here。在

网友

2楼 · 编辑于 2024-05-16 12:52:22

这会有帮助吗？在

str = "D  Staph. aureus  Ps. aeruginosa E. coli ATCC Ser.             Asp.           
Cand. albicans"
list = []

for s in str.split():
    if "." in s:
        list.append(s)
    elif list:
        list[-1] = f"{list[-1]} {s}"

print(list)

输出：

^{pr2}$

这将在空白处拆分字符串，然后遍历结果数组并在列表中启动一个新条目（如果单词包含“.”），并将该索引追加到列表中，直到遇到下一个带有“.”的单词。在

我看不到一条规则可以应用于所有行，但通过以下两个示例，我们可以做到：

line1 = "D  Staph. aureus  Ps. aeruginosa E. coli ATCC Ser.             Asp.           Cand. albicans"
line2 = "a  ATCC 6538,     ATCC 9027, Ps. 8739, Ent.     marcescens     brasiliensis   ATCC 10231,"

for line in (line1, line2):
    if line[0] == "D":
        list = []
        for s in line.split():
            if "." in s:
                list.append(s)
            elif list:
                list[-1] = f"{list[-1]} {s}"
        print(list)

    if line[0] == "a":
        count = 0
        list = []
        for s in line2[3:]:
            if count % 15 == 0 or count == 0:
                list.append(s)
                if len(list) > 1: list[-2] = list[-2].rstrip()
            else:
                list[-1] = f"{list[-1]}{s}"
            count += 1
        print(list)

输出：

['Staph. aureus', 'Ps. aeruginosa', 'E. coli ATCC', 'Ser.', 'Asp.', 'Cand. albicans']
['ATCC 6538,', 'ATCC 9027, Ps.', '8739, Ent.', 'marcescens', 'brasiliensis', 'ATCC 10231,']

看起来很可怕，但希望能给你一些建议。：）

网友

3楼 · 编辑于 2024-05-16 12:52:22

数据似乎是用制表符分隔的，但制表符替换为空格。在

我能发现的唯一模式是列之间有多个空格值。如果这种情况下，如果有两个空格（例如作者键入错误），代码就会中断。在

使用最大列宽是有风险的。如果列的值很短（例如“one”、“two”），则会中断。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

python拆分字符串而不剪切单词

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >