试图从多个数据列表中保留每种数据的单个数据标签

2024-04-19 02:27:40 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我试图使用的代码的一部分。这个程序会遍历许多文件,我需要它为每个道路只捕获一个道路名称。每个文件有数千行,我只想让它从每个输出一个道路名称。你知道吗

每个道路名称看起来都像C0XXXXX,但当然还有许多变体,如C000044、C000256、C000422等等:

我是新来抓独特的价值观,但这里是代码

    def parser_rut_data(setter):
        import numpy as np
        for col in setter.parse_list[0:]:
            route = col[6]            
        yield np.unique(route)

这是输入的走廊是C000001的输出:

['0' '1' 'C']
['0' '1' 'C']
['0' '1' 'C']
['0' '1' 'C']

下面是输入数据的一个简短示例,它是一个文本文件:

08/25/2014,C000010,ASC,I,1,0.0,0.1,0.1,0.14,0.04,0.39,0.22,211,160,186,47,29.663843,-111,-16.907026,3433,0,26.5,12:5

Tags: 文件代码程序名称npcol变体route
1条回答
网友
1楼 · 发布于 2024-04-19 02:27:40

对你有用吗?这不使用numpy,只extacts您的cxxxxx代码。你知道吗

import re
s = re.compile("C[0-9]+")
ll = []
with open("myfile") as f1:

    for line in f1:

         temp = s.search(line);

         if temp:
            ll.append(temp.group())

你还没有告诉我们,一旦代码被提取出来,你到底想对它做什么。但是如果我的解释是正确的,那么您似乎正在从检索到的代码中打印出所有“唯一”的数字。在这种情况下

ss = sorted(set(ll))

这将为您提供列表中唯一的道路编号。你知道吗

相关问题 更多 >