如何从最后一列中剥离浮动，该列由第一列中的名称列出/标记？

3条回答

网友

1楼 · 编辑于 2024-06-09 12:49:00

您可以使用regex提取浮点数

例如：

from re import search

file = open('file.txt', mode = 'r')

floats = list()

for _ in file.readlines():
    if result := search(r"(\d*\.\d*)", _):
        floats.append(result.group(1))

print(floats)

输出：

['72.4', '76.0', '79.1', '75.6', '71.2', '71.4', '69.2', '65.2', '62.8', '61.4', '64.0', '67.5', '69.4', '69.5', '70.1', '71.3', '71.5', '69.8', '45.2', '45.3', '45.1', '44.4', '43.9', '44.9', '43.8', '42.1']

更新：

你可以这样做来获取字典中的所有信息

from re import search

file = open('file.txt', mode = 'r')

floats = dict()

for _ in file.readlines():
    if result := search(r"(\w+) - (\d+:\d+) - (\d*\.\d*)", _):
        data = {
            'name': result.group(1),
            'time': result.group(2),
            'value': result.group(3),

        }
        if result.group(1) not in floats:
            floats[result.group(1)] = [data]
        else:
            floats[result.group(1)].append(data)

print(floats)

输出：

{'Thermometer1': [{'name': 'Thermometer1', 'time': '22:00', 'value': '72.4'}, {'name': 'Thermometer1', 'time': '22:01', 'value': '76.0'}, {'name': 'Thermometer1', 'time': '22:02', 'value': '79.1'}, {'name': 'Thermometer1', 'time': '22:03', 'value': '75.6'}, {'name': 'Thermometer1', 'time': '22:04', 'value': '71.2'}, {'name': 'Thermometer1', 'time': '22:05', 'value': '71.4'}, {'name': 'Thermometer1', 'time': '22:06', 'value': '69.2'}, {'name': 'Thermometer1', 'time': '22:07', 'value': '65.2'}, {'name': 'Thermometer1', 'time': '22:08', 'value': '62.8'}, {'name': 'Thermometer1', 'time': '22:09', 'value': '61.4'}, {'name': 'Thermometer1', 'time': '22:10', 'value': '64.0'}, {'name': 'Thermometer1', 'time': '22:11', 'value': '67.5'}, {'name': 'Thermometer1', 'time': '22:12', 'value': '69.4'}], 'Thermometer2': [{'name': 'Thermometer2', 'time': '22:01', 'value': '69.5'}, {'name': 'Thermometer2', 'time': '22:02', 'value': '70.1'}, {'name': 'Thermometer2', 'time': '22:03', 'value': '71.3'}, {'name': 'Thermometer2', 'time': '22:04', 'value': '71.5'}, {'name': 'Thermometer2', 'time': '22:05', 'value': '69.8'}], 'Hygrometer1': [{'name': 'Hygrometer1', 'time': '22:04', 'value': '45.2'}, {'name': 'Hygrometer1', 'time': '22:05', 'value': '45.3'}, {'name': 'Hygrometer1', 'time': '22:06', 'value': '45.1'}], 'Hygrometer2': [{'name': 'Hygrometer2', 'time': '22:04', 'value': '44.4'}, {'name': 'Hygrometer2', 'time': '22:05', 'value': '43.9'}, {'name': 'Hygrometer2', 'time': '22:06', 'value': '44.9'}, {'name': 'Hygrometer2', 'time': '22:07', 'value': '43.8'}, {'name': 'Hygrometer2', 'time': '22:08', 'value': '42.1'}]}

网友

2楼 · 编辑于 2024-06-09 12:49:00

您可以使用pandas高效地执行此操作：

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: df = pd.read_csv('a.txt', delimiter='-', header=None)

In [4]: df.groupby(0)[[2]].agg([np.mean, np.std])
Out[4]:
                       2
                    mean       std
0
Hygrometer1    45.200000  0.100000
Hygrometer2    43.820000  1.056882
Thermometer1   69.630769  5.397898
Thermometer2   70.440000  0.904434

现在您可以执行数字3&；4根据这一数据

网友

3楼 · 编辑于 2024-06-09 12:49:00

如果不想使用库，请执行以下操作：

我假设您已将文件内容加载到名为data的变量中

sensors = {}
lines = [line for line in data.split('\n') if line] # filter out empty lines
for line in lines: # itterate over each line
    elements = line.split(' ') # split the line by spaces
    sensor_name = elements[0] # the first of the elements is the senosr's name
    value = float(elements[-1]) # the last of the elements is the data
    # add the data to a list in a dict according to the sensor name
    if sensor_name in sensors.keys() 
        sensors[sensor_name].append(value)
    else:
        sensors[sensor_name] = [value]

这将产生一个列表字典，其中键是传感器的名称

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从最后一列中剥离浮动，该列由第一列中的名称列出/标记？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >