如何在不导致属性错误的情况下按值对列表进行分组

fields = ("Position", "Category", "Name", "Team", "Points") Results = namedtuple('CategoryResults', fields) def csv_to_tuple(path): with open(path, 'r', errors='ignore') as file: reader = csv.reader(file) for row in map(Results._make, reader): yield row

Clubs = [] Club_Points = [] for Names, Club in groupby(moutputA, lambda x: x[3]): for Teams in Names: Clubs.append(list(Teams)) for Club, Points in groupby(moutputA, lambda x: x[4]): for Point in Clubs: Club_Points.append(list(Point)) print(Clubs)

3条回答

网友

1楼 · 编辑于 2024-05-29 00:20:27

只要使用pandas，所有这些都会变得更容易。查看下面的代码

import pandas as pd
import numpy as np

df = pd.read_csv(input_path)

teams = list(set(df['Team'])) # unique list of all the teams
num_teams = len(teams)

points = np.empty(shape=num_teams)
avg_points = np.empty(shape=num_teams)
num_riders = np.empty(shape=num_teams)

for i in range(num_teams):
    # find all rows where the entry in the 'Team' column
    # is the same as teams[i]
    req = df.loc[df['Team'] == teams[i]]
    points[i] = np.sum(req['Points'])
    num_riders[i] = len(req)
    avg_points[i] = point[i]/num_riders[i]

dict_out = {
    'Team':teams,
    'Points':points,
    'AvgPoints':avg_points,
    'NumOfRiders':num_riders
}
df_out = pd.DataFrame(data=dict_out)
df_out.to_csv(output_path)

网友

2楼 · 编辑于 2024-05-29 00:20:27

如果data.csv包含：

Position,Category,Name,Team,Points
1,A,James,Team 1,100
2,A,Mark,Team 2,95
3,A,Tom,Team 1,90

然后这个脚本：

import csv
from collections import namedtuple
from itertools import groupby
from statistics import mean

fields = ("Position", "Category", "Name", "Team", "Points")
Results = namedtuple('CategoryResults', fields)

def csv_to_tuple(path):
    with open(path, 'r', errors='ignore') as file:
        next(file) # skip header
        reader = csv.reader(file)
        for row in map(Results._make, reader):
            yield row

moutputA = sorted(csv_to_tuple("data.csv"), key=lambda k: k.Team)

out = []
for team, group in groupby(moutputA, lambda x: x.Team):
    group = list(group)
    d = {}
    d['Team'] = team
    d['Points'] = sum(int(i.Points) for i in group)
    d['AvgPoints'] = mean(int(i.Points) for i in group)
    d['NumOfRider'] = len(group)
    out.append(d)


with open('data_out.csv', 'w', newline='') as csvfile:
    fieldnames = ['Team', 'Points', 'AvgPoints', 'NumOfRider']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    writer.writeheader()
    for row in out:
        writer.writerow(row)

产生data_out.csv：

Team,Points,AvgPoints,NumOfRider
Team 1,190,95,2
Team 2,95,95,1

LibreOffice的屏幕截图：

网友

3楼 · 编辑于 2024-05-29 00:20:27

这是一个开始。你应该能够想出如何从中得到你想要的

import csv, io
from collections import namedtuple
from itertools import groupby

data = '''\
Position,Category,Name,Team,Points
1,A,James,Team 1,100
2,A,Mark,Team 2,95
3,A,Tom,Team 1,90
'''

b = io.StringIO(data)
next(b)

fields = ("Position", "Category", "Name", "Team", "Points")
Results = namedtuple('CategoryResults', fields)


def csv_to_tuple(file):
    reader = csv.reader(file)
    for row in map(Results._make, reader):
        yield row


rows = sorted(list(csv_to_tuple(b)), key=lambda k: k[3])

for TeamName, TeamRows in groupby(rows, lambda x: x[3]):
    print(TeamName)
    TeamPoints = [row.Points for row in TeamRows]
    print(TeamPoints)
    print()

相关问题更多 >

编程相关推荐

热门问题

热门文章