如何获取列中的某些数据？

data.loc[(data['play_type'] == 'pass') & (data['down'] <= 4)].groupby(by='passer_player_name')[['epa']].mean() passer_index = data.loc[(data['play_type'] == 'pass') & (data['down'] <= 4)].groupby(by='passer_player_name')[['epa', 'success','yards_gained']].mean() passer_index['attempts'] = data.loc[(data['play_type'] == 'pass') & (data['down'] <= 4)].groupby(by='passer_player_name')['epa'].count()

epa success yards_gained attempts passer_player_name L.Jackson 0.336 0.48 6.9 335 K.Cousins 0.295 0.50 7.1 363 P.Mahomes 0.285 0.50 7.4 368

1条回答

网友

1楼 · 发布于 2024-05-12 16:14:22

为团队名称创建一个映射，如下所示：

r = {'K.Murray': 'ARI',
 'M.Ryan': 'ATL',
 'L.Jackson': 'BAL',
 'J.Allen': 'BUF',
 'K.Allen': 'CAR',
 'M.Trubisky': 'CHI',
 'A.Dalton': 'CIN',
 'B.Mayfield': 'CLE',
 'D.Prescott': 'DAL',
 'D.Lock': 'DEN',
 'D.Blough': 'DET',
 'A.Rodgers': 'GRE',
 'D.Watson': 'HOU',
 'J.Brissett': 'IND',
 'N.Foles': 'JAC',
 'P.Mahomes': 'KAN',
 'P.Rivers': 'LOS',
 'J.Goff': 'LOS',
 'R.Fitzpatrick': 'MIA',
 'K.Cousins': 'MIN',
 'T.Brady': 'NEP',
 'D.Brees': 'NOS',
 'D.Jones': 'NYG',
 'S.Darnold': 'NYJ',
 'D.Carr': 'OAK',
 'C.Wentz': 'PHI',
 'D.Hodges': 'PIT',
 'J.Garoppolo': 'SAN',
 'R.Wilson': 'SEA',
 'J.Winston': 'TAM',
 'R.Tannehill': 'TEN',
 'D.Haskins': 'WAS'}

然后可以这样合并：

data['team_names'] = data.index.map(r)

输出：

                      epa  success  yards_gained  attempts team_names
passer_player_name                                                        
L.Jackson           0.336     0.48           6.9       335        BAL
K.Cousins           0.295     0.50           7.1       363        MIN
P.Mahomes           0.285     0.50           7.4       368        KCC

我写了一个html scraper，建议我可以修改它来帮助您，它从https://fantasyfootballers.org/rb-running-back-nfl-stats/中获取所有快速的信息。只要#Look for table部分有正确的“table”索引，就可以刮除站点上的任何表，因为通常在要获取的数据之前有几个表，所以可以在其他站点上尝试。我用它从维基百科上为你得到了QB，行必须是table=汤。全部找到（'表'）[0]

import requests
import csv, re
from bs4 import BeautifulSoup

#Main function
def getNFLContent(link, filename):
    #Request content
    result1 = requests.get(link)

    #Save source in var
    src1 = result1.content

    #Activate soup
    soup = BeautifulSoup(src1,'lxml')

    #Look for table
    table = soup.find_all('table')[1]

    #Save in csv
    with open(filename,'w',newline='') as f:
        writer = csv.writer(f)
        for tr in table('tr'):
            #print(tr)
            row = [t.get_text(strip=True)for t in tr(['td','th'])]
            writer.writerow(row)


def abrvname(x):
   initial = x[0].capitalize()
   lnamepat = r'(\w*?$)'
   lname = re.search(lnamepat, x).groups()[0]
   return initial + '.' + lname

link = 'https://fantasyfootballers.org/rb-running-back-nfl-stats/'
filename='rbs.csv'
getNFLContent(link, filename)
df = pd.read_csv('rbs.csv')
df.insert(loc=1, column='abr_name', value=df.Name.apply(abrvname))

相关问题更多 >

编程相关推荐

热门问题

热门文章