我试图解析页面中存在的所有查询字符串,以便使用该查询字符串可以导航到特定页面。我尝试这样做的代码如下
import requests
from bs4 import BeautifulSoup
from datetime import datetime
import datetime
import dateutil.parser
import time
import pytz
"""python espncricinfo library module https://github.com/dwillis/python-espncricinfo """
from espncricinfo.match import Match
from espncricinfo.exceptions import MatchNotFoundError, NoScorecardError
"""----time-zone-calculation----"""
time_zone = pytz.timezone("Asia/Kolkata")
datetime_today = datetime.datetime.now(time_zone)
datestring_today = datetime_today.strftime("%Y-%m-%d")
"""------URL of page to parse-------with a date of today-----"""
url = "http://www.espncricinfo.com/ci/engine/match/index.html?date=datestring_today"
"""eg. url = http://www.espncricinfo.com/ci/engine/match/index.html?date=2018-02-12"""
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
""""------parsing for matchno------"""
match_no = [x['href'].split('/',4)[4].split('.')[0] for x in
soup.findAll('a', href=True, text='Scorecard')]
for p in match_no:
""" where p is a match no, e.g p = '1122282'"""
m = Match(p)
m.latest_batting
print(m.latest_batting)
当我打印match\ u no时,我得到输出:
['8890/scorecard/1118760/andhra-vs-tamil-nadu-group-c-vijay-hazare-trophy-2017-18/', '8890/scorecard/1118743/assam-vs-odisha-group-a-vijay-hazare-trophy-2017-18/', '8890/scorecard/1118745/bengal-vs-delhi-group-b-vijay-hazare-trophy-2017-18/', '8890/scorecard/1118763/chhattisgarh-vs-vidarbha-group-d-vijay-hazare-trophy-2017-18/']
这个页面(http://www.espncricinfo.com/ci/engine/match/index.html?date=datestring_today)包含了当天发生的所有游戏的匹配号,我想删掉它得到匹配号,它是7位数字[11187431118743.1118745….],我怎么做?所以我可以使用这个匹配把它传递给match(),这样我就可以得到那天发生的特定匹配的细节。 PS如果新的一天没有匹配,那么match\ u no返回none。你知道吗
首先,你的代码很难阅读。你需要让你的代码呼吸,让它吸引其他人阅读。你知道吗
第二,引发问题的原因可能是:
它也很难阅读。从URL解析匹配id有更好、更可读的方法。你知道吗
这是一个应该起作用的例子。我确定了比赛的临时日期:
现在,我没有你在这里使用的所有lib,但这应该给你一个如何做的想法。你知道吗
再一次,我的建议是空行是你的朋友。他们肯定是读者的朋友。让你的代码“呼吸”。你知道吗
相关问题 更多 >
编程相关推荐