在Python中，如何将略过的列表项转换为字符串？

import mechanize from bs4 import BeautifulSoup as BS import urllib2 import bleach import re import datetime as dt def cleanhtml(raw_html): cleanr =re.compile('<.*?>') cleantext = re.sub(cleanr,'', raw_html) return cleantext br = mechanize.Browser() br.set_handle_robots(False) br.addheaders = [("User-agent", "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.2.13) Gecko/20101206 Ubuntu/10.10 (maverick) Firefox/3.6.13")] sign_in = br.open('https://www.mturk.com/mturk/beginsignin') br.select_form(name="signIn") br["email"] = 'xxxx' br["password"] = 'xxxxx' logged_in = br.submit() mturk = br.open("https://www.mturk.com/mturk/status") soup = BS(mturk.read()) date_column_values_raw = soup.findAll("td", "statusDateColumnValue") date_column_values = bleach.clean(date_column_values_raw, strip=True) date_column_values = cleanhtml(date_column_values)

1条回答

网友

1楼 · 发布于 2024-04-25 21:13:00

似乎您的date_values“list”根本不是一个列表，而只是一个多行字符串。你知道吗

date_values = """[
Apr 6, 2015
, 
Apr 5, 2015
, 
Apr 4, 2015
, 
Apr 3, 2015
]"""

您可以使用str.split()分割该字符串，但不能在for循环中这样，您将尝试分割每个字符！相反，试试这个列表。你知道吗

date_list = [s.strip() for s in date_values[1:-1].split("\n,")]

在这里，[1:-1]去掉了[和]，然后用一个新行和逗号分开（单独两个都不行），最后是strip和空格。你知道吗

或者先按行拆分，然后将去掉空白后剩下一个以上字符的所有行：

date_list = [s for s in map(str.strip, date_values.splitlines()) if len(s) > 1]

现在，date_list是['Apr 6, 2015', 'Apr 5, 2015', 'Apr 4, 2015', 'Apr 3, 2015']。然后可以使用^{} and ^{}重新格式化日期，例如：

import time
for date in date_list:
    d = time.strptime(date, "%b %d, %Y")
    date2 = time.strftime("%Y-%m-%d", d)
    print date, " >", date2

输出：

Apr 6, 2015  > 2015-04-06
Apr 5, 2015  > 2015-04-05
Apr 4, 2015  > 2015-04-04
Apr 3, 2015  > 2015-04-03

相关问题更多 >

编程相关推荐

热门问题

热门文章