为什么我无法从RSS订阅中获取日期并将其设定为我的Django模型?

2024-04-26 11:10:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用feed解析器从rss提要创建内容。是这样的:

import feedparser

def parse_rss(rss_url):
    return feedparser.parse(rss_url)

def generate_content_from_feed(feed):
    parsed_feed = parse_rss(feed.rss_url)

    for item in parsed_feed['items']:
        if not Content.objects.filter(link=item['link']).exists():
            content = Content.objects.create(
                title=item['title'],
                link=item['link'],
                description=item['description'],
                pub_date=item['published'],
                category=item['category'],
                feed=feed,
            )
            if item['enclosure']:
                content.media_url = item['enclosure']['url']
                content.media_type = item['enclosure']['type']
            content.save()

现在我不能完全确定上面的代码是否有效,因为我无法测试它。你知道吗

在我的型号.py,我有以下两种型号:

class Feed(models.Model):
    rss_url = models.URLField()

    def save(self, *args, **kwargs):
        super(Feed, self).save(*args, **kwargs)
        generate_content_from_feed(self) # Generating the content

class Content(models.Model):
    title = models.CharField(max_length=500)
    link = models.URLField()
    description = models.TextField()
    pub_date = models.DateTimeField(default=None)
    category = models.CharField(max_length=500, blank=True)
    media_url = models.URLField(blank=True) # Attached media file url
    media_type = models.CharField(max_length=50, blank=True)
    feed = models.ForeignKey(Feed, related_name='content_feed')

如果您想知道,在保存提要时,该提要中的内容将生成并保存为我的数据库中的内容对象。至少这是我想做的。但是,当我保存一个提要时,会出现如下错误:

ValidationError at /admin/myapp/feed/add/
[u"'Fri, 08 Apr 2016 14:51:02 +0000' value has an invalid format. It   must be in YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ] format."]

如何解决此问题?而且,我也不是专家,有人能告诉我我的generate\u content\u from\u feed方法是否有问题吗?谢谢。你知道吗


Tags: fromurl内容titleparsemodelsdeffeed
1条回答
网友
1楼 · 发布于 2024-04-26 11:10:45

也许有更好的方法,但是你的代码应该是这样的

a = 'Fri, 08 A`enter code here`pr 2016 14:51:02 +0000'

dates = re.search(r'(\w+), (\d+) (\w+) (\d{4}) (\d+):(\d+):(\d+) ([\w+]+)', a)
# YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ] format."]

day_str = dates.group(1)
day = dates.group(2)
month_str = dates.group(3)
year = dates.group(4)
hour = dates.group(5)
minute = dates.group(6)
second = dates.group(7)

new_date = "%s-%s-%s %s:%s:%s" % (year, month_str, day, hour, minute, second)
print(new_date)

>>> 2016-Apr-08 14:51:02

如果您再次遇到问题,那么尝试将Apr转换为日期编号可能会更好

相关问题 更多 >