使用python regex从RSS提要中删除某些元素

2024-04-19 19:31:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我的任务是用python创建一个程序,从新闻RSS feed的第一篇文章中提取数据并以不同的格式显示。当新文章发布到RSS提要上时,程序必须更新,因此不能硬编码。你知道吗

我在这里浏览了python regex的所有其他答案,它们都建议使用Beautiful Soup,不幸的是,除了pythons RE library之外,我不能使用任何东西。我遇到的问题是,正则表达式需要获取页面上第一篇文章的标题、日期、图片和第一句话,而忽略了其余内容。你知道吗

Source code of RSS


Tags: 数据答案程序re编码feed格式文章
0条回答
网友
1楼 · 发布于 2024-04-19 19:31:32

现在如何执行.py文件?这个问题需要一些工作和方法。就像问面包师,你怎么烤蛋糕?

我会创建一个名为.py的脚本,阅读器.py我会这样做:

C:\Python27\ python reader.py 

基本示例(阅读器.py):

import re 

names_file = open("file_getting_read.txt", encoding="utf-8")
data = names_file.read()
names_file.close()

相关问题 更多 >