隔离日期形式的字符串部分

网友

1楼 · 编辑于 2024-04-26 05:22:50

您可以使用正则表达式（在Python模块re-the documentation is here）来检索日期。对这个正则表达式的解释可以是found here

data = """
<div id="wkDrop">
    <div  name="weekstarts" id="2018_29">Week 29-16/07/2018</div>
    <div style="display:none" name="weekstarts" id="2018_30">Week 30-23/07/2018</div>
</div>"""

import re

for dates in re.findall(r'\d{2}/\d{2}/\d{4}', data):
    print(dates)

印刷品：

16/07/2018
23/07/2018

网友

2楼 · 编辑于 2024-04-26 05:22:50

我想说的是，首先应该研究使用BeautifulSoup删除div标记并提取数据。然后，您可以使用split("^(0?[1-9]|[12][0-9]|3[01])[\/\-](0?[1-9]|1[012])[\/\-]\d{4}$")

`要将字符串拆分为遵循正则表达式的字符串数组，请执行以下操作：

^(0?[1-9]|[12][0-9]|3[01])[\/\-](0?[1-9]|1[012])[\/\-]\d{4}$

以该格式提取日期（ref）

网友

3楼 · 编辑于 2024-04-26 05:22:50

^{}模块怎么样：

import re

str1 = '<div id="wkDrop"><div  name="weekstarts" id="2018_29">Week 29-16/07/2018</div><div style="display:none" name="weekstarts" id="2018_30">Week 30-23/07/2018</div></div>'

match=re.findall('(\d+/\d+/\d+)',str1)

输出：

['16/07/2018', '23/07/2018']

相关问题更多 >

编程相关推荐

热门问题

热门文章

隔离日期形式的字符串部分

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >