我对一个网页做了一个请求,我试图在上面检索一些文本。文本用span标记拆分,如下所示:
<span class="ed">This</span>
<span class="1">is</span>
<span class="12">jvgviehrgjfne</span>
<span class="dfe">my</span>
<span class="fd">gt4ugirdfgr</span>
<span class="df">string</span>
有一些“内联样式表”(CSS sheets),表示我们是否必须在屏幕上打印文本,因此,不能在屏幕上打印乱七八糟的文本。这是表1的示例:
.ed{display:inline}
.1{display:inline}
.12{display:none}
.dfe{display:inline}
.fd{display:none}
.df{display:inline}
但是像这样的CSS文件还有很多。。所以我不知道有没有更好的方法来实现我的目标(打印屏幕上显示的文本,不要使用没有显示的胡言乱语)
我的脚本可以打印文本。。但所有这些(胡言乱语)如下:“这是JVIEHRGJFNE我的gt4ugirdfgr脚本!”你知道吗
如果我没听错的话,您应该用regex解析css文件中与
inline
相关的属性,并将结果提供给beautiful soup api。这里有一个方法:相关问题 更多 >
编程相关推荐