删除客户端浏览器上不需要的内容

2024-05-08 01:55:19 发布

您现在位置:Python中文网/ 问答频道 /正文

This will be used for removing unwanted content within my automated selenium scripts!

我的问题是: 客户端是否可以使用JavaScript或其他技术删除不需要的HTML代码?你知道吗

示例场景:

  • Facebook timeline默认为屏幕上任何时候最多10篇帖子
  • 我加载facebook并生成10个帖子[2个帖子是由用户'John']
  • 我运行一个[JavaScript?]脚本,将抓取所有div的内容是由用户'约翰'和删除他们从我的浏览器发布
  • **两个新的职位自动生成-或不! (要求删除不需要的内容(类似于AdBlocker?)。。 如果站点生成了2个新帖子,那就更好了!)你知道吗

我不是在找人给我一个解决这个问题的代码,而是把我推向正确的方向(一个解决方案是一个奖励!)你知道吗

然后,我会更新这个问题(如果它的生活)与解决方案,我已经想出和清理后!你知道吗

注:据我所知,Facebook已经内置了一个“停止跟踪”按钮来解决这个问题。 如果内容中包含“你可能认识的人”然后我想从我的浏览器中删除这段HTML!你知道吗

更新: 由于没有代码,我添加了另一个示例场景!你知道吗

  • 我把这个问题写进了selenium
  • 我很有信心,这篇文章会被投赞成票而不是反对票!你知道吗

HTML当前包含:

 <div id="content">
     <p>
         <em>prepares for -10 within seconds<em>
     </p>
 </div>
  • 我运行一个[JavaScript?]当前浏览器中的脚本,用于在HTML中搜索“prepares for-10 within seconds”
  • 如果找到,我想删除父节及其所有内容

HTML则包含:

 <div id="content">
 </div>

Tags: 代码用户div示例内容forfacebookhtml
1条回答
网友
1楼 · 发布于 2024-05-08 01:55:19

BrowserMob Proxy这样的代理怎么样。。。他们的登陆页面上写着

It can capture performance data for web apps (via the HAR format), as well as manipulate browser behavior and traffic, such as whitelisting and blacklisting content, simulating network traffic and latency, and rewriting HTTP requests and responses.

您可以使用代理来筛选出要删除的元素。你知道吗

相关问题 更多 >