擅长:python、mysql、java
<p>萤火虫产生的xpath真的很差。它们又长又脆弱,因为它们的非特定性超出了等级体系。
今天的页面非常动态。你知道吗</p>
<p>在动态页面上使用xpath的最佳方法是将公共元素定位为钩子,并从作为路径根的元素执行xpath操作。
我这里所说的共同元素是指稳定的结构元素,它们很可能存在或保证存在。从包含层次结构的角度选择最接近目标的一个。较短的路径更快更清晰。你知道吗</p>
<p>从那里您需要创建路径来定位目标元素上的某些特定的唯一属性或属性值。
有时这是不可能的,所以另一个策略是以最接近的唯一可识别的容器元素为目标,然后在该容器下获取与您的元素相似的所有元素,并迭代它们以寻找您的目标。你知道吗</p>
<p>高度动态的页面需要复杂的动态方法。你知道吗</p>
<p>Facebook变化很大,需要经常维护脚本。你知道吗</p>