<p>我有一个从Tumblr API读取并重新格式化“reblog链”格式的web应用程序。在</p>
<p>在Tumblr中,文章的注释存储为HTML块引号。当用户对上面的评论做出回应时,另一个层次被添加到blockquote链中,最终导致许多嵌套的重新登录链。在</p>
<hr/>
<p>下面是一个“重新登录链”在纯HTML中的外观示例:</p>
<pre><code><p><a class="tumblr_blog" href="http://chainsaw-police.tumblr.com/post/96158438802/example-tumblr-post">chainsaw-police</a>:</p><blockquote>
<p><a class="tumblr_blog" href="http://example-blog-domain.tumblr.com/post/96158384215/example-tumblr-post">example-blog-domain</a>:</p><blockquote>
<p>Here is an example of a Tumblr post.</p> <p>It can have multiple &lt;p&gt; elements sometimes. It may only have one, though, at other times.</p>
</blockquote>
<p>This is an example of a user “reblogging” a post. As you can see, the previous comment is stored above as a &lt;blockquote&gt;.</p>
</blockquote>
<p>This is another reblog. As you can see, all of the previous comments are stored as blockquotes, with earlier ones being residing deeper in the nest of blockquotes.</p>
</code></pre>
<hr/>
<p><a href="http://puu.sh/bdQvp/57ee7c44a8.png" rel="nofollow">And this is what it looks like when rendered.</a></p>
<hr/>
<p>我希望能够重新格式化reblog链,使其看起来更像:</p>
<p>示例:</strong>
下面是一个Tumblr帖子的例子。在</p>
<p>有时它可以有多个<;p>;元素。不过,其他时候可能只有一个。在</p>
<p><strong>电锯警察:</strong>
这是一个用户“重新记录”一篇文章的例子。如您所见,前面的注释作为<;blockquote>;存储在上面;。在</p>
<p><strong>示例博客域:</strong>
这是另一个重播。如您所见,前面所有的注释都存储为blockquote,而早期的注释则位于blockquote嵌套的更深位置。在</p>
<hr/>
<p>所以我想让它变得更易懂。在</p>
<p>有什么方法可以解释HTML并将重新记录分成单独的“注释”吗?例如,有一个包含用户名和注释的数组或dict就足够了。然而,在和lxml和beauthoulsoup混了几个月之后,我真是束手无策了。在</p>
<p>如果有一种方法可以用CSS来实现,我非常怀疑,那就好了。在</p>
<p>提前谢谢大家!在</p>