计算include命令解析内容的算法

2024-06-16 12:32:08 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我们有一个满是文件的目录(我们称之为文件结构a,FSA),其中包含如下代码块:

<div class="Look out its a div" id="look-out">
    <ul>
        <li><a href="#{Include_Path}/" lang="en">#{Variable_Home}</a></li>
        <li><a href="#{Include_Book}/account.php">#{Variable_Account}</a></li>
        <li lang="en">#{Variable_BookName}</li>
    </ul>
</div>

所有这些#{}帮助程序都包含一些其他模板数据并将其插入到该模板中,而该模板本身可能包含在其他地方。编译过程发生在一个封闭的服务器上,因此我们无法确切了解它的工作方式

然而,编译后的文件随后被用于服务一个普通的网站,可以使用wget完全对其进行爬网

因此,使用wget我们有一个文件结构(文件结构B,FSB),它与FSA完全不同,但必须从中派生出来

假设上面的代码块理论上编译为如下内容:

<div class="Look out its a div" id="look-out">
    <ul>
        <li><a href="/include/path/" lang="en">Welcome Home!</a></li>
        <li><a href="/various/account.php">Hello Mr. Jenkins</a></li>
        <li lang="en">Book Book Book</li>
    </ul>
</div>

但是,在完全不同的FSB中,这个编译版本也“隐藏”在其他类似事物的巨大混乱中

我们如何收集各种#{}帮助程序的实际编译目的,以便我们可以编译原始文件,但保持它们在FSA中整洁地分解?

什么算法会被用来做这样的事情


Tags: 文件代码div模板langlioutul