phpsimplehtmldom还是PythonBSoup:哪种方法更简单?

2024-05-15 09:34:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在研究一种方法来解析一个包含欧洲基金会数据的网站。在

http://www.foundationfinder.ch/它有790个基础的数据集。所有的数据都可以免费使用,没有版权限制。在

目标是什么:我希望解析数据并将其保存在本地:为了更好的检索和更方便的使用方法:也许可以将其存储到Calc/甚至更好的MySQL数据库中。在

问:用Perl解析HTML最简单的方法是什么 我应该使用LWP还是Mechanize:哪种方法更简单!?在

一些朋友让我试试Python!?靓汤。我想到了一种使用Perl-LWP或Python Beautiful Soup的方法。其他方法来解析这样一个我看不到的网站。好吧,有一种方法-使用PHP。当然,我们可以使用PHP(和Curl)

哪种方法是最好的。Perl与LWP或Mechanize?还是Python那个。。。?在

除了语言的问题:谁能在第一步帮助我吗?帮助我进入正轨!?我期待着你的来信

问候 零


Tags: 数据方法http目标网站www版权ch
3条回答

All the data are free to use - with no limitations copyrights on it.

我不太确定。他们不遗余力地混淆联系人数据,这样“数据就不能存储在表中以生成邮件列表”。基础上的细节不是HTML,而是图像。此外,他们还将搜索结果限制为最多100个。如果你懂德语,你应该阅读Informationen中的“Daten Schutz”(数据保护)部分。在

如果你只想把基金会的名称与网站允许你使用的搜索条件链接起来,那就去看看其他网站的答案。如果你真的想存储详细的信息,那么你将违反网站的意图,并将需要咨询律师,他们的声明是否具有法律价值。此外,还需要OCR将图像还原为可用数据。在

我的两分钱是你必须根据你最懂的语言来选择。如果我是的话,我会使用Python,它有很多库和工具,大概需要几个小时的工作。在

但是,如果你必须选择Perl或PHP语言中的一种。大多数脚本语言都有库来完成这项任务。在

你擅长哪方面?PHP还是Python?当然,当涉及到这类事情时,肯定会有更多的比较讨论,但我们不要谈这个。去选一个你更了解的。可以说Perl,甚至Python,或者PHP,但是它们都有自己的优势。最后,你将是一个编码它,所以去与一个你更了解。在

相关问题 更多 >