网页文本分类适当的分类算法LabelledLDA是最好的?

2024-06-17 15:31:37 发布

您现在位置:Python中文网/ 问答频道 /正文

基本上

我正在通过抓取商业网页来提取文本数据,并尝试将网站分类为业务类型&>>;Restaurants, IT, Travel etc.

我看过一个朴素的Bayes分类和LDA算法

我认为标记LDA是一个很好的方法,但我可能错了

有没有更好的选择适合这种类型的应用?在

如果可能的话,请指定最适合上述情况的开源库


Tags: 数据文本算法网页类型网站etc分类